bge-奇异果体育app竞彩官网下载
更新时间:2023-11-17
bge-large-zh是由智源研究院研发的中文版文本表示模型,可将任意文本映射为低维稠密向量,以用于检索、分类、聚类或语义匹配等任务,并可支持为大模型调用外部知识。本文介绍了相关api,本接口不限制商用。
embeddings
根据输入内容生成对应的向量表示。
请求说明
基本信息
请求地址: https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/embeddings/bge_large_zh
请求方式: post
header参数
名称 | 值 |
---|---|
content-type | application/json |
query参数
名称 | 类型 | 必填 | 描述 |
---|---|---|---|
access_token | string | 是 | 通过api key和secret key获取的access_token,参考 |
body参数
名称 | 类型 | 必填 | 描述 |
---|---|---|---|
input | list(string) | 是 | 输入文本以获取embeddings。说明: (1)文本数量不超过16 (2)每个文本长度不超过 512个token (3)输入文本不能为空,如果为空会报错 |
user_id | string | 否 | 表示最终用户的唯一标识符,可以监视和检测滥用行为,防止接口恶意调用 |
响应说明
名称 | 类型 | 描述 |
---|---|---|
id | string | 本轮对话的id |
object | string | 回包类型,固定值“embedding_list” |
created | int | 时间戳 |
data | list(embedding_data) | embedding信息,data成员数和文本数量保持一致 |
usage | usage | token统计信息,token数 = 汉字数 单词数*1.3 (仅为估算逻辑) |
embedding_data说明
名称 | 类型 | 描述 |
---|---|---|
object | string | 固定值"embedding" |
embedding | list(float64) | embedding 内容 |
index | int | 序号 |
usage说明
名称 | 类型 | 描述 |
---|---|---|
prompt_tokens | int | 问题tokens数(包含历史qa) |
total_tokens | int | tokens总数 |
示例
请求示例
# 步骤一,获取access_token,替换下列示例中的api key与secret key
curl 'https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=[api key]&client_secret=[secret key]'
# 步骤二,调用本文api,使用步骤一获取的access_token,替换下列示例中的”调用接口获取的access_token“
curl -x post https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/embeddings/bge_large_zh?access_token=[步骤一调用接口获取的access_token] -d '{
"input": ["推荐一些美食","给我讲个故事"]
}'
import requests
import json
def get_access_token():
"""
使用 api key,secret key 获取access_token,替换下列示例中的应用api key、应用secret key
"""
url = "https://aip.baidubce.com/oauth/2.0/token?grant_type=client_credentials&client_id=[应用api key]&client_secret=[应用secret key]"
payload = json.dumps("")
headers = {
'content-type': 'application/json',
'accept': 'application/json'
}
def main():
url = "https://aip.baidubce.com/rpc/2.0/ai_custom/v1/wenxinworkshop/embeddings/bge_large_zh?access_token=" get_access_token()
payload = json.dumps({
"input": ["推荐一些美食","给我讲个故事"]
})
headers = {
'content-type': 'application/json'
}
response = requests.request("post", url, headers=headers, data=payload)
print(response.text)
if __name__ == '__main__':
main()
响应示例
http/1.1 200 ok
date: thu, 23 mar 2023 03:12:03 gmt
content-type: application/json;charset=utf-8
statement: ai-generated
{
"id": "as-gjs275mj6s",
"object": "embedding_list",
"created": 1687155816,
"data": [
{
"object": "embedding",
"embedding": [
0.018314670771360397,
0.00942440889775753,
...(共1024个float64)
-0.36294862627983093
],
"index": 0
},
{
"object": "embedding",
"embedding": [
0.12250778824090958,
0.07934671640396118,
...(共1024个float64)
0
],
"index": 1
}
],
"usage": {
"prompt_tokens": 12,
"total_tokens": 12
}
}
错误码
如果请求错误,服务器返回的json文本包含以下参数。
名称 | 描述 |
---|---|
error_code | 错误码 |
error_msg | 错误描述信息,帮助理解和解决发生的错误 |
例如access token失效返回以下内容,需要重新获取新的access token再次请求。
{
"error_code": 110,
"error_msg": "access token invalid or no longer valid"
}
千帆大模型平台相关错误码,请查看。