POST
https://api.wylon.cn/v1/embeddings
嵌入
将文本转换为定长向量表示,用于语义检索、相似度计算、聚类、RAG 等下游任务。
授权
Authorizationstring · header必填
Bearer 令牌。在 控制台 创建。
请求体
modelstring必填
inputstring · string[]必填
待向量化的文本。可传入单条字符串或字符串数组(一次最多 64 条)。每条文本不得超过模型上下文长度。
encoding_formatenum"float"
返回格式:
"float" 返回 JSON 浮点数组;"base64" 返回 Base64 编码的紧凑字节串,便于减少传输体积。userstring可选
终端用户标识,用于滥用监控。
响应
objectstring
固定为
list。modelstring
实际服务该请求的嵌入模型 ID。
dataarray
每条输入对应一项;顺序与
input 一致。objectstring
固定为
embedding。indexinteger
该条在输入数组中的下标。
embeddingnumber[] · string
向量本体;
encoding_format=base64 时为 Base64 字符串,需自行解码为 float 数组。usageobject
仅包含
prompt_tokens 与 total_tokens(嵌入接口无生成 Token)。示例响应
{
"object": "list",
"model": "BAAI/bge-large-zh",
"data": [
{
"object": "embedding",
"index": 0,
"embedding": [-0.012, 0.034, 0.281, "…"]
}
],
"usage": { "prompt_tokens": 12, "total_tokens": 12 }
}
参数错误、鉴权失败或触发 速率限制。
示例 — 400 输入超长
{
"error": {
"type": "invalid_request_error",
"message": "Input text exceeds model context length (max 8192 tokens)."
}
}