wylon
POST https://api.wylon.cn/v1/embeddings

嵌入

将文本转换为定长向量表示,用于语义检索、相似度计算、聚类、RAG 等下游任务。

授权

Authorizationstring · header必填
Bearer 令牌。在 控制台 创建。

请求体

modelstring必填
嵌入模型 ID,例如 BAAI/bge-large-zhQwen/Qwen3-Embedding。完整列表见 模型目录
inputstring · string[]必填
待向量化的文本。可传入单条字符串或字符串数组(一次最多 64 条)。每条文本不得超过模型上下文长度。
encoding_formatenum"float"
返回格式:"float" 返回 JSON 浮点数组;"base64" 返回 Base64 编码的紧凑字节串,便于减少传输体积。
userstring可选
终端用户标识,用于滥用监控。

响应

objectstring
固定为 list
modelstring
实际服务该请求的嵌入模型 ID。
dataarray
每条输入对应一项;顺序与 input 一致。
objectstring
固定为 embedding
indexinteger
该条在输入数组中的下标。
embeddingnumber[] · string
向量本体;encoding_format=base64 时为 Base64 字符串,需自行解码为 float 数组。
usageobject
仅包含 prompt_tokenstotal_tokens(嵌入接口无生成 Token)。
示例响应
{
  "object": "list",
  "model": "BAAI/bge-large-zh",
  "data": [
    {
      "object": "embedding",
      "index": 0,
      "embedding": [-0.012, 0.034, 0.281, "…"]
    }
  ],
  "usage": { "prompt_tokens": 12, "total_tokens": 12 }
}

参数错误、鉴权失败或触发 速率限制

示例 — 400 输入超长
{
  "error": {
    "type": "invalid_request_error",
    "message": "Input text exceeds model context length (max 8192 tokens)."
  }
}
沪ICP备2026010432号-1 沪公网安备31010402336632号