wylon
POST https://api.wylon.cn/v1/rerank

重排

给定查询与一组候选文档,由重排模型重新打分并按相关度排序。常用于 RAG 检索的二阶段精排,提升召回质量。

授权

Authorizationstring · header必填
Bearer 令牌。

请求体

modelstring必填
重排模型 ID,例如 BAAI/bge-reranker-v2-m3
querystring必填
查询文本。
documentsstring[]必填
待重排的候选文档列表,建议单次不超过 1000 条。
top_ninteger可选
仅返回前 N 条结果;未设置时返回全部并按分数降序排列。
return_documentsbooleanfalse
true 时在每条结果中包含原始文档文本,便于直接消费。

响应

modelstring
实际服务该请求的重排模型 ID。
resultsarray
按相关度降序排列的结果列表。
indexinteger
该文档在原 documents 数组中的下标。
relevance_scorenumber
相关度分数,区间 [0, 1],值越大越相关。
documentstring可选
仅当 return_documents=true 时返回原始文本。
usageobject
本次请求的 Token 用量。
示例响应
{
  "model": "BAAI/bge-reranker-v2-m3",
  "results": [
    { "index": 2, "relevance_score": 0.94 },
    { "index": 0, "relevance_score": 0.78 },
    { "index": 1, "relevance_score": 0.32 }
  ],
  "usage": { "total_tokens": 156 }
}
示例 — 400
{
  "error": {
    "type": "invalid_request_error",
    "message": "`documents` must contain at least 1 item."
  }
}
沪ICP备2026010432号-1 沪公网安备31010402336632号