POST
https://api.wylon.cn/v1/rerank
重排
给定查询与一组候选文档,由重排模型重新打分并按相关度排序。常用于 RAG 检索的二阶段精排,提升召回质量。
授权
Authorizationstring · header必填
Bearer 令牌。
请求体
modelstring必填
重排模型 ID,例如
BAAI/bge-reranker-v2-m3。querystring必填
查询文本。
documentsstring[]必填
待重排的候选文档列表,建议单次不超过 1000 条。
top_ninteger可选
仅返回前 N 条结果;未设置时返回全部并按分数降序排列。
return_documentsbooleanfalse
为
true 时在每条结果中包含原始文档文本,便于直接消费。响应
modelstring
实际服务该请求的重排模型 ID。
resultsarray
按相关度降序排列的结果列表。
indexinteger
该文档在原
documents 数组中的下标。relevance_scorenumber
相关度分数,区间
[0, 1],值越大越相关。documentstring可选
仅当
return_documents=true 时返回原始文本。usageobject
本次请求的 Token 用量。
示例响应
{
"model": "BAAI/bge-reranker-v2-m3",
"results": [
{ "index": 2, "relevance_score": 0.94 },
{ "index": 0, "relevance_score": 0.78 },
{ "index": 1, "relevance_score": 0.32 }
],
"usage": { "total_tokens": 156 }
}
示例 — 400
{
"error": {
"type": "invalid_request_error",
"message": "`documents` must contain at least 1 item."
}
}