API 手册
wylon 新云 Token 工厂提供与 OpenAI 协议完全兼容的推理 API,所有端点共享统一的鉴权与基址。 本节按端点分组,给出请求参数、响应结构与多语言代码示例。
基础信息
Base URLstring
https://api.wylon.cn/v1鉴权HTTP Bearer
Content-Typestring
JSON 请求统一使用
application/json;文件上传使用 multipart/form-data;流式响应为 text/event-stream。兼容性协议
所有路径与字段均与 OpenAI 协议保持一致,可直接通过官方 SDK(Python/Node 的
openai 包)或任何 OpenAI 兼容客户端调用,仅需替换 base_url 与 api_key。端点一览
下表列出 wylon 当前开放的全部文本类 API 端点。
| 分组 | 方法 & 路径 | 用途 |
|---|---|---|
| 对话与补全 | POST/chat/completions |
对话式生成(流式 / 工具 / 结构化) |
| 向量 | POST/embeddings |
文本向量化 |
| 重排 | POST/rerank |
对候选文档按查询相关度重排序 |
| 模型 | GET/models |
列出当前账户可用的模型 |
| 批量 (暂未提供服务) |
POST/batches |
创建批量任务 |
GET/batches/{id} |
查询批量任务状态 | |
POST/batches/{id}/cancel |
取消批量任务 |
错误体格式
所有错误响应使用 OpenAI 兼容的统一信封:
错误响应
{
"error": {
"type": "invalid_request_error",
"message": "…",
"code": "invalid_api_key"
}
}
常见 HTTP 状态:400 参数错误 / 401 鉴权失败 / 403 权限不足 /
429 触发 速率限制 /
500、503 服务端瞬时故障。详见各端点页"响应"部分。