计费与用量
wylon 新云 Token 工厂采用按 Token 计量的按用量付费模式,另可选择预付余额或针对大型团队的开票合约。本页介绍用量如何计量、费用如何累计,以及如何通过预算与告警控制支出。GPU 服务(即将上线)单独按专属方案报价,不在本页覆盖范围内,详情请联系销售。
定价模型
每次推理请求从两个维度计费:
- 输入 Token — 你发送的全部内容:提示词、系统消息、工具定义、历史对话。
- 输出 Token — 模型生成的全部内容,包括工具调用参数与推理 Token。
价格按每百万 Token 计算,各模型不同。批量推理 任务在标准价基础上享受批量折扣。 当前价格以 价格页 公示为准。
usage 字段返回的 Token 数为最终计费依据 — 按此扣费。
当前缀缓存命中时,被缓存的输入 Token 以折扣价计费,显示为 cached_input_tokens。
预付余额
大多数团队通过信用卡充值预付余额为组织充值。每次请求实时扣减余额。
当余额归零时,新的 API 调用会返回 402 Insufficient balance,直到再次充值。
| 操作 | 位置 | 说明 |
|---|---|---|
| 充值 | 控制台 → 计费 → 充值 | 每笔最低 ¥50,最高 ¥50,000。 |
| 自动充值 | 控制台 → 计费 → 自动充值 | 设置触发余额与充值金额。 |
| 支付方式 | 控制台 → 计费 → 支付方式 | 支付宝、微信支付、对公转账,企业用户支持发票后付款。 |
月度开票
月消费超过 ¥10,000 的团队可申请切换为月后付款开票模式。每月第一个工作日为上月用量开具增值税电子发票, 30 天内通过对公转账完成支付。如需启用请通过 联系我们 提交申请。
用量控制台
控制台 → 用量 按模型、项目、API 密钥和日期拆解消费。 任一视图均可导出为 CSV,用于内部分摊或 BI 流水线。
# 通过程序查询用量
curl https://api.wylon.cn/v1/usage?start=2026-04-01&end=2026-04-22 \
-H "Authorization: Bearer $WYLON_ADMIN_KEY"
import os, requests
r = requests.get(
"https://api.wylon.cn/v1/usage",
headers={"Authorization": f"Bearer {os.environ['WYLON_ADMIN_KEY']}"},
params={"start": "2026-04-01", "end": "2026-04-22", "group_by": "model"},
)
for row in r.json()["data"]:
print(row["model"], row["input_tokens"], row["output_tokens"], row["cost_cny"])
预算与消费上限
在组织级或项目级设置硬性月度上限。达到上限后,后续请求将返回
429 Budget exceeded,直至下一计费周期或管理员提高上限。
- 软告警 — 用量达到预算 50 %、80 %、100 % 时通过邮件 + Webhook 通知。
- 硬上限 — 达到 100 % 即阻止后续 API 调用。默认关闭,按项目开关。
- 单密钥限额 — 为单个 API 密钥设置日度消费上限,适用于面向不受信任客户端的场景。
发票与收据
每笔扣款都会生成可在 控制台 → 计费 → 历史记录 下载的 PDF 收据。 如需合规发票(增值税、中国发票等),请先在 计费 → 税务信息 下录入公司信息。
试用额度
新组织完成实名认证后获赠免费额度,有效期 60 天。额度优先于付费余额消耗,且不可退款。 科研与开源项目可通过 联系我们 申请额外扩展。
退款
预付余额在充值后 30 天内若未使用可退款。已消费的 Token 不可退款, 但若平台事件已在状态页确认,我们将按受影响量发放相应的服务额度补偿。
常见问题
- 失败请求是否计费?否 — 4xx 与 5xx 响应不收费。超时的流式请求按实际产生的 Token 计费。
- 批量任务的计费有什么不同?批量任务依然按 Token 计费,但相对实时调用享受批量折扣,详见 批量推理。
- 能否开采购订单(PO)?开票合约支持 — 请联系销售。