wylon

计费与用量

wylon 新云 Token 工厂采用按 Token 计量的按用量付费模式,另可选择预付余额或针对大型团队的开票合约。本页介绍用量如何计量、费用如何累计,以及如何通过预算与告警控制支出。GPU 服务(即将上线)单独按专属方案报价,不在本页覆盖范围内,详情请联系销售。

定价模型

每次推理请求从两个维度计费:

价格按每百万 Token 计算,各模型不同。批量推理 任务在标准价基础上享受批量折扣。 当前价格以 价格页 公示为准。

calculate
每次响应 usage 字段返回的 Token 数为最终计费依据 — 按此扣费。 当前缀缓存命中时,被缓存的输入 Token 以折扣价计费,显示为 cached_input_tokens

预付余额

大多数团队通过信用卡充值预付余额为组织充值。每次请求实时扣减余额。 当余额归零时,新的 API 调用会返回 402 Insufficient balance,直到再次充值。

操作位置说明
充值控制台 → 计费 → 充值每笔最低 ¥50,最高 ¥50,000。
自动充值控制台 → 计费 → 自动充值设置触发余额与充值金额。
支付方式控制台 → 计费 → 支付方式支付宝、微信支付、对公转账,企业用户支持发票后付款。

月度开票

月消费超过 ¥10,000 的团队可申请切换为月后付款开票模式。每月第一个工作日为上月用量开具增值税电子发票, 30 天内通过对公转账完成支付。如需启用请通过 联系我们 提交申请。

用量控制台

控制台 → 用量 按模型、项目、API 密钥和日期拆解消费。 任一视图均可导出为 CSV,用于内部分摊或 BI 流水线。

# 通过程序查询用量
curl https://api.wylon.cn/v1/usage?start=2026-04-01&end=2026-04-22 \
  -H "Authorization: Bearer $WYLON_ADMIN_KEY"
import os, requests

r = requests.get(
    "https://api.wylon.cn/v1/usage",
    headers={"Authorization": f"Bearer {os.environ['WYLON_ADMIN_KEY']}"},
    params={"start": "2026-04-01", "end": "2026-04-22", "group_by": "model"},
)
for row in r.json()["data"]:
    print(row["model"], row["input_tokens"], row["output_tokens"], row["cost_cny"])

预算与消费上限

在组织级或项目级设置硬性月度上限。达到上限后,后续请求将返回 429 Budget exceeded,直至下一计费周期或管理员提高上限。

warning
预算的执行存在短时延迟(最多 60 秒)。对严格合规场景,建议将预算与短生命周期的轮换密钥、 严格的单密钥速率限制结合使用。

发票与收据

每笔扣款都会生成可在 控制台 → 计费 → 历史记录 下载的 PDF 收据。 如需合规发票(增值税、中国发票等),请先在 计费 → 税务信息 下录入公司信息。

试用额度

新组织完成实名认证后获赠免费额度,有效期 60 天。额度优先于付费余额消耗,且不可退款。 科研与开源项目可通过 联系我们 申请额外扩展。

退款

预付余额在充值后 30 天内若未使用可退款。已消费的 Token 不可退款, 但若平台事件已在状态页确认,我们将按受影响量发放相应的服务额度补偿。

常见问题

沪ICP备2026010432号-1 沪公网安备31010402336632号