GPU 服务(即将上线)

国产算力GPU服务

原生基于国产 GPU 算力服务,支持三种形态:GPU 实例、裸金属、集群。

GPU 工厂尚未对外开放服务。欢迎联系销售沟通业务场景,申请优先使用资格。

典型场景

资源独享,完全掌控

01

部署自有模型和轻应用

针对特殊的模型部署要求,提供灵活的GPU运行环境。

02

算力弹性扩缩容

针对任务型的GPU使用场景,提供弹性的调度机制。

03

多样化的运行环境

需要同时运行多种不同推理场景(Agent / RAG / 多模态)的混合环境。

04

快速原型验证

短周期实验性负载,按需开通,弹性计费

三种形态

一套底座,按需选择

实例级

GPU Instance

按需的单卡或多卡 GPU 实例容器,分钟级交付,按小时计费。

裸金属

Bare-Metal

整机独占的 GPU 服务器,提供完整的硬件控制权与资源隔离。

集群级

Cluster

基于多节点组网的大规模算力池,面向大规模推理场景。

立即开始

联系我们,获得一个可行方案。

告诉我们你的场景和需求,我们会尽快回复