GPU 服务(即将上线)
国产算力GPU服务
原生基于国产 GPU 算力服务,支持三种形态:GPU 实例、裸金属、集群。
GPU 工厂尚未对外开放服务。欢迎联系销售沟通业务场景,申请优先使用资格。
典型场景
资源独享,完全掌控
01
部署自有模型和轻应用
针对特殊的模型部署要求,提供灵活的GPU运行环境。
02
算力弹性扩缩容
针对任务型的GPU使用场景,提供弹性的调度机制。
03
多样化的运行环境
需要同时运行多种不同推理场景(Agent / RAG / 多模态)的混合环境。
04
快速原型验证
短周期实验性负载,按需开通,弹性计费
三种形态
一套底座,按需选择
实例级
GPU Instance
按需的单卡或多卡 GPU 实例容器,分钟级交付,按小时计费。
裸金属
Bare-Metal
整机独占的 GPU 服务器,提供完整的硬件控制权与资源隔离。
集群级
Cluster
基于多节点组网的大规模算力池,面向大规模推理场景。
立即开始
联系我们,获得一个可行方案。
告诉我们你的场景和需求,我们会尽快回复