返回资源中心

基于 LPU(语言处理单元)架构的极速推理服务,提供亚秒级的 LLM 响应速度,支持 Llama 3、Mixtral 等主流开源模型。

正在加载资源详情...