返回资源中心

Groq LPU Inference Platform

优秀网站
云服务
0 次浏览
0 个赞
CloudInferenceSpeed

资源描述

专为 LLM 推理设计的 LPU 硬件架构,提供极高的 Token 生成速度,大幅降低 Llama 3 和 Mixtral 等模型的响应延迟。

详细内容

https://groq.com