返回资源中心

Groq Cloud Inference

优秀网站
云服务
1 次浏览
0 个赞
InferenceLLMSpeed

资源描述

提供极速的 LLM 推理服务,基于 LPU 架构实现每秒数百个 Token 的生成速度,支持 Llama 3 等开源模型。

详细内容

Groq Cloud provides fast inference for open-source LLMs.