返回资源中心

Groq LPU Inference Engine

优秀网站
云服务
0 次浏览
0 个赞
InferenceSpeedHardware

资源描述

目前全球最快的大模型推理加速平台,基于 LPU 架构,能够以每秒数百个 Token 的速度运行 Llama 3 和 Mixtral。

详细内容

Groq is the world fastest inference engine for LLMs.