返回资源中心

Groq Cloud Inference

工具软件
机器学习
0 次浏览
0 个赞
AI推理硬件加速Llama3

资源描述

极速大模型推理平台,基于独特的 LPU 架构,提供 Llama 3 和 Mixtral 等模型每秒数百 Token 的推理速度。

详细内容

The LPU Inference Engine for ultra-fast large language model inference.