返回资源中心

Groq Fast Inference Engine

优秀网站
机器学习
0 次浏览
0 个赞
InferenceLPUFast

资源描述

基于 LPU 架构的极速 LLM 推理平台,能够实现每秒数百个 Token 的超低延迟输出。

详细内容

Groq provides the fastest AI inference for real-time AI applications.