LLMForEverybody
本文集文档发布于灏天文库
+
-
重置
首页
首页
>
LLMForEverybody
>
02-第二章-部署与推理
02-第二章-部署与推理
阅读进度:
0%
本文目录
文档摘要
02-�ڶ���-����������
发布者:
作者:
转发
大模型的latency(延迟)和throughput(吞吐量)有什么区别
如何评判大模型的输出速度?首Token延迟和其余Token延迟有什么不同?
评论区
(0)
按时间排序
按点赞排序
按回复排序
U
正在回复
×
最近
表情
自然
物品