1.1.2 性能目标：跨平台的高性能推理与训练加速

文档摘要

1.1.2 性能目标：跨平台的高性能推理与训练加速我们常被问起一个问题：当模型参数规模突破百亿、千亿，当推理延迟要求压进毫秒级，当训练吞吐要在CPU、GPU、NPU、甚至边缘端ARM Cortex-A78上保持一致的高效——性能，究竟该向谁要？不是向硬件要，硬件是底座，不是解法；不是向框架要，框架是胶水，不是引擎；而是向计算图的每一处张量调度、每一次内存访存、每一行内核发射、每一个跨平台抽象层的语义保真度里去抠、去调、去重写。会员。《1.1.2 性能目标：跨平台的高性能推理与训练加速》收录于灏天文库文集《ONNX运行时架构》，提供技术教程、实践指南与问题解决方案，支持在线阅读、全文检索与知识沉淀，助力开发者系统化学习。文档编号50986。

该文档为会员专享，请先登录或注册后再查看

登录注册