文集文档索引

Awesome-ML-SYS-Tutorial


  • 文集信息
  • 目录大纲
  • 最新文档
  • 知识宇宙

文集详情

文集导读

Awesome-ML-SYS-Tutorial English README | 简体中文 My learning notes for ML SYS. 断断续续写这个系列的博客一年多了,这个博客也几乎快要写成 RL Infra Learning Note 了 经常看到有朋友讨论 ML SYS 或者 AI Infra 值不值得入行,以及如何开始。每个人的选择各有不同,对我而言,我只是想追求算法上的真理: 非常多的 paper 得出的 RL 结论,都是建立在开源社区可能漏洞极其多的 RL infra 上。我自己参加 RL infra 开发一年多,见到众多社区的大佬都殚精竭虑辛勤付出,但是事实上无论是开源还是各大公司内部,RL infra 仍旧有着非常多问题,基于这些有问题的基建得到的上层结论是否正确,这事非常值得反馈的。我在今年 ICLR review 的时候,就经常问我分到的 paper,“如果你们采用的框架本身实现就有问题,你们的结论还能成立么?”尽管我从没为了这个理由扣他人的分,但是没有一个人能给出解决我心头疑惑的答案。 因此,我认识的一些大佬会乐于参加 infra 的开发,甚至绝大多数时间都在做基建上,为了严格确定自己接下来要做的算法具有正确的基础。我非常佩服他们,我也认同这样的严谨性,他们是我的榜样。

Awesome-ML-SYS-Tutorial

English README | 简体中文

My learning notes for ML SYS.

断断续续写这个系列的博客一年多了,这个博客也几乎快要写成 RL Infra Learning Note 了

经常看到有朋友讨论 ML SYS 或者 AI Infra 值不值得入行,以及如何开始。每个人的选择各有不同,对我而言,我只是想追求算法上的真理

非常多的 paper 得出的 RL 结论,都是建立在开源社区可能漏洞极其多的 RL infra 上。我自己参加 RL infra 开发一年多,见到众多社区的大佬都殚精竭虑辛勤付出,但是事实上无论是开源还是各大公司内部,RL infra 仍旧有着非常多问题,基于这些有问题的基建得到的上层结论是否正确,这事非常值得反馈的。我在今年 ICLR review 的时候,就经常问我分到的 paper,“如果你们采用的框架本身实现就有问题,你们的结论还能成立么?”尽管我从没为了这个理由扣他人的分,但是没有一个人能给出解决我心头疑惑的答案。

因此,我认识的一些大佬会乐于参加 infra 的开发,甚至绝大多数时间都在做基建上,为了严格确定自己接下来要做的算法具有正确的基础。我非常佩服他们,我也认同这样的严谨性,他们是我的榜样。我们 SGLang RL 社区也是如此,这么多人力,这么多时间,我们都希望提供尽可能正确且简洁的 RL 基础,无论是公司训练模型,还是研究者展开新的算法,希望能真正服务到社区每个人。感谢大家的认可,也期待感兴趣的朋友联系我,加入我们!

兜兜转转一年,这就是目前让我坚持继续做 Infra 的决心,为了做出正确的基础建设,为社区得到正确的结论做出自己的贡献

言归正传,这一系列播客是我从 2024 年 8 月,在科研的契机下使用了 SGLang 后,逐渐开始学习 ML SYS 的笔记。大体上是我本人所写,内容主要是 RL infra,在线/离线推理系统,以及一些 AI Infra 的基本功。一年来,从最开始两三篇文章,三五十个 Github Star,到现在 Star 超过 4.5K,而我也成了技术圈小网红,真是承蒙厚爱,不甚荣幸。

感谢我的导师顾全全教授、盛颖博士和郑怜悯博士,他们在我对 AI Infra 的学习、职业选择与人生道路上中给予了我极大的帮助和指导。尽管由于个人原因,我已经不在 UCLA 继续攻读博士学位了,本科毕业后的这段旅程仍旧是无比宝贵的经历。目前我已经全职加入了 RadixArk 公司,继续做 RL Infra 相关的研究,我们会持续通过我的博客,在非官方渠道分享 AI Infra 相关的技术和思考。也希望大家联系我们,加入 SGLang 开源社区,一同打造改变世界,值得一生引以为傲的开源 AI Infra!

RLHF System 开发笔记

slime 框架

AReal 框架

verl 框架

OpenRLHF 框架

系统设计与优化

算法与理论

SGLang 学习笔记

SGLang Diffusion 学习笔记

核心架构与优化

使用与实践

Scheduling and Routing

ML System 基本功

Transformers & Model Architecture

CUDA & GPU

Distributed Training & Communication

Quantization

开发指南

目录大纲

    最新文档

    知识宇宙

    正在加载知识图谱...


    转发