Giter Club home page Giter Club logo

aisystem's Introduction

AI System & AI Infra

文字课程内容正在一节节补充更新,尽可能抽空继续更新正在 AISys ,希望您多多鼓励和参与进来!!!

文字课程开源在 AISys,系列视频托管B 站油管,PPT 开源在github,欢迎取用!!!

课程背景

这个开源课程英文名字叫做 Deep Learning System 或者 AI System(AISys),中文名字叫做 深度学习系统 或者 AI 系统

本开源课程主要是跟大家一起探讨和学习人工智能、深度学习的系统设计,而整个系统是围绕着 ZOMI 在工作当中所积累、梳理、构建 AI 系统全栈的内容。希望跟所有关注 AI 开源课程的好朋友一起探讨研究,共同促进学习讨论。

AI 系统全栈

课程内容大纲

课程主要包括以下六大模块:

第一部分,AI 基础知识和 AI 系统的全栈概述的AI 系统概述,以及深度学习系统的系统性设计和方法论,主要是整体了解 AI 训练和推理全栈的体系结构内容。

第二部分,硬核篇介绍AI 硬件体系架构,这里就很硬核了,从芯片基础到 AI 芯片的范围都会涉及,芯片设计需要考虑上面 AI 框架的前端、后端编译,而不是停留在天天喊着吊打英伟达,被现实打趴。

第三部分,进阶篇介绍AI 编程与计算架构,将站在系统设计的角度,思考在设计现代机器学习系统中需要考虑的编译器问题,特别是中间表达乃至后端优化。

第四部分,实际应用推理系统与引擎,讲了太多原理身体太虚容易消化不良,还是得回归到业务本质,让行业、企业能够真正应用起来,而推理系统涉及一些核心算法和注意的事情也分享下。

第五部分,介绍AI 框架核心技术,首先介绍任何一个 AI 框架都离不开的自动微分,通过自动微分功能后就会产生表示神经网络的图和算子,然后介绍 AI 框架前端的优化,还有最近很火的大模型分布式训练在 AI 框架中的关键技术。

第六部分,汇总篇介绍大模型与 AI 系统,大模型是基于 AI 集群的全栈软硬件性能优化,通过最小的每一块 AI 芯片组成的 AI 集群,编译器使能到上层的 AI 框架,训练过程需要分布式并行、集群通信等算法支持,而且在大模型领域最近持续演进如智能体等新技术。

课程设立目的

本课程主要为本科生高年级、硕博研究生、AI 系统从业者设计,帮助大家:

  1. 完整了解 AI 的计算机系统架构,并通过实际问题和案例,来了解 AI 完整生命周期下的系统设计。

  2. 介绍前沿系统架构和 AI 相结合的研究工作,了解主流框架、平台和工具来了解 AI 系统。

先修课程: C++/Python,计算机体系结构,人工智能基础

课程部分

编号 名称 具体内容
1 AI 系统 算法、框架、体系结构的结合,形成 AI 系统
编号 名称 具体内容
1 AI 计算体系 神经网络等 AI 技术的计算模式和计算体系架构
2 AI 芯片基础 CPU、GPU、NPU 等芯片体系架构基础原理
3 图形处理器 GPU GPU 的基本原理,英伟达 GPU 的架构发展
4 英伟达 GPU 详解 英伟达 GPU 的 Tensor Core、NVLink 深度剖析
5 国外 AI 处理器 谷歌、特斯拉等专用 AI 处理器核心原理
6 国内 AI 处理器 寒武纪、燧原科技等专用 AI 处理器核心原理
7 AI 芯片黄金 10 年 对 AI 芯片的编程模式和发展进行总结
编号 名称 具体内容
1 传统编译器 传统编译器 GCC 与 LLVM,LLVM 详细架构
2 AI 编译器 AI 编译器发展与架构定义,未来挑战与思考
3 前端优化 AI 编译器的前端优化(算子融合、内存优化等)
4 后端优化 AI 编译器的后端优化(Kernel 优化、AutoTuning)
5 多面体 待更 ing...
6 PyTorch2.0 PyTorch2.0 最重要的新特性:编译技术栈
编号 名称 具体内容
1 推理系统 推理系统整体介绍,推理引擎架构梳理
2 轻量网络 轻量化主干网络,MobileNet 等 SOTA 模型介绍
3 模型压缩 模型压缩 4 件套,量化、蒸馏、剪枝和二值化
4 转换&优化 AI 框架训练后模型进行转换,并对计算图优化
5 Kernel 优化 Kernel 层、算子层优化,对算子、内存、调度优化
编号 名称 具体内容
1 AI 框架基础 AI 框架的作用、发展、编程范式
2 自动微分 自动微分的实现方式和原理
3 计算图 计算图的概念,图优化、图执行、控制流表达
编号 名称 具体内容
1 大模型全流程 大模型整体架构和大模型全流程介绍
2 AI 集群简介 AI 集群服务器整体组成相关技术初体验
3 AI 集群存储 数据存储在 AI 集群中,具体的存储优化方案
4 AI 集群通信 更新中
5 数据处理 更新中
6 大模型算法 更新中
7 大模型训练 更新中
8 分布式并行 更新中
9 大模型微调 更新中
10 大模型验证 更新中
11 大模型推理 更新中
12 AI Agent AI Agent 智能体,通过大模型走向 GAI

知识清单

知识清单

备注

这个仓已经到达疯狂的 10G 啦(ZOMI 把所有制作过程、高清图片都原封不动提供),如果你要 git clone 会非常的慢,因此建议优先到 Releases · chenzomi12/AISystem 来下载你需要的内容

非常希望您也参与到这个开源课程中,B 站给 ZOMI 留言哦!

欢迎大家使用的过程中发现 bug 或者勘误直接提交代码 PR 到开源社区哦!

欢迎大家使用的过程中发现 bug 或者勘误直接提交 PR 到开源社区哦!

请大家尊重开源和 ZOMI 的努力,引用 PPT 的内容请规范转载标明出处哦!

aisystem's People

Stargazers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

Watchers

 avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar  avatar

aisystem's Issues

Add some learning resources

我学校开过《智能计算系统》这门课,有一些视频链接和实验笔记以及其他资源,我可以放上来吗,额外放一个文件夹收集

希望优化一下自动微分部分

我在b站看到您关于AI芯片的介绍从而发现了这个repo,非常感谢您能够开源这些优秀的资料。
结合我之前学习的资料,希望能对自动微分部分进行一些修改,或者添加一个新的章节。

新的章节主要结合代码实现进行讲解,从基本的支持自动求导的Value类开始,最终实现一个MLP网络的训练,总代码量大概200行不到。

如果您觉得合适的话,我们可以讨论一下怎么修改。

修改主要参考:

  1. Andrej Karpathyyoutube 视频
  2. github repo
  3. jupyter notebook

另外文档中还有一些笔误,我看到的话也可以提交修改。
目前我正在学习cuda和ai编译相关的内容,如果有机会的话也可以看看有没有合适的内容可以贡献。

[视频文章补充计划] AI编译器 后端优化

文章补充内容与计划排期

AI编译原理

后端优化

章节标题 计划完成时间 实际完成时间 对应链接
内容介绍 2024/3/1 2024/2/28 #80
算子的计算与调度 2024/3/10
算子手工优化方式 2024/3/20
算子循环优化 2024/3/30 2024/3/13 #85
指令和内存优化 2024/4/10
AutoTuning原理 2024/4/20

建议在《分布式并行》里面增加“ZeRO优化器”

Megatron-LM支持:数据并行+张量并行+流水并行。
DeepSpedd支持:数据并行+ZeRO优化器。
Megatron-DeepSpeed支持:数据并行+张量并行+流水并行+ZeRO优化器。
ZeRO优化器分为三种:ZeRO-stage1、ZeRO-stage1、ZeRO-stage3。
其中ZeRO-stage3也被称作FSDP。

ZeRO或者FSDP的应用示例:

  1. https://github.com/tatsu-lab/stanford_alpaca
  2. https://github.com/lm-sys/FastChat
  3. https://github.com/hiyouga/LLaMA-Efficient-Tuning/blob/main/README_zh.md

ZeRO相关参考资料:

  1. Samyam Rajbhandari, Jeff Rasley, Olatunji Ruwase, Yuxiong He. (2019) ZeRO: memory optimizations toward training trillion parameter models. arXiv:1910.02054 and In Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis (SC ‘20).
  2. ZeRO++: A leap in speed for LLM and chat model training with 4X less communication](https://www.microsoft.com/en-us/research/blog/deepspeed-zero-a-leap-in-speed-for-llm-and-chat-model-training-with-4x-less-communication/)
  3. FairScale FULLY SHARDED DATA PARALLEL DOC https://fairscale.readthedocs.io/en/stable/api/nn/fsdp.html

多交流

Hi Zomi,Thx for your job. I am a AI Infra owner in car maker company. Hopefully we can be connected. Wechat ID: hello_jijing

我是一名车企的AI基础架构,希望可以多多交流。微信号是:hello_jijing

资料(pdf,pptx)无法打开和下载

点开课程列表,选择任意一条.pdf文件点击进去,显示
Error rendering embedded code

Invalid PD
image

请问怎么解决,是我环境的问题吗?
谢谢作者

希望加入~

一直也有学习ai编译器的想法,就是希望有类似的项目可以参与,虽然我是新手,但也想尽份力,我目前是从事深度学习工作的,不知道可以做点什么

希望加入

这个开源项目做的非常不错,随着LLM大火,也需要了解学习AIsys相关内容,才能完成企业内AI落地,因此希望加入开源项目一起学习讨论

Recommend Projects

  • React photo React

    A declarative, efficient, and flexible JavaScript library for building user interfaces.

  • Vue.js photo Vue.js

    🖖 Vue.js is a progressive, incrementally-adoptable JavaScript framework for building UI on the web.

  • Typescript photo Typescript

    TypeScript is a superset of JavaScript that compiles to clean JavaScript output.

  • TensorFlow photo TensorFlow

    An Open Source Machine Learning Framework for Everyone

  • Django photo Django

    The Web framework for perfectionists with deadlines.

  • D3 photo D3

    Bring data to life with SVG, Canvas and HTML. 📊📈🎉

Recommend Topics

  • javascript

    JavaScript (JS) is a lightweight interpreted programming language with first-class functions.

  • web

    Some thing interesting about web. New door for the world.

  • server

    A server is a program made to process requests and deliver data to clients.

  • Machine learning

    Machine learning is a way of modeling and interpreting data that allows a piece of software to respond intelligently.

  • Game

    Some thing interesting about game, make everyone happy.

Recommend Org

  • Facebook photo Facebook

    We are working to build community through open source technology. NB: members must have two-factor auth.

  • Microsoft photo Microsoft

    Open source projects and samples from Microsoft.

  • Google photo Google

    Google ❤️ Open Source for everyone.

  • D3 photo D3

    Data-Driven Documents codes.