主流大语言模型的技术原理细节

2023年9月12日19:59:03评论162 views字数 817阅读2分43秒阅读模式

主流大语言模型的技术原理细节

主流大语言模型的技术原理细节

作者：spring

1.比较 LLaMA、ChatGLM、Falcon 等大语言模型的细节：tokenizer、位置编码、Layer Normalization、激活函数等。2. 大语言模型的分布式训练技术：数据并行、张量模型并行、流水线并行、3D 并行、零冗余优化器 ZeRO、CPU 卸载技术 ZeRo-offload、混合精度训练、激活重计算技术、Flash Attention、Paged Attention。3. 大语言模型的参数高效微调技术：prompt tuning、prefix tuning、adapter、LLaMA-adapter、 LoRA。

0. 大纲

主流大语言模型的技术原理细节

1. 大语言模型的细节

1.0 transformer 与 LLM

主流大语言模型的技术原理细节

1.1 模型结构

主流大语言模型的技术原理细节

1.2 训练目标

主流大语言模型的技术原理细节

1.3 tokenizer

主流大语言模型的技术原理细节

1.4 位置编码

主流大语言模型的技术原理细节

1.5 层归一化

主流大语言模型的技术原理细节

1.6 激活函数

主流大语言模型的技术原理细节

1.7 Multi-query Attention 与 Grouped-query Attention

主流大语言模型的技术原理细节

1.8 并行 transformer block

主流大语言模型的技术原理细节

1.9 总结-训练稳定性

主流大语言模型的技术原理细节

2. LLM 的分布式预训练

主流大语言模型的技术原理细节

2.0 点对点通信与集体通信

主流大语言模型的技术原理细节

2.1 数据并行

主流大语言模型的技术原理细节

2.2 张量并行

主流大语言模型的技术原理细节

主流大语言模型的技术原理细节

2.3 流水线并行

主流大语言模型的技术原理细节

2.4 3D 并行

主流大语言模型的技术原理细节

2.5 混合精度训练

主流大语言模型的技术原理细节

2.6 激活重计算

主流大语言模型的技术原理细节

2.7 ZeRO，零冗余优化器

主流大语言模型的技术原理细节

2.8 CPU-offload，ZeRO-offload

主流大语言模型的技术原理细节

2.9 Flash Attention

主流大语言模型的技术原理细节

2.10 vLLM: Paged Attention

主流大语言模型的技术原理细节

3. LLM 的参数高效微调

3.0 为什么进行参数高效微调？

主流大语言模型的技术原理细节

3.1 prompt tuning

主流大语言模型的技术原理细节

3.2 prefix tuning

3.3 adapter

主流大语言模型的技术原理细节

3.4 LLaMA adapter

主流大语言模型的技术原理细节

3.5 LoRA

主流大语言模型的技术原理细节

3.6 实验比较

主流大语言模型的技术原理细节

4. 参考文献

主流大语言模型的技术原理细节

主流大语言模型的技术原理细节

原文始发于微信公众号（腾讯技术工程）：主流大语言模型的技术原理细节

免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉。

左青龙
微信扫一扫

右白虎
微信扫一扫

清华大学 | 实网中多选项卡网站指纹攻击

基于hashcat工具获取iTunes加密备份密码

探析315晚会窃取手机号、微信号案例技术手法

关于最近研究成果被转载的几点说明

鲜为人知的Windows技能：Server完整SSH配置与应用场景

底层牛马谈辞职

诸子云｜甲方：高危基线允许加白吗？

教你如何免费激活 Windows 和 Office

深度剖析DeroMiner：Golang构筑的蠕虫级挖矿魔爪如何通过失陷Docker API野蛮生长，技术细节与防御策略

网络安全行业，聊一聊中年危机

本文由 admin 发表于 2023年9月12日19:59:03
转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出)：
主流大语言模型的技术原理细节https://cn-sec.com/archives/2030568.html
免责声明:文章中涉及的程序(方法)可能带有攻击性，仅供安全研究与教学之用，读者将其信息做其他用途，由读者承担全部法律及连带责任，本站不承担任何法律及连带责任；如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截，联系方式见首页)，望知悉.

目录

在线咨询

13688888888

8888 QQ在线咨询

微信
本页二维码