《实战AI大模型》是一本旨在填补人工智能(AI)领域(特别是AI大模型)理论与实践之间鸿沟的实用手册。书中介绍了AI大模型的基础知识和关键技术,如Transformer、BERT、ALBERT、T5、GPT系列、InstructGPT、ChatGPT、GPT 4、PaLM和视觉模型等,并详细解释了这些模型的技术原理、实际应用以及高性能计算(HPC)技术的使用,如并行计算和内存优化。
同时,《实战AI大模型》还提供了实践案例,详细介绍了如何使用Colossal AI训练各种模型。无论是人工智能初学者还是经验丰富的实践者,都能从本书学到实用的知识和技能,从而在迅速发展的AI领域中找到适合自己的方向。
👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈
为了帮助读者更好地理解和应用AI大模型,本书详细介绍了从基本概念到实践技巧的诸多内容。每章均将重点放在介绍核心概念、关键技术和实战案例上。涵盖了从基本概念到前沿技术的广泛内容,包括神经网络、Transformer模型、BERT模型、GPT系列模型等。
书中详细介绍了各个模型的原理、训练方法和应用场景,并探讨了解决AI大模型训练中的挑战和优化方法。此外,书中还讨论了分布式系统、并行策略和内存优化等关键技术,以及计算机视觉和自然语言处理等领域中Transformer模型的应用。总体而言,本书提供了一个全面的视角,帮助读者深入了解AI大模型和分布式训练在深度学习领域的重要性和应用前景。
本书作者
尤洋
清华大学硕士,加州伯克利大学博士,新加坡国立大学计算机系校长青年教授(Presidential Young Professor)。曾创造ImageNet、BERT、AlphaFold、ViT训练速度的世界纪录,相关技术被广泛应用于谷歌、微软、英特尔、英伟达等科技巨头。
适宜人群
本书面向对深度学习和人工智能领域感兴趣的读者。无论是学生、研究人员还是从业者,都可以从书中获得有价值的知识和见解。对于初学者,本书提供了深度学习和AI大模型的基础概念和算法,帮助他们建立必要的知识框架;对于有一定经验的读者,本书深入探讨了大模型和分布式训练的关键技术和挑战,使他们能够深入了解最新的研究进展和实践应用。
👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈
版权信息
作者简介
前言
第1章 深度学习中的AI大模型
- 1.1 AI大模型在人工智能领域的兴起
- 1.2 深度学习框架入门
第2章 分布式系统:AI大模型的诞生之所
- 2.1 深度学习与分布式系统
- 2.2 AI大模型训练方法
- 2.3 异构训练
- 2.4 实战分布式训练
第3章 分布式训练:上千台机器如何共同起舞
- 3.1 并行策略基础原理
- 3.2 高级并行策略基础原理
- 3.3 实战分布式训练
第4章 AI大模型时代的奠基石Transformer模型
- 4.1 自然语言处理基础
- 4.2 Transformer详解
- 4.3 Transformer的变体与扩展
第5章 AI大幅度提升Google搜索质量:BERT模型
- 5.1 BERT模型详解
- 5.2 高效降低内存使用的ALBERT模型
- 5.3 BERT模型实战训练
第6章 统一自然语言处理范式的T5模型
- 6.1 T5模型详解
- 6.2 统一BERT和GPT的BART模型
- 6.3 统一语言学习范式的UL2框架
- 6.4 T5模型预训练方法和关键技术
第7章 作为通用人工智能起点的GPT系列模型
- 7.1 GPT系列模型的起源
- 7.2 GPT 2模型详解
- 7.3 GPT 3模型详解
- 7.4 GPT 3模型构建与训练实战
第8章 兴起新一代人工智能浪潮:ChatGPT模型
- 8.1 能与互联网交互的WebGPT
- 8.2 能与人类交互的InstructGPT模型
- 8.3 ChatGPT和GPT4
- 8.4 构建会话系统模型
第9章 百花齐放的自然语言模型:Switch Transfomer和PaLM
- 9.1 万亿参数稀疏大模型Switch Transformer
- 9.2 PaLM模型:优化语言模型性能
- 9.3 PaLM实战训练
第10章 实现Transformer向计算机视觉进军的ViT模型
- 10.1 Transformer在计算机视觉中的应用
- 10.2 视觉大模型的进一步发展:Transformer与卷积的融合
- 10.3 ViT模型构建与训练实战
参考文献
👉CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)👈