东北大学科研团队推出生成式人工智能教材《大模型技术深度解析》

创作时间:

作者:

@小白创作中心

东北大学科研团队推出生成式人工智能教材《大模型技术深度解析》

引用

CSDN

https://blog.csdn.net/Wufjsjjx/article/details/145594377

从2024年4月正式启动至2025年1月底，经过东北大学科研团队20多位师生近一年的努力，《大模型技术深度解析》教材问世！本教材力求通过清晰的结构与条理，使不同背景的读者能够深入理解生成式人工智能的核心技术及其发展趋势。

编写缘起

《大模型技术深度解析》这本教材的编写，始于东北大学科研团队对当前大语言模型技术和人工智能领域快速发展的关注。

生成式人工智能作为推动技术进步的核心力量，从自然语言处理、图像处理到跨模态系统的构建，大模型技术均展现出巨大潜力。同时，作为走向通用人工智能的关键技术，众多国内外研究者投身于大模型相关技术研究，一方面使该技术领域的研究呈现出蓬勃发展的状态，对应领域的研究深度、研究广度不断拓展，而另一方面也使得该技术领域的从业门槛大幅提升。

在此背景下，高校作为高层次人才培养的主体，迫切需要一本可以做为计算机相关专业本科生、研究生的生成式人工智能类专业教材帮助学生全面、系统地了解大模型技术的基本原理、研究内容、研究现状等知识，为今后从事大模型相关技术工作打下坚实基础。为此，东北大学科研团队开展了本教材的编写工作。

编者介绍

《大模型技术深度解析》教材的编者为东北大学任飞亮、李瑞婷、裴颖鑫、齐屹旸、王兴伟等师生。王兴伟教授领导了本教材的编写工作，确定了教材编写的总体目标、编写原则、以及适用对象，定期组织专家讨论教材的编写情况，对教材内容提出了一系列关键建议。任飞亮教授确定了教材内容、教材内容的组织框架，指导学生进行教材内容的资料收集、撰写等工作，并校对、审核了每位学生的撰写内容。李瑞婷、裴颖鑫、齐屹旸等同学为本教材的撰写作出了突出贡献，负责撰写的教材内容均超过5万字，同时协助任飞亮教授进行了教材的最后统稿、教材内容整体审核等工作。

除上述编者外，还有近20位同学参与了本教材的编写工作。非常感谢廖婷婧、王凌宇、唐家宝、吉喆、王嘉岐等同学，他们在本教材编写过程中付出了大量辛苦工作，为本教材的编写提出了很多重要建议，并且高质量地完成了各自负责章节内容的撰写，相应内容为本教材贡献的字数均超过2万字，他们撰写的内容也为其他参与同学提供了编写范例。此外，斯德鑫、张彦聪、王世超、张嘉镐、张珈硕、罗泱鸿、杨仓懿、丁炜腾、张佳旭、韩星臣、韩渊涛、李天扬、和张瑞豪等同学也都参与了本教材不同章节的撰写，为本教材的编写同样做出了重要贡献。

教材特点

01
内容全面：本教材全面、系统地介绍了各类大模型相关技术，涵盖了从Transformer等大模型基础知识，到检索增强生成技术、大模型压缩及轻量化、知识编辑等大模型进阶知识，再到Agent、多模态大模型、大模型持续学习等大模型高级知识，是一本内容全面的生成式人工智能教材。

02
内容深入：本教材在内容介绍上，除基本概念、基本原理的介绍外，还对一些内容大模型相关技术从算法原理角度进行深入分析，旨在帮助读者全面、系统地了解各类大模型相关技术，为他们掌握大模型相关技术的核心精髓提供有力支持。

03
用户广泛：本教材具有广泛的适用人群，既可以做为“计算机专业本科生、研究生”的生成式人工智能“专业类教材”，也可以做为“非计算机专业本科生”的生成式人工智能“通识类教材”，还可以做为人工智能“科研人员”的“科研辅助”教材。

教材导读

《大模型技术深度解析》教材共分为三大专题：大模型基础、大模型优化方法、以及大模型能力扩展，各部分内容介绍如下。

专题一
大模型基础
包括第1-3章，主要介绍大模型的基础知识，包括其核心架构和重要技术。
第一章介绍Transformer原理，以及基于Transformer架构的预训练语言模型。第二章介绍大模型架构的具体实例，包括ChatGPT、Mamba和MOE模型。第三章介绍大模型的基础调优与评价方法，具体包括大模型微调方法、大模型对齐方法与大模型评价方法。

专题二
大模型优化方法
包括第4-6章，从生成质量优化、推理能力优化和计算存储优化共三个方面深入探讨了大模型的优化方法。
第四章介绍大模型生成质量优化方法，关注模型生成结果的准确性、一致性和多样性。具体地，面向准确性优化，介绍大模型幻觉与检索增强生成方法；面向一致性优化，介绍知识冲突与可控生成方法；面向多样性优化，介绍数据合成方法。第五章介绍大模型的推理能力优化方法，首先介绍大模型推理能力，接着介绍知识编辑方法。第六章介绍大模型计算存储优化方法。分别面向计算效率与存储效率，介绍大模型的计算效率优化方法与大模型压缩技术。

专题三
大模型能力扩展
包括7-10章，覆盖多个能力扩展方向，探讨了大模型在复杂任务中的适应性、模态扩展以及反馈扩展等前沿应用，展示了大模型在更广泛的应用场景中的潜力。
第七章介绍大模型的复杂任务适应，具体包括长文本处理生成方法和大模型的表格处理方法。第八章介绍大模型的模态扩展，包括多模态大模型与图提示学习。第九章介绍大模型的反馈扩展，包括智能体与持续学习方法。第十章从合规发展的角度，介绍大模型人格与大模型的文本检测方法。