会员
从零开始大模型开发与微调:基于PyTorch与ChatGLM
王晓华更新时间:2024-12-31 17:38:36
最新章节:18.5 本章小结开会员,本书免费读 >
大模型是深度学习自然语言处理皇冠上的一颗明珠,也是当前AI和NLP研究与产业中最重要的方向之一。本书使用PyTorch2.0作为学习大模型的基本框架,以ChatGLM为例详细讲解大模型的基本理论、算法、程序实现、应用实战以及微调技术,为读者揭示大模型开发技术。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》共18章,内容包括人工智能与大模型、PyTorch2.0深度学习环境搭建、从零开始学习PyTorch2.0、深度学习基础算法详解、基于PyTorch卷积层的MNIST分类实战、PyTorch数据处理与模型展示、ResNet实战、有趣的词嵌入、基于PyTorch循环神经网络的中文情感分类实战、自然语言处理的编码器、预训练模型BERT、自然语言处理的解码器、强化学习实战、只具有解码器的GPT-2模型、实战训练自己的ChatGPT、开源大模型ChatGLM使用详解、ChatGLM高级定制化应用实战、对ChatGLM进行高级微调。《从零开始大模型开发与微调:基于PyTorch与ChatGLM》适合PyTorch深度学习初学者、大模型开发初学者、大模型开发人员学习,也适合高等院校人工智能、智能科学与技术、数据科学与大数据技术、计算机科学与技术等专业的师生作为教学参考书。
品牌:清华大学
上架时间:2023-11-01 00:00:00
出版社:清华大学出版社
本书数字版权由清华大学提供,并由其授权上海阅文信息技术有限公司制作发行
从零开始大模型开发与微调:基于PyTorch与ChatGLM最新章节
查看全部- 18.5 本章小结
- 18.4.3 Huggingface专用PEFT的使用
- 18.4.2 PEFT的使用与参数设计
- 18.4.1 PEFT技术详解
- 18.4 高级微调方法3——基于Huggingface的PEFT模型微调
- 18.3.5 基于基本原理的LoRA实现
- 18.3.4 基于自定义LoRA的模型推断
- 18.3.3 基于自定义LoRA的模型训练
- 18.3.2 自定义LoRA的使用方法
- 18.3.1 对ChatGLM进行微调的方法——LoRA
王晓华
主页
同类热门书
最新上架
- 会员
AIGC:让生成式AI成为自己的外脑
《AIGC:让生成式AI成为自己的外脑》针对近期较为火热的AIGC技术及其相关话题,介绍AIGC的技术原理、专业知识和应用。全书共分为九章。第一章介绍AIGC技术的基本概念和发展历程;第二、三章介绍AIGC的基础技术栈和拓展技术栈;第四、五章分别讨论了AIGC技术在文本生成和图像生成两个领域的现状和前景;第六章列举了目前较为热门的AIGC技术应用;第七章描述了AIGC的上、中、下游产业链及未来前景计算机12.8万字 - 会员
Sora革命:重塑人工智能
Sora是一个文本生成视频工具,本书介绍了Sora在视频生成领域的巨大潜力。本书共9章,系统讲解人工智能的演进、Sora的应用实践、Sora深度解析、Sora的挑战与未来等。本书内容全面、图文并茂、经典易懂,适合想要学习Sora的初学者,以及想要学习文本生成文本、文本生成图片、文本生成视频等内容的人工智能爱好者、自媒体从业人员、短视频制作者、设计师、相关专业的企业和高校人员阅读。计算机3.2万字 - 会员
机器学习实战(视频教学版)
《机器学习实战:视频教学版》基于Python语言详细讲解机器学习算法及其应用,用于读者快速入门机器学习。《机器学习实战:视频教学版》共分12章,内容包括机器学习概述、Python数据处理基础、Python常用机器学习库、线性回归及应用、分类算法及应用、数据降维及应用、聚类算法及应用、关联规则挖掘算法及应用、协同过滤算法及应用,最后通过3个综合实战项目(包括新闻内容分类实战、泰坦尼克号获救预测实战、计算机10.1万字 - 会员
Python+ChatGPT办公自动化实战
本书对Python在职场办公领域的应用进行了系统梳理与介绍。全书共12章,第1~6章主要围绕与Python办公自动化相关的基础知识展开;第7~12章包括走进ChatGPT,文件操作自动化,Word、PPT办公自动化,Excel办公自动化,PDF文档操作自动化和邮件发送,数据分析与可视化等内容。本书提供了丰富的案例,并配有相关资源,以增强读者的实战能力。本书内容易学易懂,适合追求高效工作、对办公自动计算机11.9万字 - 会员
大语言模型:原理、应用与优化
这是一本从工程化角度讲解大语言模型的核心技术、构建方法与前沿应用的著作。首先从语言模型的原理和大模型的基础构件入手,详细梳理了大模型技术的发展脉络,深入探讨了大模型预训练与对齐的方法;然后阐明了大模型训练中的算法设计、数据处理和分布式训练的核心原理,展示了这一系统性工程的复杂性与实现路径。除了基座模型的训练方案,本书还涵盖了大模型在各领域的落地应用方法,包括低参数量微调、知识融合、工具使用和自主智计算机12.1万字 - 会员
MindSpore大语言模型实战
随着ChatGPT等大语言模型的迅速发展,大语言模型已经成为人工智能领域发展的快车道,不同领域涌现出各种强大的新模型。开发者想要独立构建、部署符合自身需求的大语言模型,需要理解大语言模型的实现框架和基本原理。本书梳理大语言模型的发展,首先介绍Transformer模型的基本原理、结构和模块及在NLP任务中的应用;然后介绍由只编码(Encoder-Only)到只解码(Decoder-Only)的技术计算机6.6万字 - 会员
AIGC辅助数据分析与数据化运营:场景化解决方案与案例分析
这是一本能从业务、方法、场景3个维度帮助读者使用AI技术提升数据分析和数据化运营能力的著作。用扎实的理论框架、丰富的实践案例、实用的操作技巧,全面展示了如何用AI延伸业务分析广度、拓展业务分析深度、优化业务分析效能,从而达到帮助企业用智能的数据化运营实现业务持续增长的目的。本书采用案例驱动的写作方式,通过实际业务案例详细拆解AI技术在各个场景中的应用步骤和技巧。语言简洁易懂,理论与实践结合,注重实计算机17.2万字 空间计算:人工智能驱动的新商业革命
空间计算是一种不断发展的以三维世界为中心的计算形式和交互形式,是以计算机视觉为基础的高阶应用。其核心是使用AI、计算机视觉和扩展现实将虚拟体验融入物理世界,让用户摆脱屏幕的束缚,自然地与数字世界中的对象互动,就像与真实世界中的对象互动一样。随着生成式AI的爆发,空间计算平台将拥有更加丰富的内容,将在很大程度上改变我们的生活和工作,重新定义商业模式,并改变我们与技术和整个世界互动的方式,推动我们进入计算机12.1万字- 会员
情感计算
在人工智能的研究中,既包括对于人类理性思维的模拟,还包括对人类感性思维的计算。本书重点讲述的文本情感分析技术就属于后者。该技术源于自然语言处理领域,但也有别于一般的自然语言处理任务。文本情感分析面向的处理对象是社交媒体中产生的用户评论文本,该文本的特点是带有大量的用户主观情感信息,因此该技术的核心是通过自动分析评论文本来进行情感的理解。文本情感分析技术已有20余年的研究历史,凝聚成了多项研究任务和计算机23.3万字