
会员
ChatGPT原理与架构:大模型的预训练、迁移和中间件编程
程戈更新时间:2024-04-25 18:20:57
最新章节:封底开会员,本书免费读 >
这是一本深入阐述ChatGPT等大模型的工作原理、运行机制、架构设计和底层技术,以及预训练、迁移、微调和中间件编程的著作。它将帮助我们从理论角度全面理解大模型,从实践角度更好地应用大模型,是作者成功训练并部署大模型的过程复盘和经验总结。第1章介绍了ChatGPT等大模型的发展历程、技术演化和技术栈等基础知识;第2~5章深入讲解了Transformer的架构原理,并从GPT-1的生成式预训练到GPT-3的稀疏注意力机制详细描述了GPT系列的架构演进;6~8章从底层技术实现的角度讲解了大语言模型的训练策略、数据处理方法,以及如何利用策略优化和人类反馈来进一步提升模型的表现;第9~10章首先详细讲解了大语言模型在垂直领域的低算力迁移方法,并给出了医疗和司法领域的迁移案例,然后讲解了大模型的中间件编程;第11章对GPT的未来发展趋势进行预测,探讨数据资源、自回归模型的局限性,以及大语言模型时代具身智能的可行路线。
品牌:机械工业出版社
上架时间:2023-12-01 00:00:00
出版社:机械工业出版社
本书数字版权由机械工业出版社提供,并由其授权上海阅文信息技术有限公司制作发行
ChatGPT原理与架构:大模型的预训练、迁移和中间件编程最新章节
查看全部- 封底
- 作者简介
- 11.5 小结
- 11.4.3 ChatGPT for Robotics
- 11.4.2 PaLM-E
- 11.4.1 具身智能的挑战
- 11.4 具身智能
- 11.3 自回归模型的局限性
- 11.2 数据资源枯竭
- 11.1 强人工智能之路
程戈
主页
同类热门书
最新上架
- 会员
巧用ChatGPT快速搞定数据分析
本书共分为8章,涵盖了从数据分析基础知识、常见的统计学方法到使用ChatGPT进行数据准备、数据清洗、数据特征提取、数据可视化、回归分析与预测建模、分类与聚类分析,以及深度学习和大数据分析等全面的内容。计算机10.7万字 - 会员
巧用ChatGPT轻松玩转新媒体运营
本书从ChatGPT的基础知识讲起,针对运营工作中的各种痛点,结合实战案例,如文案写作、图片制作、社交媒体运营、爆款视频文案、私域推广、广告策划、电商平台高效运营等,教会读者如何使用ChatGPT进行智能化工作;还介绍了通过ChatGPT配合Midjourney、D-ID等AI软件的使用,进一步帮助提高运营工作的效率。计算机11.3万字 - 会员
ChatGPT进阶:提示工程入门
本书共分为9章,内容涵盖三个层次:介绍与解读、入门学习、进阶提升。第1-2章介绍与剖析了ChatGPT与提示工程,并从多个学科的角度探讨了提示工程学科。第3-5章演示了ChatGPT的实际运用,教你如何使用ChatGPT解决自然语言处理问题,并为你提供了一套可操作、可重复的提示设计框架,让你能够熟练驾驭ChatGPT。第6-9章讲解了来自学术界的提示工程方法,以及如何围绕ChatGPT进行创新。计算机9.7万字 - 会员
ChatGPT时代:ChatGPT全能应用一本通
本书共16章,内容包括人工智能、OpenAI、ChatGPT的概述及其操作技巧。生动展示了ChatGPT在教育与学术、商业管理、新媒体、办公、求职等12个领域的实际运用,同时探讨了ChatGPT当前面临的挑战以及大模型的未来发展方向。计算机12万字 - 会员
《机器学习》习题参考
本书配套周志华教授所著的《机器学习》教材,通过大量习题考查读者对机器学习相关知识点的理解与掌握。全书分为两个部分:第一部分习题对应《机器学习》第1~10章的内容,包括绪论、模型评估与选择、线性模型、决策树、神经网络、支持向量机、贝叶斯分类器、集成学习、聚类、降维与度量学习;第二部分包含6章应用专题,通过综合题的形式对知识点进行多角度考查,包括线性模型的优化与复用、面向类别不平衡数据的分类、神经网络计算机19.3万字 - 会员
设计深度学习系统
本书主要从软件开发者的角度探讨如何构建和设计深度学习系统。作者首先描述一个典型的深度学习系统的整体,包括其主要组件以及它们之间的连接方式,然后在各个单独的章节中深入探讨这些主要组件。对于具体介绍的章节,会在开始时讨论需求,接着介绍设计原则和示例服务/代码,并评估开源解决方案。通过阅读本书,读者将能够了解深度学习系统的工作原理,以及如何开发每个组件。本书的主要读者对象是想要从事深度学习平台工作或将一计算机18.1万字 - 会员
AIGC驱动工业智能设备:系统设计与行业实践
(1)AI与AIGC基础知识:从基础入手,深入讲解AI技术的基本概念和原理。通过通俗易懂的讲解和示例,帮助读者建立坚实的理论基础,为后续章节的深入学习打下良好基础。(2)智能设备上的AIGC系统设计:详细介绍AIGC技术在实际应用过程中的各种功能设计和实现方法。内容涵盖算法选择、模型训练、系统集成等各个环节,通过丰富的技术细节和设计策略,帮助读者全面掌握AIGC技术的应用要点。(3)AIGC关键工计算机18万字 - 会员
从零构建大模型
本书是关于如何从零开始构建大模型的指南,由畅销书作家塞巴斯蒂安·拉施卡撰写,通过清晰的文字、图表和实例,逐步指导读者创建自己的大模型。在本书中,读者将学习如何规划和编写大模型的各个组成部分、为大模型训练准备适当的数据集、进行通用语料库的预训练,以及定制特定任务的微调。此外,本书还将探讨如何利用人工反馈确保大模型遵循指令,以及如何将预训练权重加载到大模型中。计算机13.8万字 - 会员
这就是DeepSeek:普通人如何抓住AI红利
本书聚焦如何高效运用DeepSeek这一前沿AI工具,帮助读者在技术浪潮中把握机遇。全书从DeepSeek发展历程切入,系统解析DeepSeek在信息处理、创意生成与决策辅助中的核心能力,并结合生活管理、职场协作、学习优化、社交互动等场景,通过真实案例讲解其应用方法。同时,针对内容创作、自媒体运营、副业变现等需求,书中提供了可落地的策略与案例,助力读者实现效率提升与价值创造。书中不仅提供技术使用技计算机5.5万字