ISBN/价格: | 978-7-111-77922-3:CNY119.00 |
---|---|
作品语种: | chi |
出版国别: | CN 110000 |
题名责任者项: | 深度剖析DeepSeek大模型/.丁小晶, 崔远编著 |
出版发行项: | 北京:,机械工业出版社:,2025 |
载体形态项: | xii, 312页:;+图:;+24cm |
丛编项: | AIGC与大模型技术丛书 |
提要文摘: | 本书共分为12章, 首先介绍大模型的基础知识与发展历程, 从神经网络的起源到大规模预训练模型的演化, 再到Transformer、BERT与GPT等模型架构的深入剖析, 帮助读者理解大模型的技术基石。其次详细解析了DeepSeek R1及其Zero版本在强化学习与模型架构上的核心技术, 包括混合专家模型、动态学习率调度、分布式训练及高效推理优化策略等。再次聚焦于模型训练与开发实践, 介绍API调用、上下文拼接、多轮对话管理模型微调、知识蒸馏等关键技术, 并结合DeepSeek实际案例展示其在数学推理、代码生成等领域的应用。最后着重探讨了大模型在商业化落地场景中的高级应用, 如FIM补全、多轮对话、业务代码自动化生成以及基于云部署的智能推荐搜索系统等。 |
题名主题: | 人工智能 |
中图分类: | TP18 |
个人名称等同: | 丁小晶 编著 |
个人名称等同: | 崔远 编著 |
记录来源: | CN 湖北三新 20250331 |