| ISBN/价格: | 978-7-302-67051-3:CNY118.00 |
|---|---|
| 作品语种: | chi |
| 出版国别: | CN 110000 |
| 题名责任者项: | 大语言模型开发/.范煜著 |
| 出版发行项: | 北京:,清华大学出版社:,2024 |
| 载体形态项: | x, 320页:;+图:;+26cm |
| 丛编项: | 新时代·技术新未来 |
| 提要文摘: | 本书旨在帮助读者理解开源大语言模型的架构、训练和推理过程, 以及相关的源代码。主要研究对象是Meta开源的Llama模型。本书从PyTorch实现单层感知机和神经网络开始, 逐步讲解了如何实现Transformer模型和Llama模型。此外, 本书还介绍了增量预训练模型、监督微调和人类反馈强化学习等模型训练过程。对于私有知识的加入, 书中重点介绍了监督微调, 也介绍了RAG中词向量的计算。 |
| 题名主题: | 自然语言处理 |
| 中图分类: | TP391 |
| 个人名称等同: | 范煜 著 |
| 记录来源: | CN SDL 20250527 |