图书馆

书目详细信息： 大语言模型开发:用开源模型开发本地系统

ISBN/价格：	978-7-302-67051-3:CNY118.00
作品语种：	chi
出版国别：	CN 110000
题名责任者项：	大语言模型开发/.范煜著
出版发行项：	北京:,清华大学出版社:,2024
载体形态项：	x, 320页:;+图:;+26cm
丛编项：	新时代·技术新未来
提要文摘：	本书旨在帮助读者理解开源大语言模型的架构、训练和推理过程, 以及相关的源代码。主要研究对象是Meta开源的Llama模型。本书从PyTorch实现单层感知机和神经网络开始, 逐步讲解了如何实现Transformer模型和Llama模型。此外, 本书还介绍了增量预训练模型、监督微调和人类反馈强化学习等模型训练过程。对于私有知识的加入, 书中重点介绍了监督微调, 也介绍了RAG中词向量的计算。
题名主题：	自然语言处理
中图分类：	TP391
个人名称等同：	范煜著
记录来源：	CN SDL 20250527

总体评分：（共0人）

我的评分：

收藏加入课程