跳过正文

书籍阅读

读书笔记《大语言模型》

读书笔记《大语言模型》

·19143 字·39 分钟
本文是《大语言模型》的阅读笔记,详细介绍了大语言模型的发展历程、训练优化方法、数据处理技术、解码策略、模型量化、模型压缩、提示学习、评测指标和方法,以及知识图谱在大语言模型中的应用,特别关注了扩展法则、涌现能力、人类对齐和多智能体系统等关键概念和技术。
读书笔记《大规模语言模型:从理论到实践》

读书笔记《大规模语言模型:从理论到实践》

·16129 字·33 分钟
本文是《大规模模型语言》一书的笔记。详细探讨了语言模型的发展历程、基本概念和概率分布建模方法,随后重点讨论了大模型的发展历程和构建流程。文章也详细描述了Transformer模型、GPT和LLaMA模型的特点和优化方法。此外,文章还介绍了分布式训练技术、并行策略、强化学习的基本概念和应用,以及语言模型的评估指标和方法。