1.2 什么是 LLM (大语言模型)

学习目标

想象一下，你读过世界上几乎所有的书、文章和网页。当你读完这么多东西后，如果有人问你一个问题，或者让你写一首诗，你是不是能根据你读过的内容，模仿着写出来？

大语言模型 (Large Language Model, LLM) 就是这样一个“读”过海量文本数据的计算机程序。

简单来说，LLM 就是一个超级强大的文字接龙机器。

LLM 的核心原理其实非常简单，就是概率预测。

当你输入一段话给它时，它并不是像人类一样“理解”了你的意思，而是在计算：根据前面这些字，下一个最可能出现的字是什么？

虽然原理听起来简单，但当数据量大到一定程度（量变引起质变），这种简单的“预测下一个字”的能力，就涌现出了惊人的逻辑推理、创作和对话能力。这就是我们常说的**“涌现” (Emergence)** 现象。

目前市面上有很多优秀的 LLM，它们就像不同公司培养的“超级大脑”，各有特长：

LLM 不是魔法，它是一个统计学奇迹。它通过学习人类产生的海量文本，学会了如何像人一样说话和思考。理解了这一点，你就迈出了掌握 AI 的第一步。