← 全部文章

大语言模型入门:你在和什么对话?

一句话理解

大语言模型是在预测下一个词;对话感来自多轮上下文与指令微调。

Token 是什么

文本会被切成 token(可能是子词),模型在 token 序列上工作,所以有「上下文长度」限制。

你能做什么

  • 把任务写清楚:角色、输入、输出格式。
  • 长文档分段处理,避免超出窗口。

下一步

了解 RAG(检索增强)与 Agent(工具调用)会把模型能力放到真实业务里。

保持好奇,多动手调 prompt 和做小 demo。