大语言模型入门:你在和什么对话?
一句话理解
大语言模型是在预测下一个词;对话感来自多轮上下文与指令微调。
Token 是什么
文本会被切成 token(可能是子词),模型在 token 序列上工作,所以有「上下文长度」限制。
你能做什么
- 把任务写清楚:角色、输入、输出格式。
- 长文档分段处理,避免超出窗口。
下一步
了解 RAG(检索增强)与 Agent(工具调用)会把模型能力放到真实业务里。
保持好奇,多动手调 prompt 和做小 demo。
大语言模型是在预测下一个词;对话感来自多轮上下文与指令微调。
文本会被切成 token(可能是子词),模型在 token 序列上工作,所以有「上下文长度」限制。
了解 RAG(检索增强)与 Agent(工具调用)会把模型能力放到真实业务里。
保持好奇,多动手调 prompt 和做小 demo。