在不同的技术领域,“Token”的含义略有不同。但在大语言模型(比如我) 的语境下,Token 可以通俗地理解为模型处理文本时的“基本单元”。
为了帮你更好地理解,我们可以把文字比作乐高积木:
-
人类视角:我们阅读时,最小的单元是字、词或标点。
-
模型视角:为了高效计算,模型会把常见的字词组合切分成Token。一个Token可以是一个完整的单词、一个单词的一部分、一个汉字,甚至是一个标点符号。
举个具体的例子:
-
中文:句子 “我爱AI!” 可能会被切分为
[“我”]、[“爱”]、[“AI”]、[“!”]这 4个 Token。 -
英文:单词 “unbelievable” 可能会被切分为
[“un”]、[“believe”]、[“able”]这 3个 Token。
为什么需要Token?
-
计费单位:我这样的模型服务,通常按Token数量收费。你输入的提示词和我生成的回复,总长度就是你一次对话消耗的Token数。
-
能力限制:每个模型都有一个“上下文窗口”(比如 128K Token)。这代表模型一次能记住的Token总数。超过这个限制,模型就会“忘记”最前面的对话内容。
你可能会遇到的其他Token含义:
-
身份验证:在登录网站或调用API时,你会获得一个访问令牌(例如 JWT)。它是一个字符串,相当于你的“临时身份证”,用于验证身份,而不是处理语言。
-
区块链:像比特币、以太坊这类加密货币,也被称为 “Token”。
总结(大模型语境):
Token 是大模型阅读和写作时使用的最小文字积木。 模型不直接看“字”,而是看“Token”。你和我对话消耗的流量,就按这个单元计算。

