什么是token?

在不同的技术领域,“Token”的含义略有不同。但在大语言模型(比如我) 的语境下,Token 可以通俗地理解为模型处理文本时的“基本单元”

为了帮你更好地理解,我们可以把文字比作乐高积木:

  • 人类视角:我们阅读时,最小的单元是字、词标点

  • 模型视角:为了高效计算,模型会把常见的字词组合切分成Token。一个Token可以是一个完整的单词、一个单词的一部分、一个汉字,甚至是一个标点符号。

举个具体的例子:

  • 中文:句子 “我爱AI!” 可能会被切分为 [“我”][“爱”][“AI”][“!”] 这 4个 Token。

  • 英文:单词 “unbelievable” 可能会被切分为 [“un”][“believe”][“able”] 这 3个 Token。

为什么需要Token?

  1. 计费单位:我这样的模型服务,通常按Token数量收费。你输入的提示词和我生成的回复,总长度就是你一次对话消耗的Token数。

  2. 能力限制:每个模型都有一个“上下文窗口”(比如 128K Token)。这代表模型一次能记住的Token总数。超过这个限制,模型就会“忘记”最前面的对话内容。

你可能会遇到的其他Token含义:

  • 身份验证:在登录网站或调用API时,你会获得一个访问令牌(例如 JWT)。它是一个字符串,相当于你的“临时身份证”,用于验证身份,而不是处理语言。

  • 区块链:像比特币、以太坊这类加密货币,也被称为 “Token”

总结(大模型语境):

Token 是大模型阅读和写作时使用的最小文字积木。 模型不直接看“字”,而是看“Token”。你和我对话消耗的流量,就按这个单元计算。

 

AI智能体知识分享脑世界OPC社区

国家信息光电子创新中心成功研发 250GHz 超宽带光子芯片

2026-5-16 13:41:37

AI智能体知识分享职业技能脑世界OPC社区

创业指导师证书|深耕创业赛道,持证夯实职业底气

2026-5-18 14:53:29

0 条回复 A文章作者 M管理员
    暂无讨论,说说你的看法吧
个人中心
购物车
优惠劵
今日签到
有新私信 私信列表
搜索