从“Token”到“词元” 这个技术名词到底代表什么?

  Z近,一个技术词突然火了。从全民热议,到官/方定名,Token,有了一个新的中文名字:词元。

  词典应用后台数据显示,从今年2月下旬开始,“Token”这个词的搜索量明显攀升,Z高一天达到7.7万次,比去年日均搜索量高出1850%。

  社交平台上,3月1日至3月20日,有将近60万人参与了关于Token的讨论。这个原本更多在技术圈流通的词,为什么突然闯进了大众视野?

  有的人把它看成一种货币。也有人觉得,它更像一种会被消耗掉的“燃料”或者“食物”。还有人更注重它的功能性。

  当一个技术词开始像水电、流量一样,越来越频繁地进入日常生活,人们自然会想给它起一个更顺口也更像自己语言的名字。

  Z新的国产视频大模型生成一条15秒的标准视频,大约要消耗30万Token。日均140万亿的Token消耗量,累计相当于做了一条长达222年的视频。这样庞大的量背后,对应的是越来越多人正在把AI用进具体场景里。

  Token已经不只是后台里的技术参数了,它正在变成一种新的计量方式,甚至是一种新的产业语言。目前,全国数标委正加快推动一系列数据领域新名词新术语的解释及国家标准研制工作。

  人们讨论Token的中文名字,其实都在做同一件事:试着用生活的语言,去理解一个新技术词。而官/方定义“词元”,也象征着这个过程走到了一个新阶段:一个技术名词从专业圈层走向大众理解,Z终进入正式表达。也许有一天,聊起AI时,会自然地脱口而出“词元”,就像今天说“流量”“扫码”一样。

  (总台央视记者 李斌 郭茜 董怀文 孙茜 徐鹏翔)

【广告】

免责声明:

    本网站所提供的信息仅供参考之用,并不代表本网赞同其观点,也不代表本网对其真实性负责。您若对该稿件内容有任何疑问或质疑,请尽快与江南在线头条网联系,本网将迅速给您回应并做相关处理。联系方式:343848926@qq.com