超140万亿词元调用量的背后代表哪些行业发展趋势?专家解读

①到今年3月,我国日均Token即词元调用量超过140万亿,相比2024年初的1000亿增长了1000多倍,表明中国人工智能发展进入快速增长阶段,应用场景不断深化;

②词元是构成智能体和人工智能大模型的最小单元,未来35年,词元应发展成像电和自来水一样,随取随用。

 

到今年3月,我国日均Token即词元调用量超过140万亿,相比2024年初的1000亿增长了1000多倍。日均词元调用量的大量增加,充分表明中国的人工智能发展进入了快速增长阶段,应用场景在不断深化。今年是“十五五”开局之年,也是数据要素价值释放年。日均词元调用量超140万亿,说明什么?

 

如何理解词元?哪个比喻更像真正的词元?

 

国家数据专家咨询委员会委员、北京交通大学教授张向宏:词元是一个特别新的概念。人工智能大模型在全球出现仅5年时间,而词元在世界范围内出现也不到1年,中文名字半年时间不到。对词元的理解,以后词元会发展成什么样子,都是在探索阶段。

 

目前,我们认为词元分两个阶段来看。词元上游是高质量数据集,高质量数据集再往前是数据资源。下端是智能体和大模型,智能体和大模型是在各行各业,在个人、企业当中应用的。从这个角度上来说,词元是构成智能体和人工智能大模型的最小单元,就像一块块积木,搭成了智能体的应用。

 

从再长的时间来看,35年,词元应该发展成就像电和自来水一样,随取随用,用多少买多少,用多少付多少钱。随着经济社会的发展,智能经济不断提升,词元的概念会越来越丰富,内涵会越来越丰富。

 

如何为AI创造更多应用场景?

 

张向宏:人工智能的最终生命力体现在应用。如果说,人工智能不能在社会经济中深度应用,不能跟个人日常生活、政府日常管理,特别是企业日常生产经营活动深度绑定、深度融合的话,其实是没有生命力的。在这方面国家出台了很多政策。

 

目前来看,从个人、政府、企业在办公、在场景方面用得比较浅层。下一步,就应该在各行各业,特别是制造业企业,比如金融、商贸流通等各方面跟生产流程、市场营销、供应链深度绑定。假以时日,人工智能在生产经营活动中会越来越深入,越来越广泛。

 

建设更多高质量数据集,面对的问题、挑战是什么?

 

张向宏:有三方面挑战。第一,数据挑战。可以看到,目前数据高质量开发利用给我们生活带来很多便利,提升效率。如果数据安全性没有得到保障,也会带来很多隐私泄露等,所以,数据安全流通是摆在我们面前非常重要的话题。

 

第二,算力。算力有两个瓶颈,其一,GPU。目前虽然取得了重大突破,但是仍然有比较大的提升空间。其二,电力。如果个人、企业和政府大规模用人工智能,电力耗费相当大。当然,在算力协同,特别是绿电支持算力发展方面,已经做了重大布局,但是也要未雨绸缪。

 

第三,技术迭代,就是模型技术迭代。这几年国家大模型企业的技术发展特别快,但是下一步离企业、政府、个人的应用还要进一步深化。

 

文章来源财联社

* 本文部分图片来源于网络、部分内容源于公开信息整理,如无意中侵犯某家媒体、公司企业或个人等的知识产权,请告知,将在24小时内给予删除相关处理。

风险提示:文章所提及的投资方向,不代表未来长期必然投资的方向。本文内容不构成任何投资建议或邀约,不构成任何产品宣传、推介,不构成亦不应被理解为任何形式的保证或承诺。市场有风险,投资需谨慎。

投资洞见订阅

扫码关注
电话咨询
微信咨询