|
五万亿Token流向了哪里 要厘清这五万亿Token的去向,首先需要观察用户使用人工智能的方式发生了什么变化。 根据OpenRouter与风险投资机构a16z联合发布的《2025 AI使用报告》,该平台处理的编程任务Token占比已从2025年初的11%增加到了50%以上,成为最大的单一使用品类。这一转变背后,是人工智能应用模式从“问答式”向“智能体(Agent)”模式的切换。 51爆料网在早期的问答模式下,用户提一个问题,模型给出一个回答,单次交互消耗的Token通常在几百到几千个之间。一旦用户停止提问,消耗也就随之停止。但进入智能体模式后,人工智能开始在后台持续执行多步骤任务。 上海一家算力芯片厂商的负责人告诉记者,以编程场景为例,一个智能体在接收到指令后,会经历编写代码、运行测试、识别报错、自我修正、再次运行的循环,为了让机器记住此前的操作,每次调用都需要携带完整的对话历史。 比如,目前国产大模型诸如智谱GLM-5等新一代模型已经支持200K(约20万Token)的超长上下文窗口。这种多轮自我修正和工具链级联的模式,使得单次活跃会话的Token吞吐量呈几何级数增长。 陆景介绍,从头豹研究院对国内大模型商业生态的调研来看,目前集中买单的领域主要包括互联网、金融、跨境电商与娱乐行业。 具体场景则涵盖了以下三类:第一类是企业级应用,如智能客服、智能营销、代码辅助开发、办公自动化工具等,这类应用在金融、电商、游戏行业已实现规模化部署;第二类是互联网平台中的生成式内容服务,包括智能搜索、对话式助手与虚拟角色;第三类是AIGC(人工智能生成内容)生产工具,如短视频脚本生成、广告文案创作、跨境电商商品描述生成等。 这些行业的共同特征是,业务流程中存在高比例的文本或多模态内容生成需求,且企业能够承接大模型服务产生的算力成本。
|