| 代码 | 名称 | 当前价 | 涨跌幅 | 最高价 | 最低价 | 成交量(万) |
|---|
①各大模型的token调用量自2026年1月下旬出现明显跃升;②国产大模型站上舞台中央;③智能体在执行任务时,整体token消耗或提升十倍以上 ,而对应的算力需求将增长百倍以上。
最近,大模型token调用量井喷成为关注点 。OpenRouter最新数据显示,各大模型的token调用量自2026年1月下旬出现明显跃升。
与此同时 ,国产大模型站上舞台中央。2月9日-15日这周,中国模型以4.12万亿token的调用量,首次超过同期美国模型的2.94万亿token 。16日-22日这周 ,中国模型的周调用量进一步冲高至5.16万亿Token,三周大涨127%,而同期美国模型调用量跌至2.7万亿Token。平台调用量排名前五的模型中 ,有四款来自中国厂商,分别为MiniMax的M2.5、月之暗面的Kimi K2.5 、智谱的GLM-5以及DeepSeek的V3.2。这四款模型合计贡献了Top5总调用量的85.7% 。
其中,M2.5一鸣惊人 ,在发布后12小时内登顶OpenRouter热度榜,一周内登顶调用量榜首,周调用量暴涨至3.07T tokens,超过Kimi K2.5、GLM-5与DeepSeek V3.2三家的总和。
OpenRouter是全球最大的大模型API聚合平台 ,可为开发者提供统一API接口,以访问全球数百种大语言模型。其核心功能包括多模型调用、智能路由优化和透明的性能排行榜,旨在解决多模型集成复杂和厂商封锁问题 。
当目光聚焦于AI应用普及 、国产模型崛起等 ,不应该忽视数据背后的结构性变化。
模型调用量因何在近期爆发?排名靠前的为何是M2.5等新秀?
多家机构认为,一方面是,春节带来AI应用渗透率提高 ,token消耗量有了总体提升;另一方面,AI模型的Agent(智能体)场景广泛落地,单次任务token消耗大幅增加。
伴随1月下旬以来的这一轮增长 ,梳理AI行业的新动向,也能为上述问题提供思路 。
首先是OpenClaw爆火,这是一个能让大模型获得本地操作系统权限的开源智能体框架 ,可让AI可以自己执行Shell命令、操作文件系统,实现所谓的“本地代理主权”。当地时间2月15日,OpenClaw的创造者Peter Steinberger正式加入OpenAI,负责推动“下一代个人智能体 ”的研发。
随后多个面向智能体场景的大模型发布 ,反响热烈——
稀宇科技(MiniMax)于2月13日发布MiniMax M2.5,称该模型为全球首个为智能体场景原生设计的生产级旗舰模型。其发布后七天的调用量即突破3.07T tokens,凭借在编程和Agent工作流中的卓越性能与极低的成本 ,成为开发者首选 。
月之暗面(Moonshot AI)于1月27日发布KimiK2.5,该模型采用原生多模态架构,能通过调度多达100个“Agent分身”并行工作 ,将复杂任务效率提升3到10倍。该模型在多个细分榜单(如编程、工具调用)中均排名第一,其调用量远超Gemini 3和Claude模型。
智谱于2月12日发布GLM-5,该模型参数规模进一步扩展 ,采用了稀疏注意力机制,是其专为复杂系统工程与长程Agent任务设计的旗舰模型 。凭借免费 、200K上下文窗口等优势,该模型发布后用户迎来高速增长 ,智谱对Coding Plan先后进行了限售、涨价等动作。
这些模型聚焦于提升编程能力和智能体任务的自动化水平,这两大能力让AI的应用场景从私人化娱乐向生产环境转变,专业开发者的token消耗远比普通对话密集,这类需求一旦被激活 ,带动的调用增量随之大幅攀升。
OpenRouter的官方数据证实了这一点,该平台超70%的token消耗量,来自互联网大厂、中大型企业 、专业开发者的生产环境常态化调用 ,这类场景的单次token调用量远超个人用户、小型测试项目等 。官方确认,过去数周内,平台长文本生成需求显著上升 ,在100K至1M token区间,MiniMax M2.5的调用量处于领先位置,这个区间正是智能体工作流的典型消耗场景。
可以说 ,这轮token消耗量爆发,直接反映出大模型发展的新趋势,AI正从“快思考”走向“慢思考 ”、从“工具”走向“劳动力” ,各大AI前沿公司力研的智能体功能正属于“慢思考 ”的范畴。
当模型面对复杂任务(如“写一个电商网站的代码”)时,它不再直接输出答案 。它会先“自言自语”:拆解需求 、设计架构、编写函数、检查bug、优化性能,因为AI开始“在脑子里反复推演 ”。每一次推演 、每一步逻辑链的建立,都在消耗token。这种“推理密度”的增加,使得token消耗的增长速度远远超过了用户数量或提问次数的增长速度 。
中信证券称 ,AI应用场景从简单对话,向多模态(文本/图像/音频/视频)、AI智能体升级,单次任务token消耗呈指数级上升。该机构认为 ,token的爆发式增长,本质上反映出AI推理需求的指数级扩容。
华泰证券此前预测,随着推理范式变化 ,智能体加速落地,未来算力需求中存在两个倍数关系,共同决定了算力需求的广阔空间:
1)推理和token调用量之间不是线性关系 ,这是因为多智能体协作和多工具调用会带来token消耗量加速增长;
2)算力需求与token的增长之间不是线性关系,这是因为随着推理过程更加复杂,同样算力条件下计算时间也将增长 ,实时性和交互性带来对计算速度的要求。
该机构认为,与Chatbot相比,智能体在执行任务时会进行任务的分解与编码,将带来交互次数、任务复杂度 、使用频率的提升 ,整体token消耗或提升十倍以上,而对应的算力需求将增长百倍以上,长期看好算力需求的持续快速增长 。
(文章来源:财联社)
实盘股票杠杆平台有哪些:十大配资平台app下载-中办、国办印发《关于进一步保障和改善民生 着力解决群众急难愁盼的意见》
正规股票平台排行:实盘配资app-最强性价比?MiniMax开源推理模型M1:支持最高百万上下文输入
十大配资平台app下载:免息配资公司-段永平接受王石访谈:随时准备逃就是在投机 80%以上的散户“牛市”“熊市”都亏钱
网上股票开户:十大配资平台app下载-个人消费贷贴息“延期扩围”已满月 部分银行春节投放同比多增
十大配资平台app下载:股票配资常识-新一轮牛市已在路上?华尔街纷纷给美股定下高目标价
线上实盘配资:十大配资平台app下载-7月8日涨停复盘:75只股涨停 新亚电子8天4板
还没有评论,快来说点什么吧~