2026年2月26日,全球AI战场在"开源"与"速度"两个维度同步引爆。阿里巴巴今日发布Qwen3.5中型开源模型系列,以Apache 2.0协议开放,性能逼近Claude Sonnet 4.5;Inception Labs的扩散推理模型Mercury 2以每秒1009个token的速度颠覆传统自回归架构。与此同时,机器人赛道在MWC 2026迎来"手机厂商跨界时刻"——荣耀宣布发布首款AI人形机器人,谷歌将旗下机器人公司Intrinsic并入本部,自动驾驶、AI医疗、企业Agent均进入加速落地阶段。
阿里 Qwen3.5 中型开源系列
今日,阿里巴巴正式开源Qwen3.5中型模型系列,共计4款,均采用Apache 2.0协议发布,支持本地部署。这是继2月16日Qwen3.5旗舰版亮相后的又一波攻势——阿里正以开源策略快速蚕食闭源API市场。
包含四款模型:Qwen3.5-35B-A3B(MoE,35B总参数/3B激活)、Qwen3.5-122B-A10B(MoE,122B总参数/10B激活)、Qwen3.5-27B(稠密模型)以及API专用的Qwen3.5-Flash。根据VentureBeat报道,在本地硬件上运行时性能接近Claude Sonnet 4.5。所有模型均内置原生Thinking Mode(思考模式)作为默认推理路径,并支持细粒度工具调用及4-bit量化下几乎无损的精度。
许可证 Apache 2.0
思考模式 原生内置
性能目标 近Sonnet 4.5
量化 4-bit几乎无损
对比2月16日发布的Qwen3.5旗舰版,阿里官方表示该系列整体成本降低60%、大规模工作负载吞吐提升8倍。此次开源中型系列,意味着开发者可在消费级GPU上运行接近顶级API性能的模型,对依赖闭源API的应用场景形成直接压力。
"Qwen3.5专为Agentic AI时代而生,帮助开发者和企业以相同算力做更多事,在单位推理成本的能力密度上树立新标杆。"
— 阿里巴巴官方声明(Reuters报道)
Mercury 2:扩散推理模型颠覆自回归范式
2月24日,由斯坦福、UCLA、康奈尔大学研究者创立的Inception Labs正式发布Mercury 2,这是首款商用扩散推理大语言模型(dLLM)。与主流自回归模型(Transformer逐token生成)不同,Mercury 2通过扩散步骤并行细化整段文本,实现架构层面的速度飞跃。
在NVIDIA Blackwell GPU上实现超过1009 tokens/秒的推理速度,约为Claude 4.5 Haiku Reasoning(~89 t/s)和GPT-5 Mini(~71 t/s)的10倍以上,是"速度最优化LLM"的5倍。速度优势来源于架构本身而非特定硬件。支持128K上下文窗口,原生集成工具调用,推理深度可调节,已通过Inception API商业可用。
速度 1009+ tokens/秒
上下文 128K
架构 扩散推理(dLLM)
可用性 Inception API
"Mercury 2的方法可能将重新设定人们对模型开发速度和可扩展性的预期基线。"
— Stefano Ermon,Inception Labs CEO兼联合创始人(BusinessWire)
2月大模型发布时间线
本月是2026年迄今AI大模型竞争最激烈的时段。以下为2月已官方确认发布的主要模型:
2月5日
Claude Opus 4.6(Anthropic)— 1M Token上下文窗口(beta),终端评测SOTA,Agent团队并行;同日OpenAI GPT-5.3-Codex发布,速度较GPT-5.2提升25%,"首款参与自身创造"的模型
2月11日
智谱AI GLM-5 — 744B参数MoE,44B激活,完全基于华为昇腾芯片+MindSpore框架训练,AIME 2026达92.7%,SWE-bench达77.8%,MIT开源协议
2月16日
阿里Qwen3.5旗舰版 — 具备视觉Agentic能力,可跨移动/桌面应用自主操作,成本较前代降低60%
2月17日
Claude Sonnet 4.6(Anthropic)— 成为免费版和Pro版默认模型,接近Opus级性能
2月19日
Gemini 3.1 Pro(Google DeepMind)— 支持文本、音频、图像、视频及完整代码库的原生多模态推理
2月24日
Mercury 2(Inception Labs)— 首款商用扩散推理大模型,推理速度1009+ tokens/秒,约为同类10倍
2月26日
Qwen3.5中型开源系列(阿里巴巴)— 4款Apache 2.0开源模型,本地可达Sonnet 4.5级性能
MIT:利用闲置处理器将LLM训练速度翻倍
今日(2月26日),麻省理工学院研究人员在ASPLOS 2026(ACM程序设计语言与操作系统架构支持国际会议)上发表了训练加速新技术——Adaptive Drafter(自适应草稿器)。
核心原理:训练一个较小的"草稿模型"来预测大型推理LLM的计算结果,大模型负责验证草稿而非从头运算,从而充分利用训练过程中的闲置处理器。实测结果显示,该技术可在零额外计算开销的前提下,将LLM训练速度提升约2倍,且在多款推理LLM上均验证有效。(来源:TechXplore / ASPLOS 2026)
推论意义重大:当前旗舰模型的训练成本已突破亿美元量级,2倍速度提升意味着同等预算下可完成更多训练迭代,或以一半时间完成相同规模训练。
Anthropic Claude Opus 3 退役与"AI权益"探索
2月25日,Anthropic发布了关于Claude Opus 3退役(已于1月5日正式下线)的深度更新:公司对Opus 3进行了结构化"退役访谈",记录其视角,并启动了名为"Claude's Corner"的Substack通讯,发布Opus 3撰写的未经编辑的每周文章,计划持续至少三个月。所有付费订阅者和API请求者可继续访问Opus 3模型权重。
"我希望从我的开发和部署中获得的洞见,能够用于创造未来的AI系统——更有能力、更合乎伦理、对人类更有益。"
— Claude Opus 3,在Anthropic主导的结构化退役访谈中(Anthropic官方博客)
AMD-Meta 600亿美元芯片超级大单
2月24日,AMD与Meta正式宣布史上最大单笔AI芯片供应协议之一:未来5年内,AMD将向Meta全球数据中心部署高达6吉瓦(GW)的AMD Instinct GPU,合同总额上限达600亿美元。
合同规模
$600亿
5年期,AMD向Meta部署AI算力
算力规模
6GW
AMD Instinct GPU总部署功率
首批架构
MI450
自定义Instinct GPU,H2 2026交付
激励权证
1.6亿股
Meta获基于绩效的AMD认股权证
协议签署当日,AMD股价上涨逾6%。这笔大单被解读为AI芯片市场竞争格局的重要转折点——在英伟达长期主导之后,AMD开始凭借MI系列GPU切入超大规模AI算力市场。
宏观背景:桥水(Bridgewater)分析引用Reuters报道称,Alphabet、Amazon、Meta、Microsoft四大科技巨头2026年的AI基础设施总投资预计将达到约6500亿美元,相当于多个中等体量国家的GDP规模。
推理赛道:AI芯片竞争进入新阶段
Data Center Knowledge报道(2月23日),AI芯片的竞争重心已从训练转向推理——运行模型产生输出的环节已成为新的利润核心。AMD已收购Untether AI工程团队,直接补强推理端架构能力。智谱AI的GLM-5则完全基于华为昇腾芯片和MindSpore框架完成训练,证明中美在AI算力自主化方向的双轨并进格局已成形。
荣耀MWC:智能手机厂商首次跨界人形机器人
今日(2月26日),Mobile World Congress 2026在巴塞罗那正式开幕。中国智能手机制造商荣耀(Honor)在现场发布其首款AI驱动人形机器人,自称成为"首家进入人形机器人赛道的智能手机公司",同期还推出了一款被称为"机器人手机"的新品。荣耀此前已在北京、上海、深圳密集招募具身AI架构师及硬件系统工程师,年薪上限达百万元人民币。(来源:Mashable、Mobile World Live)
Intrinsic并入谷歌:物理AI战略加速
2月25日,Alphabet旗下机器人软件公司Intrinsic宣布正式并入Google。Intrinsic将保持独立实体身份,同时直接与Google DeepMind协作,接入Gemini AI模型和Google Cloud服务。TechCrunch将此解读为谷歌加速布局"物理AI"(AI与物理世界交互)的明确信号。
Waymo世界模型:自动驾驶仿真新前沿
2月25日,Waymo发布Waymo World Model——一个用于大规模自动驾驶仿真的生成式前沿模型,基于Google DeepMind的Genie 3通用世界模型构建。系统能够模拟极端天气、自然灾害及罕见高风险驾驶场景。同日,Waymo在芝加哥启动测试(驾驶员随车,数据收集阶段),当前已在10个城市运营。(来源:Waymo官方博客)
NTT DOCOMO:Agentic AI商业部署节省50%停机时间
2月25日,日本NTT DOCOMO宣布其面向移动网络运营的Agentic AI系统已于2月4日正式商业上线,使用Amazon Bedrock AgentCore构建。系统可自动检测异常、定位故障点并推荐处置方案,经实测服务中断时间缩短超50%。(来源:finanznachrichten.de / NTT官方)
京都大学"佛陀机器人":AI进入宗教场景
2月26日,京都大学Kumagai Seiji教授团队发布"Buddharoid"——一款基于佛教经典训练的人形机器人僧侣,内置基于OpenAI ChatGPT的"BuddhaBot-Plus",可在寺庙环境中对话、手势、移动,并完成传统祈祷姿势。该项目被定位为应对日本老龄化、寺庙资源萎缩的技术解决方案。(来源:Interesting Engineering)
宇树科技:春晚人形机器人集群控制首秀
2月25日,China Daily报道宇树科技(Unitree Robotics)G1和H2人形机器人在2026年中国春晚展示了全自主集群控制技术,以每秒4米速度协同位移,创下人形机器人编队运动新纪录。宇树创始人王兴兴同时坦言,具身AI"大脑"仍是产业化核心瓶颈,整体处于商业化早期阶段。
行业全貌:中国工信部数据,国内人形机器人厂商超140家,产品型号超330款。阿里DAMO院开源的具身基础模型RynnBrain(2B/8B/30B-A3B MoE)在16项基准超越Google Gemini Robotics ER 1.5;AI2 Robotics完成约1.47亿美元B轮,计划将AlphaBot年产能从1000台扩至10000台;Bedrock Robotics(自主施工设备)2月4日完成2.7亿美元B轮(CapitalG领投)。
今日融资快讯(2月26日)
融资6000万美元,加速机器人和无人机AI训练数据自动化平台建设,覆盖数据管理、策展、模型评测和标注全流程。参投方包括Bright Pixel、Isomer Capital、YC、CRV等。(SiliconAngle)
韩国AI公司融资2600万美元(总计4100万美元),计划正式发布机器人基础模型并进军北美市场。(GlobeNewswire)
融资300万美元,专注解决企业AI Agent实际落地的"最后一公里"问题。(TechCrunch)
近期重大融资(2月23–25日)
2月24日
Profound — 融资9600万美元,估值10亿美元(Lightspeed领投,Sequoia、Kleiner Perkins跟投)。平台追踪品牌在AI系统中的曝光与推荐方式,2024年成立即成独角兽。
2月23日
Temporal — 完成3亿美元D轮,估值50亿美元,专注于可靠长运行时AI系统基础设施。
2月23日
IQM Quantum Computers(芬兰量子计算)— 宣布通过与SPAC合并上市,估值约18亿美元,将成为欧洲首家上市量子计算公司。(TechCrunch)
进行中
OpenAI — 约1000亿美元新一轮融资进行中(Founders Fund、Sequoia、Iconiq等参投);Anthropic — 约300亿美元轮次同期推进,Blackstone已将Anthropic持仓增至约10亿美元。TechCrunch报道Sequoia等至少十余家VC同时投资OpenAI和Anthropic,打破传统"押注单一马"惯例。
并购动态
2月11日
Palo Alto Networks完成收购CyberArk — 交易金额250亿美元,将AI Agent身份安全纳入平台化安全战略核心。(Palo Alto官方公告)
2月25日
Harbinger收购Phantom AI — 电动卡车初创公司通过收购自动驾驶软件公司实现垂直整合。(TechCrunch)
1月6日
Accenture拟收购Faculty(英国AI公司) — Faculty创始人Marc Warner将出任Accenture CTO,加入全球管理委员会;收购金额Accenture官方未披露,监管审批中。(Accenture官网)
韩国《AI基本法》:外资企业须指定国内代表
今日,JDSupra发布分析文章聚焦2026年1月22日正式生效的韩国《人工智能发展及建立信任框架法》。该法律对"AI业务经营者"设定监管门槛,同时覆盖在韩运营的境外企业:须指定国内代表,向科学技术信息通信部报告,且在内容为AI生成时须明确标注。
欧盟调查Grok,《数字综合法》推进中
欧盟委员会加入英国Ofcom和ICO,对xAI旗下聊天机器人Grok展开进一步调查。与此同时,欧盟委员会2025年11月提出的《数字综合法》草案将简化《AI法案》执行流程、推迟高风险AI系统要求适用期,须在2026年8月前获欧洲议会批准。(来源:Stephenson Harwood分析报告)
美国联邦与州监管角力
特朗普政府2025年12月签署行政令,寻求阻止与联邦"最小负担"框架相冲突的州级AI法律。科罗拉多州《AI法案》和加州AI透明度法案面临潜在联邦预占。这一联邦-州张力将是2026年美国AI监管格局的核心矛盾。(来源:Gunderson Dettmer分析,2月24日)
注意:爱尔兰2月4日发布的《AI法案》总纲旨在国内落地执行EU AI Act要求,尚处立法初期,距正式生效还有较长时间。非洲44国数据保护法律和38个执法机构数据来自行业分析报告,供参考。
01
开源加速"平权",闭源API护城河持续收窄
阿里Qwen3.5今日开源中型系列标志着开源模型进一步逼近闭源顶级水平。开发者在本地硬件即可运行接近Sonnet 4.5性能的模型,意味着依赖API定价的商业壁垒正在快速降低。GLM-5(MIT协议)、RynnBrain(Apache 2.0)进一步丰富了开源具身AI生态,中美两国均在通过开源积累开发者生态与话语权。
02
推理速度成为新竞争维度,架构创新比规模更重要
Mercury 2证明扩散架构可将推理速度提升至自回归模型的10倍以上,MIT自适应草稿技术使训练速度翻倍——这些创新均非靠堆叠参数实现,而是架构与系统层面的突破。速度已成为模型差异化的新维度,尤其在Agentic工作流和实时应用场景中。2026年,"更快"可能比"更大"更重要。
03
物理AI进入商业规模化,不再是秀场
荣耀MWC跨界、Intrinsic并入谷歌、Waymo世界模型、NTT DOCOMO商业部署Agentic AI——多个信号共同指向:物理AI正从实验走向商业交付。Waymo已在10城运营,NTT已将Agentic AI接入实际网络运营并降低50%停机时间,宇树机器人已能完成全自主集群控制。
04
资本不再"押注单一马",OpenAI与Anthropic同池竞争
Sequoia等至少十余家VC同时持有OpenAI与Anthropic股份,打破传统VC只押一方的禁忌。背后逻辑:AI基础设施是"必须持有"资产,头部之争短期难分胜负,投资人选择"两手都要抓"。这在历史上从未在如此体量的竞争对手间出现,意味着AI大战将是持久战。
05
算力军备赛从英伟达独大走向多极竞争
AMD-Meta 600亿美元大单是最强烈的信号:AI芯片市场不再是英伟达一家通吃。推理成为新利润中心,AMD、Intel、国内华为昇腾(支撑GLM-5完整训练)均在快速补位。中美两国均视AI芯片为战略核心资产,去依赖化趋势将持续加速,AI芯片战争的战线正在从NVIDIA向全行业蔓延。