微软的AI策略
作者: Ben Thompson(Stratechery) 原文: The Nvidia AI PC, Project Solara, Microsoft AI
我通常不会提前透露采访对象,但这周要破例了,因为主题和下面的更新内容关系太大。我是在旧金山写的这篇,刚刚在微软 CEO 萨提亚·纳德拉的 Build 开发者大会主题演讲之后采访了他;一般来说我会想立刻发布采访内容,好让你们有完整的分析背景。
但这次不同——下面这些观点是我在主题演讲期间、在采访之前就形成的,所以出于这个原因(以及一些后勤原因),我想先把它们说清楚(在你看到我的提问之前),之后再跟进纳德拉对这些观点(以及其他许多话题)的看法。
闲话少说,进入正文:
Nvidia AI PC
来自 CNBC:
Nvidia 凭借在数据中心 AI 芯片市场的主导地位,已成为全球最有价值的公司。现在,这家公司正将触角延伸到 PC 主处理器芯片领域——这个竞技场长期以来由英特尔、AMD、高通和苹果统治。 在台湾 Computex 大会的主题演讲中,Nvidia CEO 黄仁勋发布了与微软联合打造的新款 PC 处理器。RTX Spark 超级芯片(黄仁勋也称之为 N1X),将于秋季搭载在微软、戴尔、惠普、华硕、联想和微星的全新 Windows PC 产品线上。
我实际上是周日从台北写起的,黄仁勋在那里发布了传闻已久的 Nvidia PC 芯片。来自 Tom’s Hardware:
在满配状态下,这颗芯片提供多达 20 个 Arm CPU 核心、一颗拥有 6,144 个 CUDA 核心的 Blackwell GPU、128GB LPDDR5X 内存以及高达 300 GB/s 的内存带宽。强大的 CPU 和 GPU 通过 NVLink C2C 互联,加上巨大的内存池,为 AI 智能体和 1200 亿参数模型提供了充足的算力和空间,据 Nvidia 称可支持长达百万 token 的上下文长度。
我们还没有基准测试数据,但 RTX Spark 看起来和 DGX Spark 大致相当——这是一颗不错的芯片,预填充性能出色,但由于内存带宽较低,解码速度比 M5 Max 慢,CPU 任务性能更是明显落后。
黄仁勋在主题演讲中通过实时视频连线讨论了这颗芯片:
萨提亚·纳德拉: 突然之间,“边缘端无限量智能”这个概念又火起来了。所以 Jensen,也许你可以谈谈你对这个方向的看法——你一直在思考这个问题、谈论这个问题,现在 RTX Spark 真正交付了,我认为这是让 AI 更加无处不在的突破性系统。 黄仁勋: 嗯,这一切始于大约三年前你我之间的一次对话。当时我们在讨论如何打造一类全新的 PC——对设计师和创作者来说堪称惊艳,对人工智能来说同样出色。这种系统不仅拥有处理能力,还有与全球设计软件和创作软件深度整合的软件栈,当然还有我们在 AI 方面做的一切。三年后的今天,我们打造了一颗令人惊叹的新芯片,配合你为 Windows 开发的所有新软件。我们现在有能力在 PC 上运行一个真正的自主智能体了。
这段对话恰好解释了为什么我觉得这颗芯片——乃至 AI PC 整个品类——都相当乏善可陈。三年前我们还处在 ChatGPT 时代,我对本地推理的可能性非常兴奋。然后推理时代(reasoning era)到来了,KV 缓存爆炸式增长(意味着需要更多内存),解码速度的重要性被大幅提升(因为需要生成多得多的 token)。现在我们进入了智能体时代(agentic era),CPU 性能变得至关重要。
因此,本地智能体的理想配置是:强大的本地 CPU + 调用云端进行推理。但 RTX Spark 把大量芯片面积花在了 GPU 核心上——这些核心在算力上不如云端(至少因为内存大小和带宽的差距),却牺牲了 CPU 性能。如果你只是想要一个 2023 年水平的聊天机器人,这颗芯片还行;但在 2026 年,考虑到价格和 Windows on ARM 的软件妥协现实,很难看出它值在哪里。
快进到 Build 主题演讲——开场我觉得非常令人失望。纳德拉简要概述了 AI 堆栈,然后开始谈 Windows,老实说我对那种缺乏愿景和热情的状态相当惊讶。就在那时我恍然大悟:我觉得纳德拉其实和我的观点一致! 当然,一些本地推理不错,但那不是真正重要的 AI 所在的地方。
别忘了,纳德拉对 Windows 没有真正的忠诚。事实上,我把 Windows 时代的终结 归功于他。具体来说,纳德拉没有终结 Windows 这个产品,但他终结了它作为整个公司运转核心原则的地位,转而聚焦于跨平台软件和承载一切的云。
这引出了一个出人意料的结论,也是 Build 主题演讲最有趣的部分:如果微软实际上在 AI 设备领域处于有利位置呢?
Project Solara
来自 GeekWire:
微软内部一个团队一直在悄悄打造一个平台——运行 AI 智能体而非应用程序的设备平台。它基于 Android 而非 Windows,目前已有两款可运行的硬件设计,并且已经签下了一批知名企业来进行试点。这个平台代号”Project Solara”,是微软的一个赌注:AI 将开启全新的计算场景——利用智能体来突破传统软件的限制,用现成的组件来快速、低成本地开发新设备。
需要说明的是,Project Solara 目前仍是概念产品(vaporware),尽管微软确实展示了实物设备,并已签下高通和联发科作为芯片合作伙伴。但它确实极具吸引力。以下是纳德拉的引入方式:
到目前为止,我们谈了边缘和云。现有的这些形态,对吧?我是说,我看到 Jensen 周末发的那张照片——他身后摆满了所有台式机——我感觉自己回到了90年代,因为看到我从小到大热爱的那些机器排成一排,真的太酷了,只不过它们现在有了全新的功能——因为板载 AI 能力,对吧?所以这就是我们在笔记本、台式机以及云端看到的情况。 但这也自然引出了下一个问题:如果你有了这种新功能,可以放进现有的形态里,那你能不能为这种新功能专门设计新的形态?能不能为智能体时代打造一个全新的平台?这就是我们今天推出的 Project Solara 背后的动机。
首先注意这个框架:PC 是承载了智能体的旧技术;那由智能体独特赋能的新技术呢? 再注意经典的微软钩子:这种新技术能不能建立在一个新平台之上?微软应用科学组负责人、公司副总裁 Steve Bathiche 阐释了愿景:
在我谈论你们刚才看到的那些酷炫新设备之前,先说说”为什么”。在 Build 2023 上,我谈过外部 AI 应用架构——AI 从应用程序框架内部运行,转变为全局运行,跨多个应用和服务来连接、协调并维护跨整个工作流、设备和时间尺度的上下文。如果有一个专门为这种新型应用架构、为这类智能体、为这种变革性交互技术而设计的设备生态系统呢?这就是 Project Solara 的出发点。 但面对如此多的可能形态,你该选哪一个?下一个设备是什么?我们最大的顿悟是:不是选择某一个特定的形态,而是创建一个将你的智能体延伸到一系列设备上的系统。下一台电脑不是一台设备,而是所有这些设备作为一个系统协同工作,智能体在你需要的时间和地点出现。
在 Bathiche 出场前的宣传视频中,有一个短暂的画面让我瞬间理解了这个概念:
可穿戴设备的问题在于交互模型:它们只在你与之交互时才有用——需要人类参与循环(in the loop)——但与可穿戴设备保持互动既烦人又低效。然而这里展示的是一次简短交互,然后智能体在后台工作。换句话说,真正有用的部分发生在云端,不需要人类参与,因为智能体在做这些工作。
这就是我觉得它有吸引力的地方。一方面,你可以说微软当然会对一个以云为平台的设备模式感兴趣——毕竟微软不控制 iPhone 这样的移动设备。但我意识到的是,即使微软在 Project Solara 上不成功,这种模式——云是中枢、多设备是辐条,而不是手机作为中心——对智能体来说显然是更好的。智能体在云端运行效果最好,并且跨应用和设备工作;是的,手机可能是其中一个设备,但在智能体的世界里,它不应该是中枢。
再说一次,这是概念产品,非常符合微软的利益,所以对 Project Solara 请保持适度怀疑。然而,这是一个对未来的愿景,确实很有道理——尤其是在企业场景下,所有的上下文和算力本来就在云端(而 Project Solara 聚焦的正是企业,不是消费者)。它也完全不同于过去的任何东西,契合我的论点:在 AI 时代,瘦就是王道(thin is in)。
微软 AI
来自 GeekWire:
微软的 AI 业务在很大程度上建立在 OpenAI 的模型之上,最近又扩展到了 Anthropic。周二,微软展示了它打算如何减少对两者依赖的计划。在 Build 开发者大会上,微软 AI 超级智能团队发布了一系列从零开始构建的七个模型。这是该公司持续推进的一部分努力——在合作伙伴和竞争对手之间利益交错的环境中,建立可信赖的自研替代方案…… 新发布的七个 MAI 模型中的旗舰是 MAI-Thinking-1——一个推理模型。微软称它在盲测人类评估中与 Anthropic 的 Claude Sonnet 4.6 打平,在一个广泛使用的编码基准测试中与更强大的 Claude Opus 4.6 持平。[微软 AI CEO Mustafa] Suleyman 强调,MAI-Thinking-1 是从头训练的——没有从其他公司的模型中蒸馏——以此吸引那些在意数据来源合规性的企业客户。
就能力而言,这些模型看起来还不错。但让我感兴趣的是其定位框架:微软强调企业可以把这些模型变成自己的。Suleyman 说:
这就是端到端拥有完整堆栈的样子。它是微软前沿微调(Microsoft Frontier Tuning)的基础——让你可以在我们的完整堆栈上按你想要的方向定制 MAI 模型。这意味着我们在构建模型过程中投入的严谨而不懈的工程能力,现在通过一个你可以信赖的平台,向你们所有人开放——为你工作,创建你将控制的定制智能体。 过去一年真正发生的大事,是这些 RLE——强化学习环境(Reinforcement Learning Environments)——为你的 AI 打造的专属训练馆。它们创建只为你适配的公司级和任务级智能体,建立在 MAI 模型之上。例如,在微软内部,我们使用 RLE 结合 MAI 模型来优化 Excel 的最佳智能体用例。我们的 MAI 微调模型现在在公开和私有基准测试中与 GPT 5.4 持平,同时成本效率提高了 10 倍。许多其他早期采用者也看到了类似的结果。当我们针对麦肯锡的任务对模型进行微调时,MAI 取得了最高的胜率,甚至超越了 GPT 5.5,而且同样实现了 10 倍的成本效率。所以对我们来说,这就是精心校准的前沿微调的优势。
重要的是,与其他一些公司不同——使用 MAI,你不是从一个为所有人学习的共享模型中租用智能。只有你自己保留你辛苦积累的工作流、专业知识、知识和机构数据的收益。只有你控制生成的模型。所以在我们这里,RLE 和你在其中构建的模型会成为你的护城河。我真的认为这是一个独特的优势。它标志着 AI 的一个新时代,我们都对此非常、非常兴奋。
这和 AWS 的 Nova Forge 服务有异曲同工之处——后者允许企业在预训练的某个检查点加入自己的数据。这里略有不同,更聚焦于强化学习,但这些边界正在模糊。
核心概念是:企业可以拥有自己的模型,用于自己的数据,而不必与那些想吞噬它们午餐的前沿实验室共享。这个概念在理论上当然有吸引力;真正的考验在于,选择这条路的企业是否会因为不在功能最前沿而受到惩罚。话说回来,帮助保守的企业按自己的节奏拥抱未来、而不需要在纯性能上赢——这恰恰是微软长期维持其市场地位的方式。