电话: 邮箱:
诚 朴 雄 伟   励 学 敦 行 SINCERITY · SIMPLICITY · STRIVING · PRACTICE

天天德州app

天天德州APP

天天德州app中国网入口 OpenAI 硬件自在东谈主的闭门共享,向咱们揭示了为什么硬件「极端」仍是智高东谈主机

发布日期:2026-05-09 22:52 来源:未知 作者:admin 浏览次数:

「你必须为模子将要去的标的遐想硬件,而不是为今天的模子。」

裁剪|靖宇

昨天,当 OpenAI 作念智高东谈主机的具体规格与供应链爆料发布时,我第一响应不是「他们要作念手机了」,而是「OpenAI 最终也不得不踏出这一步」,同期想起两周前 Richard Ho 在 Stanford 那场相通。

Richard Ho 是 OpenAI 的硬件自在东谈主,从 Google 作念 TPU 出来。

那场在 IEEE 里面组织的相通上,他莫得讲过一次「手机」这个词。但把昨天的新闻和他那时说过的话放在整个看,整条旅途其实一经被讲得很明晰——仅仅那时莫得一个具体的居品形态来锚定它。

OpenAI 作念手机这件事,在外界看来像一次跨界。但顺着 Richard Ho 那场相通的逻辑往下推,你会发现这是一条早就铺好的路。

毕竟对于统统模子厂商来讲,手机都仅仅极端之一,不是最先。

模子的下一次「跃迁」,出身自硬件

那场相通的中枢,是对于 OpenAI 为什么必须我方作念硬件。

Richard Ho 反复强调的一句话是:「确凿的限度不再仅仅模子,而是算力、能耗、老本、延迟,是整个系统。」

听起来像一句粗俗的手艺述说。但放在 OpenAI 的位置上,这句话的重量皆备不一样——它意味着这家公司一经不把我地契纯行为一家模子公司。

GPU 是为通用并行缠绵遐想,在推选系统、传统的并行任务,跑得很好。

但面临今上帝流的 Transformer、agent、长高下文推理,其实一经偏离了 GPU 当初的遐想假定。尤其是 agent ——多轮、赓续推论、跨任务协同,整个系统层的低效会被放大许多倍。Richard Ho 那时的原话是:「GPU 把咱们带到了今天,但它并不是为这种(AI 负载任务)而遐想的。」

这句话背后的含义其实是:连接依赖 NVIDIA 所设定好的硬件旅途,OpenAI 遥远没宗旨把模子推到下一个量级。不是说 GPU 不行用,而是说在能耗、老本、后果这些维度上,OpenAI 无法一直被迫地接管外部的硬件节拍。

是以这件事的内容从一开动就不是「OpenAI 参预芯片 / 硬件行业」,而是 OpenAI 想再行拿回 AI 运行的底层阻挡权。

淌若只看媒体报谈,你会觉得 OpenAI 在作念的事情是「拼装一台手机」大概更深远一些的「自研一颗 AI 芯片」。但 Richard Ho 我方透露得很告成:「咱们不是在作念一颗芯片,而是在作念一个系统。」

这个「系统」包括芯片、机架、网罗、电力、散热、数据中心——和 Google 当年作念 TPU 的旅途很像,但更强调端到端的阻挡。

程度的部分有点出乎我预感。Richard Ho 说团队是从零搭起来的,但「两年时分一经从空缺走到 tape-out(芯片遐想完成委用流片坐褥)」,况兼一经有芯片在真实 workload 中跑了——他特别强调这不是纸面上的数据,而是「一经在真实环境里 work 的东西」。

两年从零到 tape-out 是个什么主张?传统芯片公司从架构到流片,五到七年很平日。Google TPU 第一代用了苟简三年,而且是有 Jeff Dean 这种基础要津大牛背书、又有 Google 里面完竣的工程协同体系作相沿。OpenAI 能作念到两年——背后只然则两件事:要么是从 TPU、Apple、Google 等公司挖了大都一经锻真金不怕火的硬件团队(这是事实),要么是 Broadcom 这类互助方在底层 IP 上提供了很是大的维持(这也部分是事实)。

但更值得说的是 OpenAI 和硬件供应商之间的关系领域。

「他们会参与 IP、physical design、packaging。」Richard Ho 谈到 Broadcom 时说得很克制,紧接着补了一句——「他们并不看到完竣的架构。」他还专门证明,「许多时候他们只看到一部分,但看不到举座是若何拼起来的。」

这句话其实线路了 OpenAI 自身的一个判断:架构层和工程层是两件事,前者必须皆备抓在我方手里。Broadcom 提供的是模块和制造才能,系统级的遐想逻辑——也等于「这颗芯片到底要若何和模子配合」这件事——必须留在里面——就像苹果作念硬件的逻辑一样。

Richard Ho 提到,外界看到的模子是几个月发布一次,但里面其实是一条贯穿的 pipeline ——「咱们能看到接下来 6 到 9 个月模子会若何变」。

这句话才是整段最重要的。它意味着 OpenAI 的硬件团队不是在为今天的模子遐想芯片,而是在为还没出现的模子「贪图」遐想。

具体到细节上,这种「上前看」会影响许多决定:模子对内存压力的变化会告成决定 HBM 应该用 8-high、12-high 照旧 16-high;网罗带宽要扩到几许;新的 compression algorithm 出现会不会改换数据流的体式;inference 和 training 的比例正在快速变化(推理负载越来越重),这对硬件的条款又是另一套。

Richard Ho 把这少许总结成一句话:

「你必须为模子将要去的标的遐想硬件,而不是为今天的模子。」

这等于 OpenAI 的芯片和 NVIDIA、AMD 的根底不同之处——它不是一颗对外售售的通用 GPU,而是高度贴合 OpenAI 自身模子旅途的、险些一双一定制的系统。从这个角度看,OpenAI 作念芯片更像 Google 作念 TPU,而不是像 NVIDIA 作念 H100。

但即便如斯,硬件优化的天花板远莫得到。Richard Ho 反对「晶体管跳跃变慢,是以芯片红利终了」这个结论。他的判断是:单颗芯片如实在变慢,但整个系统层面还远远莫得被优化好。memory hierarchy、networking、data movement ——这些大瓶颈都没解。他举的例子很具体:当今高速 copper 互联在高带宽下只可维持苟简 2 米的距离,这对数据中心布局短长常大的限度。

浅薄说一句:OpenAI 在作念的事情不是把一颗芯片作念得更快,而是把整个 AI 缠绵系统再行优化一遍。

手机这件事,是这个系统的最结尾。

「手机不是为 agent 遐想的」

回告成机。

Richard Ho 在那场相通上有一句话,今天回头看险些等于 OpenAI 作念手机的全部意义——「手机不是为 agent 遐想的」。

「今天的手机交互是 app-based、session-based 的,你开放一个 app,作念一件事,关掉。但 agent 需要的是赓续存在、赓续推论、跨任务协同。一个确凿的 agent 不会等你开放它再开动责任,它会在后台一直知晓你的气象、调治你的任务、跟其他 agent 通讯。」

这种交互范式,告成等同于在说:今天的 iOS 和 Android 都不是为它遐想的。

这等于为什么 OpenAI 必须我方作念。Richard Ho 的判断是「翌日不是 cloud-only,也不是 edge-only,而是两者聚首」——个东谈主高下文、秘籍数据、低延迟交互必须在设立端,复杂推理留在云霄。淌若一个 agent 想随时拿到用户的「当下气象」,它必须在操作系统层有完竣权限。

这件事在 iOS 和 Android 上很难干净地作念——不是手艺问题,天天德州app中国网入口是利益问题。Apple 不会把系统级权限皆备开放给一个第三方 agent,Google 也不会。

亦然从这个角度,客岁 OpenAI 收购 Jony Ive 团队臆测的公司(io)的逻辑就明晰了。Richard Ho 说,作念端侧个东谈主设立这部单干作「是现时最故意料的一块」——因为这是第一次把基础要津和销耗电子设立确凿接在整个。

这其实是 OpenAI 整个硬件策略里最有遐想力的部分,亦然最危急的部分。有遐想力是因为它在作念 Apple 当年没作念的事:用 AI agent 把操作系统重写一遍。危急是因为销耗电子是另一套游戏规章——居品节拍、供应链、零卖、品牌——不是从云霄工程师团队里能长出来的才能。

但 io 的存在管制了一部分问题。Jony Ive 不是来作念芯片大概操作系统的,他是来作念硬件形态和工业遐想的——这原本等于 Apple 这些年从 OpenAI 手里能褊狭保住的终末一块地。

不是统统 AI 公司都在作念团结件事

销耗电子的难度有多大,看昔日两年其他 AI 公司在硬件上的尝试就明晰了。

每一家都想用 AI 再行界说某个硬件形态。但每一家走的旅途不一样,收尾也很不一样。

最早的是 Rabbit R1。

2024 岁首的 CES 上,吕骋拿出那台橙色小盒子,喊出「干翻统统 App」——用 LAM(大动作模子)替代手机里 App 的交互口头,一句话订外卖、打车、订机票。那时激励的温雅度堪比「AI 期间的 iPhone 时刻」,开售两周卖出 5 万台。

但首批用户体验出来之后,事情翻得很快。先是被开采者证据是套壳安卓—— Rabbit OS 实践上是 AOSP 的修改版,APK 不错告成装到 Pixel 6a 上跑。LAM 被发现依赖 OpenAI 的 API。续航 4 小时,订一次外卖要试十几次。

Rabbit 失败果真凿原因不是居品性量,而是旅途——它只作念了硬件壳子,没碰底层。芯片是联发科 Helio P35(初学手机水平),系统是套壳 Android,模子靠第三方 API。这种作念法的天花板很显然:你作念的事情,一个手机 App 都能作念,而且作念得更好。

Meta 选了一条皆备不同的路。

Meta 的判断是不挑战手机这个形态,让 AI 借眼镜这个一经存在的硬件形态参预日常。Ray-Ban Meta 作念对了三件事:找 EssilorLuxottica(雷一又母公司)作念互助方,让眼镜顾忌眼镜本人——前锋、轻、舒坦;把 AI 作念成「附加项」,299 好意思元起售;不彊求每个用户都用 AI,先把一副好眼镜卖出去,AI 是 bonus。

收尾是 Ray-Ban Meta 卖出杰出 200 万副,Meta 一家拿下民众智能眼镜阛阓 75% 以上的份额。

但这条路的领域也明晰—— Meta 管制的是「AI 若何参预日常」这个问题,不是「AI 若何再行界说缠绵」这个问题。眼镜仅仅一个加了录像头和麦克风的进口,它不会替代手机,也没盘算替代。

阿里千问基本上是 Meta 旅途的中国版块。本年 2 月 MWC 发布、3 月 G1 系列发售(国补告成价 1997 元起)、4 月 S1 上市(国补告成价 3499 元),节拍很快。逻辑也透露:千问 App 一经作念到超 3 亿月活、8000 万 DAU,眼镜是把 AI 助手才能从手机蔓延到日常佩带形态——支付宝、高德、淘宝、飞猪一整套阿里生态都接进来,用户对眼镜说「点外卖」「打车」「翻译」就能处事。芯片是高通骁龙 AR1,系统在 Android 之上,模子用千问。

千问眼镜内容上是一次生态蔓延,不是底层重构。它的上风是阿里生态鼓胀厚,眼镜成为阿里 AI 服务的一个新进口。

把这三条路放在整个看,再对比 OpenAI ——你会发现 OpenAI 是独逐一家在作念「全栈再行界说」的公司:

Rabbit 想绕过 App 但没动操作系统,收尾是空中楼阁;Meta 遴荐不挑战手机,让眼镜作念副角,作念对了爆款但天花板等于副角;千问奴婢 Meta 的形态遴荐,把眼镜作念成 AI 服务的蔓延进口;而 OpenAI ——从芯片、基础要津、动力、操作系统、设立一齐买通。

这是另一个量级的事。

确凿的护城河,不在模子层

那场相通的终末,Richard Ho 还给了一句对翌日口头的判断:

「(模子公司)不再是在芯片层赢,而是在系统层赢。」

这句话的意料是,翌日的 AI 竞争不仅仅模子才能的竞争,而是整套系统才能的竞争——相通的功耗下能提供几许缠绵、能服务几许用户、延迟能压到多低。这种系统级的上风,单靠模子本人是没法替代的。

放在 OpenAI 的位置上看,这是一种很是自洽的逻辑:模子团队在 GPT、o 系列、agent 这些方朝上往前推,但一朝推到某个体量,模子本人的跳跃就要被基础要津的瓶颈限度住。是以 OpenAI 必须从模子公司造成基础要津公司——再造成设立公司。

这亦然为什么 Richard Ho 在被问到翌日算力领域时,给出的数字是 20GW。把 OpenAI、Oracle、SoftBank 等互助方的经营加起来,翌日需要的算力苟简很是于十几到二十个核电站的发电量。

这个数字第一次听到的时候我没响应过来。20GW 一经不是数据中心能管制的问题——它是国度电网和动力政策的问题。Richard Ho 我方也说,「当你开动谈这种领域,就必须谈电力,致使是国度安全」。

把这件事和「OpenAI 作念手机」放在整个看,才能看明晰整个图景:一边是国度级别的动力基础要津,一边是用户兜里的一台设立,中间是一整套自研的芯片、系统、操作系统。OpenAI 想作念的,是把这两头连起来。

把统统的点串起来——模子、基础要津、自研芯片、动力、edge device、操作系统——会发现 OpenAI 作念手机不是一个单点决议,而是这条旅途当然长出来的收尾。

手机仅仅第一个被外界看见的形态。但确凿的变化是更下面的那一层:缠绵范式正在从 app 为中心,转向 agent 为中心。

一朝默许进口造成 agent,今天的设立、芯片、操作系统,都会被再行界说一次。

这一次再行界说里,OpenAI 不再仅仅一家作念模子的公司。

* 头图起原:AI 生成

极客一问

当 agent 成为默许进口,

今天的操作系统会被重写吗?天天德州app中国网入口

幸运5星彩app官方手机版