知鱼
Surviving is nothing to be ashamed of. It's something to be proud of.

《CUBE Pod 113》NVIDIA saves Intel, IBM rings the bell, $CRWD Strikes Back

trylab 发布于 2025-9-27 21:06    31 次阅读

问题意识

背景介绍
英伟达向英特尔投资50亿美元,共同开发CPU和GPU芯片,这一重磅消息在技术界掀起波澜。这究竟是强强联手,还是市场格局重塑的序曲?在AI浪潮席卷全球的当下,芯片巨头间的合纵连横,正深刻影响着数据中心、边缘计算乃至整个企业IT的未来走向。

本期《CUBE Pod》深入探讨了这一历史性合作背后的战略考量,以及它对NVIDIA的CUDA生态、AMD的市场地位、甚至美国政府在半导体领域的布局意味着什么。我们还将触及AI工厂的崛起、物理AI的颠覆性潜力,以及AI如何重塑软件经济和网络安全防御体系。

你是否曾思考,当AI成为核心生产力,传统的商业模式将如何被改写?当数据中心演变为“AI工厂”,其架构和运营将面临哪些挑战?而面对日益复杂的网络威胁,AI又将如何赋能下一代安全运营中心?让我们一同探索这些前沿议题,洞察AI时代的技术脉搏与商业机遇。

阅读收获

  1. 洞察AI芯片市场新动向: 深入理解英伟达与英特尔的战略合作如何巩固CUDA生态,并对AMD等竞争对手构成挑战。这有助于技术决策者评估未来硬件选型和技术栈规划。
  2. 掌握“AI工厂”核心理念: 认识到AI工厂不仅是计算中心,更是数据工厂的集成体,理解其在边缘、混合云环境中的部署模式及对基础设施(如电力、冷却)的深远影响。
  3. 预见AI驱动的商业模式变革: 了解AI如何颠覆传统软件经济,推动“服务即软件”和FinOps的演进,为企业在成本优化和价值创造方面提供新思路。
  4. 探索智能安全运营未来: 学习Agentic SOC(代理安全运营中心)的愿景,理解AI在实现L4/L5级自动化安全防御中的关键作用,为构建更高效、主动的安全体系提供参考。

深度思考

  1. 英伟达与英特尔的合作,是否会加速CUDA成为AI计算领域的“事实标准”,从而进一步挤压开源AI框架和AMD等竞争者的市场空间?长远来看,这会促进还是阻碍AI生态的多元化发展?
  2. 随着“AI工厂”理念的普及,企业在构建自身AI基础设施时,应如何平衡自建(On-premise)与云服务(Cloud Service)的投入,以应对高昂的资本支出和快速迭代的技术需求?
  3. 文章提及“物理AI”和“Agentic SOC”的愿景,你认为在当前技术和伦理框架下,实现L4/L5级完全自主的物理AI系统(如自动驾驶、机器人)和安全运营中心,最大的技术挑战和潜在风险分别是什么?

    👉 划线高亮 观点批注


Main

约翰·弗里尔: 大家好,我是约翰·弗里尔(John Furrier),和大卫·维兰特(David Vellante)一起为您带来《CUBE Pod》第113集。戴夫,今天华尔街(Wall Street)很忙碌,创下了历史新高,向你致敬。

大卫·维兰特: 你好吗,伙计?下周见。

约翰·弗里尔: 是的,我会在那里,一周后。我们有一个大型的AI工厂(AI factory)活动。现在是气候周,所以将会有联合国(UN)的国际观众。许多大人物将来到纽约证券交易所(NYSE),当然我们也会在未来的数据中心(data centers)中推出大量内容。我刚才参加《CUBE Pod》有点晚了,因为IBM在楼里。他们刚刚敲响了收市钟,市场已经收盘。很高兴看到IBM在可持续发展方面获得了大奖。所以我下去稍微寒暄了一下,见到了一些IBM员工,但那也是一个相当盛大的活动,IBM和证券交易所的故事具有历史意义。汤姆·沃森(Tom Watson)在20世纪60年代就关注可持续发展,那时这还不流行,他是一位非常重要的领导者。当然,气候周是下周。很棒。

大卫·维兰特: 我不知道沃森是——

约翰·弗里尔: 显然,我听了IBM客户经理在楼下的演讲,他负责这个客户已经25年了,他们有一个客户经理,可以追溯到——

大卫·维兰特: 哇,那是核时代,当时对任何与核相关的事物都有很多负面情绪。有意思。

约翰·弗里尔: 他们在可持续发展成为一件事之前就已经投入其中了,这是一个很棒的故事。汤姆·沃森(Tom Watson)显然是IBM的传奇人物。但有趣的是,他们谈论IBM是一家老公司的方式。我当时对萨拉·梅隆(Sarah Meron)说,她是IBM的传播主管,高级副总裁,我说:“他们忘了提到华尔街表现最好的股票之一。”所以历史在那里,但他们正在大展拳脚。我们将看看他们的收益如何继续,如果他们的——回来,我们拭目以待。但是的,一切都很好。进展顺利。

大卫·维兰特: 我想谈谈新闻,但我只是——

约翰·弗里尔: 本周令人难以置信的新闻。

大卫·维兰特: 是的,我为什么要谈它,——

约翰·弗里尔: 显然英伟达(NVIDIA)——那是大新闻。——向英特尔(Intel)投入了50亿美元,我必须直接进入核心内容。英伟达向英特尔投资50亿美元,共同为数据中心和个人电脑(PCs)创建CPU(中央处理器)和GPU(图形处理器)芯片。考虑到美国政府(US government)的持股比例,这相当具有战略意义。

大卫·维兰特: 是的。我对此有一些想法。我真的认为这是一个三赢的局面,对吧?对英伟达来说绝对是赢家。这实际上是我们本周“突破性分析”(breaking analysis)的主题。约翰,你想先过一遍交易要点吗?还是说这有点多余?你听到了吗?

约翰·弗里尔: 是的,想过一遍交易要点吗?是的,等等,我把耳机戴回去。

大卫·维兰特: 好的,所以这次合作的范围是英特尔和英伟达将开发联合定制芯片,融合x86(x86架构)与英伟达GPU。但实际上,CUDA(CUDA并行计算平台)才是这里的重要部分。目标是数据中心和CPU。在数据中心,它是x86与NVLink fabric(NVLink互连技术),而在PC中,它是与英特尔x86和RTX GPU chiplets(RTX GPU小芯片)共同开发的系统级芯片(SoC)。他们声称每年有1.5亿台的潜在市场机会。正如你所说,英伟达向英特尔投资50亿美元,所以他们获得了股票,这是一个很好的协同。他们声称,目前数据中心和CPU的市场机会是250亿到500亿美元。我认为,他们谈论的是芯片市场,整体市场比这更大,但他们的核心目标是实现最佳的CPU、GPU集成。约翰,我要告诉你,对我来说,这是英伟达的巨大胜利。它进一步标志着接力棒传给了新时代的新领导者,这显然是英伟达。所以我的估计是,它将英伟达的TAM(潜在市场)扩大了至少5000亿美元,也将英特尔的TAM扩大了约1000亿美元。所以英伟达是最大的赢家。英特尔是赢家。我认为市场是赢家。有——

约翰·弗里尔: 每个人都赢了,谁是输家?AMD(超微半导体)?Arm(Arm架构)?

大卫·维兰特: 我认为AMD可能是输家,我对此有一些想法。我完全不认为Arm是输家。我听过,我想是克莱默(Kramer)谈论这个,我就想,“Arm怎么会是输家?”英伟达是基于Arm的,Arm帮助英伟达如此快速地实现流片(tape out),TSM(台积电)也是。所以Arm绝对不是输家。TSM是赢家,Arm是赢家。AMD?我认为AMD将获得指令集(instruction set)的访问权限。我认为他们必须让AMD访问,无论是政府推动。我只是觉得这不公平。如果他们无法访问,那将是一个问题。然后我认为会很有趣,超大规模云服务商(hyperscalers)一方面赢了,因为这意味着更多的业务,因为每个人都在云中进行AI。另一方面,我不知道他们是否会获得指令集访问权限,所以这可能会对他们自己的内部芯片构成巨大竞争。所以我认为他们将不得不继续做更多的业务。但约翰,这里的底线是,这在我看来扩大了英伟达的护城河,因为请记住,英伟达没有庞大的PC业务,其最大的业务是数据中心。所以这让他们能够进入PC业务,同时也为他们进入企业(enterprises)搭建了桥梁。你我曾谈论过企业并没有大量购买英伟达芯片,所有这些都通过云和大型超大规模云服务商以及新兴云服务商(neocloud)进行。所以这在混合架构中融合了x86与CUDA,然后完成了软件兼容性(software compatibility)的工作,就像AWS(亚马逊云服务)让迁移到Arm变得容易一样,通过软件。苹果(Apple)的软件兼容性也是如此。所以对英伟达来说是巨大的胜利,对英特尔来说也是巨大的胜利,尽管他们仍然需要处理晶圆代工(foundry)问题。我很想和你谈谈这个,因为晶圆代工方面真的没什么。也许有一点。显然,SoC的销量会增加,但他们仍然有晶圆代工的包袱。但对英伟达来说是巨大的胜利,对英伟达来说是巨大的胜利,对英特尔来说是巨大的胜利,对客户来说也是胜利,因为他们现在拥有了混合架构,我认为这对整体AI来说也是一个胜利。

约翰·弗里尔: 我认为这对英伟达来说是巨大的胜利。你一语中的。护城河变得巨大,因为我们关于护城河的全部论点是CUDA,他们拥有双边市场(two-sided marketplace)。这实际上,在我看来,减轻了CUDA的压力,因为他们现在可以继续巩固CUDA的竞争优势。DeepSeeK 基本上是为了绕过不使用CUDA而出现的。所以有人说CUDA在行业内部人士看来有很多开销,但这项交易绝对让他们获得了数据中心访问权限(DS 是如何绕开CUDA直接调用GPU底层硬件的?并且还大大提高了使用效率?CUDA真的是性能消耗层吗?)我完全喜欢这一点。它也拯救了英特尔和数据中心团队。所以英特尔巩固了他们的地位。所以这几乎像是一场交易,以这个换那个。英伟达现在通过在数据中心与英特尔一起部署NVLink芯片和互连(interconnects)获得了嵌套性。这本质上就像,可能是不恰当的比喻,但当比尔·盖茨(Bill Gates)通过那笔投资拯救苹果时,还记得吗?

DeepSeek是如何“绕开”CUDA直接调用GPU的?

首先,一个关键的事实是:在NVIDIA的GPU上,任何程序都无法完全绕开CUDA驱动层。CUDA是NVIDIA GPU的编程模型、API和驱动的总称,是应用程序与硬件之间的唯一官方桥梁。

因此,“绕开CUDA”这个说法的真正含义更可能是指 “绕开或取代了高层次的、通用的CUDA库(如cuBLAS, cuDNN),通过更底层的CUDA API编写高度定制化的计算核(Kernel),甚至直接编写PTX或SASS(GPU汇编语言),从而实现对硬件更精细的控制”

这具体可能通过以下几种方式实现:

a. 算子融合 (Kernel Fusion) 这是最核心、最有效的优化手段。在标准的AI框架(如PyTorch、TensorFlow)中,一个复杂的计算(例如y = ReLU(Wx + b))可能会被分解成多个独立的步骤,每个步骤调用一个通用的CUDA核:

  1. torch.matmul() -> 调用cuBLAS库执行矩阵乘法。

  2. torch.add() -> 调用一个独立的核执行加法。

  3. torch.relu() -> 调用另一个独立的核执行激活。

每一步都需要从GPU的全局内存(HBM)中读取数据,计算后,再写回全局内存。这个过程的瓶颈往往不在于计算本身,而在于内存访问

DeepSeek等公司所做的“绕开”,就是自己手写一个融合核(Fused Kernel)。这个核一次性完成“矩阵乘法 + 加偏置 + ReLU激活”的所有操作。数据在GPU的寄存器(Registers)和共享内存(Shared Memory)中流动,只需一次从全局内存读取输入,一次性将最终结果写回。

b. 手写高度优化的CUDA Kernels 对于模型中一些特殊的、非标准的计算,通用库可能没有提供最优实现。通过直接使用CUDA C++编写自定义核,开发者可以:

  • 精确控制线程块(Block)和线程(Thread)的组织方式,使其最适合特定的计算模式和数据尺寸。

  • 最大化利用共享内存(Shared Memory),减少对高延迟全局内存的访问。

  • 精确控制数据类型和精度,例如在不影响模型性能的情况下使用FP16/INT8混合精度。

  • 针对特定GPU架构(如Ampere, Hopper)的特性进行优化,比如更高效地使用Tensor Cores。

c. 使用Triton等更高级的DSL(领域特定语言) 与其完全手写复杂的CUDA C++,现在业界更流行使用像OpenAI Triton这样的语言。Triton是一种基于Python的DSL,它允许开发者用更简洁的语法描述计算逻辑,然后由Triton的编译器自动生成高效、融合的CUDA核。这大大降低了底层优化的门槛,同时能达到接近甚至超越手写核的性能。DeepSeek Coder作为代码生成模型,很可能被训练来生成这种高效的Triton代码。

2. 为何这样能大大提高效率?

效率的提升主要来源于以下几个方面:

  1. 极大减少了内存带宽压力:这是最主要的原因。GPU的计算速度(FLOPS)增长速度远超内存带宽的增长速度。大多数AI计算都是“访存密集型”而非“计算密集型”。通过算子融合,将多次全局内存读写操作压缩为一次,极大地缓解了带宽瓶颈,让计算单元不再“等待”数据。

  2. 减少了Kernel启动开销 (Launch Overhead):每次CPU调用一个GPU核,都有一定的开销(几微秒)。如果一个操作由10个小核完成,就会有10次启动开销。而一个融合后的大核只需要1次,在高并发场景下,这个差距非常显著。

  3. 提升了硬件利用率:手写的定制化核可以更好地安排计算任务,使得GPU的计算单元(SMs)、Tensor Cores、缓存等资源得到更充分的利用,减少空闲时间。

  4. 消除了不必要的抽象和检查:高层框架的通用函数为了安全性和普适性,会包含很多分支判断和错误检查。而定制化的核只包含当前任务所需的最直接逻辑,路径更短,执行更快。

大卫·维兰特: 那很好。苹果现在处于——。现在,我认为英伟达不是一个走向错误方向的微软(Microsoft),但我认为给英特尔的50亿美元礼物以及产品集成,这是硬件(hardware)的东西,这是网络(networking),这是数据中心所需要的。我们全面覆盖超大规模云服务商。这是关键的操作系统(operating system),英伟达嵌套在其中。所以一旦他们嵌套进去,就很难将他们拔出来,根除他们,创新能力将是如此之大。而且这也是我们一直在《CUBE》、CUBE研究和SiliconANGLE上报道的新架构时代的标志,即我们下周将启动的AI工厂系列将涵盖的新数据中心系统,它有点像新的主板(motherboard),对吧?还记得以前PC时代吗?你有总线(buses),你有芯片组(chipsets),你有架构(architecture),内存(memory),架构,I/O(输入/输出),所有这些子系统。好的,这是一个简单的例子。但当你大规模地将英伟达与英特尔嵌套在一起时,它几乎以一种新的方式创造了一个数据中心婴儿。就像你把它们放在一起,这可能是英伟达竞争优势的一个重大阶跃函数变化,拯救了英特尔。所以英特尔接受了这份礼物。我认为AMD会陷入困境,因为他们必须提升他们的GPU游戏,然后还要在数据中心方面竞争,他们在数据中心有很好的存在。所以这确实给AMD带来了压力。我不认为AMD会输,但我认为对AMD来说,比赛才刚刚开始。现在,所有这一切中的不确定因素是美国政府,因为这里的棋局是英伟达投入50亿美元。那么,你猜怎么着?他们都在资本结构表(cap table)上。戴夫,美国政府也是。所以随着中国(China)的事情发生,我们在这里谈论什么?美国公司。所以那里有一点博弈。有人说这是在讨好。我不这么认为。我认为这是英伟达的一项战略举动,表明“看,我们将帮助英特尔。”我们爱英特尔,所以我实际上很高兴。而且黄仁勋(Lip-Bu Tan)也在其中,他也和詹森(Jensen)一起登上了封面。半导体行业(semiconductor industry)的大佬们,就像行业元老(OGs)一样,正在促成这一切。如果你看看英伟达,我们本周采访了Nexla(Nexla数据集成平台)的创始人。他在2000年代初期在那里进行创新。他们当时是一家小公司。看看他们现在在哪里。他们基本上拯救了英特尔。他们是山顶之王。毫无疑问,这是——

大卫·维兰特: ——

约翰·弗里尔: ——这里有太多的故事情节可以解读,但我只是给了你我的主要看法。但我认为这里未被书写的故事是,这对英伟达来说是一个竞争优势,正如你所说的护城河,但特别是在数据中心,这些组件在新架构中至关重要。我认为我们可能至少在12到24个月内都看不到它的成果。但当它出现时,它可能会更快,并且减轻了CUDA的压力,对吧?所以它只是让CUDA本身对英伟达来说变得更棒。所以我认为护城河变得更加多样化和更深了。

大卫·维兰特: 嗯,毫无疑问。从英特尔的角度来看,这是50亿美元的现金,再加上特朗普(Trump)投资的约90亿美元,顺便说一句,那是你和我的投资,或者说是美国纳税人的投资,顺便说一句,我们也在那笔交易中赚了钱,因为它的股票涨幅相当可观。它现在就像一只网红股。所以这让英特尔在开发者和企业IT领域获得了AI相关性,就像CUDA访问一样,我认为你是对的,它只是巩固了CUDA作为标准。尽管我对晶圆代工一直持负面态度,但这至少阻止了x86销量的下滑。我们知道晶圆代工的销量主要由英特尔主导。它是唯一一家拥有晶圆级公司客户的。所以这止住了流血。它甚至可能通过SoC增加了销量,他们仍然需要解决晶圆代工问题。所以我认为这非常积极。从AMD的角度来看,我的意思是,丽莎·苏(Lisa Su)是一位杰出的运营者。我在这方面给予她很多赞扬,他们将在未来几年继续在x86领域增长。但如果你展望2027年、2028年,就会觉得,如果他们无法访问CUDA指令集,那么他们可能会被降级到英特尔之后的铜牌。讽刺的是,AMD一直都是第二——

约翰·弗里尔: 铜牌,那可真够呛的。我不确定那是否真的如此。

大卫·维兰特: 嗯,想想看。嗯,英伟达是金牌。这是我想说的重点。历史上,AMD一直是英特尔的第二供应商,即插即用兼容制造商。现在,你讽刺地看到英特尔成为了英伟达的第二供应商。所以英伟达是金牌,英特尔现在正在争夺银牌,因为CUDA,这可能会把AMD推下去。现在,我认为会发生的是AMD将获得访问权限,政府可能会强制他们获得访问权限。我相信英伟达会对此感到高兴。越多越好,只要他们是山顶之王。但如果他们无法访问CUDA指令集,他们会怎么做?他们正在努力构建自己的软件。他们将拥有开源软件。好的,我们将看看这一切如何发展,但CUDA正在迅速成为标准。

约翰·弗里尔: 我认为,首先,我们应该追踪奖牌榜,因为这值得追踪,我认为这是一个我们绝对应该开始关注的新维度。我仍然认为AMD将是银牌得主,根据我的计算,但我们拭目以待。但我认为如果我是AMD,我认为AMD会加大力度。我认为是时候让他们提高他们在真正的GPU、XPU马力方面的音量了。我一直在与纽约证券交易所(NYSE)有线社区、CUBE社区、我们的社区内部人士交谈。就像AMD还没有摘下拳套一样。所以我不会感到惊讶。他们都相关,所有这些公司,AMD的首席执行官与詹森(Jensen)有亲戚关系,所以他们可能在家庭野餐时见面。所以我认为AMD会赢。所以我不是,我认为他们会赢。

大卫·维兰特: 他们怎么赢?那是什么情况?

约翰·弗里尔: 我认为他们会成为新兴云服务商(neoclouds)的供应商,我认为AMD会增加他们的“公开宣传”,关于他们真正的GPU、XPU马力。这将归结为成本和规模。我本周与一个人交谈,我们当时正在讨论DeepSeeK以及为什么DeepSeeK能在所有那些旧GPU上运行成功,因为他们试图逆向工程并在没有CUDA的情况下大规模运行。结果发现CUDA是所有成功的瓶颈。所以DeepSeeK的创新是因为他们想从中消除CUDA。所以事实证明,当你去除CUDA的开销时,你实际上可以在较旧的GPU上运行等效的马力和规模。所以这告诉我,存在一种设备处理器、芯片、互连、织物的配置或架构,如果配置得当,实际上可以像最新最好的Blackwells和最新最好的Superchips一样具有成本效益和可扩展性。这有点夸张,但这是我们两个播客前讨论过的一种情况。我们有点即兴讨论了白盒、蓝盒之类的东西。我看到Arista在投资者会议上也在做同样的事情。对他们所谓的蓝盒,即定制网络,有很大的需求。所以可能存在这种新的组件组合,以制造和构建等效的英伟达系统。现在他们有CUDA,这让他们的东西看起来更好。但如果它是开销,当我说开销时,我不是指像开销,而是DeepSeeK在较差的设备上工作的事实证明他们去除了CUDA。这并没有得到很好的记录。但这是内部人士的观点,即改变趋势并逆向工程CUDA。

大卫·维兰特: 跟我一起推演一下。那么,那将需要某种开源(open source)的CUDA类标准出现,对吧?或者AMD开发自己的CUDA类标准和CUDA类能力,他们可能会将其开源,包括库等。那么时间框架和可能性是多少?我的意思是,开源可以随着时间的推移赶上来。所以我们知道正在进行一些开源计划。所有超大规模云服务商都会喜欢它,每个人都会喜欢它,如果出现CUDA的替代品。我只是觉得CUDA遥遥领先。

约翰·弗里尔: 我不知道,很难说。但如果成本将是一个重要因素,我们将在企业方面讨论,他们没有资本支出(CapEx),如果资本支出派对结束,那么从成本角度来看,这是一个困难的解决方案。所以在我看来,唯一自然会发生的事情是工程师和企业家会想办法在系统中构建等效的价格性能。我们看到了英特尔摩尔定律(Moore's Law)的方式,有点不同但相似,它在每一次革命中都变得更小、更快、更便宜。所以我的想法是这里也会发生这种情况。现在这就是为什么我正在关注开放计算项目(Open Compute Project, OCP)峰会,因为那将是所有组件的所在地,如果你愿意的话?为了更好地描述。当我说组件时,我不仅仅指芯片。机架标准,人们在电源、液体冷却方面所做的一切,所有这些现在都在这些大型数据中心的设计方面。所以资本支出游戏非常重要,同时如果你是英伟达或AMD,资本支出将会枯竭。因为如果你看看正在发生的一些支出,例如OpenAI(OpenAI人工智能研究公司)与Oracle(甲骨文)达成的300亿美元交易,或者AWS,我本周与一位正在构建这些工厂、这些大规模系统的内部人士交谈。关于这方面的内部消息是,像亚马逊(Amazon)这样的公司,一直在做这些事情,拥有大规模数据中心,他们确切地知道他们将在最初的9到12个月内构建什么,几乎达到80%到90%的准确性。这意味着他们知道他们将用这些容量做什么。所以他们为此预算。每年都会下降,它在使用概率上会下降。所以所有这些合同都是后置的,所以它们实际上并没有人们想象的那么大。所以人们认为,“哦,300亿美元”,然后一袋现金就出现了。不,不,不,不,不。他们甚至没有投入等待名单的钱。所以风险正在房地产方面承担,正在银行方面承担。新兴云服务商正在套利已签署合同和银行资金之间的价差。所以我认为在资本支出方面,实际实现的收入将有一个非常有趣的动态。市场认为这很棒。看看订单,积压。嗯,如果我不在北卡罗来纳州建造那个数据中心,那个正在建造的300亿美元数据中心,那么就有人要承担损失。

大卫·维兰特: 对于你的CUDA替代方案情景,确实有一些开源标准,我们知道,但它们有很多,而且它们有点局限于狭窄的用例。也许会有一个出现。我知道高性能计算(HPC)领域有一些东西。我知道一些前沿模型供应商(frontier model vendors)使用了一些AMD推动的替代方案,他们有一些超级计算机的实力。英特尔也在那里做了一些事情。也许他们现在会放弃。所以——

约翰·弗里尔: 还不清楚。还不清楚。我的观点还不清楚。但关于这一点,我想说的是,开源社区实际上会告诉他们要构建什么。我现在就可以告诉你,我坚信企业AI工厂(enterprise AI factory)的故事将会发生。将会有大大小小的AI工厂。还记得阿比·梅塔(Abhi Mehta)在2010年提出的炼油厂比喻吗,数据是新的石油,他使用了炼油厂的比喻?那么,你猜怎么着?你可能需要一些大型炼油厂或工厂。但请记住边缘(edge),边缘计算(edge computing)可能是一个小型数据工厂。所以模型将与数据层解耦,然后应用层将与模型解耦。所以这些数据中心或这些数据工厂,或者说AI工厂,抱歉,我稍后会谈到数据工厂,这些AI工厂将有大有小。现在,我本周采访的一个见解是,没有数据工厂就不能有AI工厂。想想看。所以实际上我在分析什么是AI工厂时错过了这一点?我一直专注于芯片、系统和网络,你实际上必须包含这个假设,即所有AI工厂,戴夫,都将内置一个数据工厂。所以这无疑是我们系列的一个新元素。但是的,它们将有大有小,但我认为不会有那么多大型的。是的,你正在建造大型的怪物数据中心。有些将以这种容量建造。电力将限制一切。但我认为企业将拥有这些AI工厂,它们将是小型、中型和大型的。

大卫·维兰特: 还记得大卫·弗林(David Flynn)有一次说过,“这些企业,他们会花钱来节省集成成本,而超大规模云服务商则会投入工程资源来解决问题。”所以我认为,在我看来,这项交易增加了CUDA的概率,嗯,延长了某些开源的颠覆时间框架。我认为它降低了CUDA被颠覆的可能性。我认为它进一步巩固了其标准。我想说的另一件事是,我想向大卫·弗洛耶(David Floyer)致敬,他和我在今年6月29日做了突破性分析第282期。弗洛耶与我分享了这一点,我将其纳入了我们的突破性分析中:“英特尔应该与英伟达合作,利用英伟达的CUDA标准开发AI、移动、边缘和PC以及工作站设备,并开发一种支持Arm、x86的新混合架构。”它不完全准确,他没有预测到投资,但方向上是正确的。所以向弗洛耶的这一预测致敬。

约翰·弗里尔: 是的,又一个预测对了。当你回顾并为自己做对的事情感到自豪时,感觉很好。但我认为市场仍然需要理解这一点。这就是为什么我喜欢现在的市场,因为即使这个市场增长不那么快,当然对于某些公司来说,价值提取将发生在AI方面。所以这一切都在赋能AI。所以我非常看好它,戴夫,我必须告诉你。我认为企业不仅会迎来复苏,而且更棒的是,我们最喜欢的领域,数据中心、云、存储网络和计算仍然是最热门的东西。它在华尔街和纽约的展厅里都是最热门的东西,银行家们对AI基础设施、芯片、数据中心都欣喜若狂。这就像一个“掐我一下”的时刻。

大卫·维兰特: Grok(Grok人工智能模型)真是太棒了。

约翰·弗里尔: 是的,Grok和纽约证券交易所连线(NYSE Wired)层,我们知道他在RAISE峰会(RAISE Summit)上向他提出了一个挑战点。他给我发了一条消息——

大卫·维兰特: 7090亿美元,估值70亿美元。谢谢。不错。

约翰·弗里尔: 是的。就是这样。

大卫·维兰特: 好的,关于英特尔和英伟达,我完全同意,这是一个全面的胜利,对AI有好处。我只希望他们能对晶圆代工做些什么,然后解决这个问题。但我认为这涉及到自尊心。我认为这很复杂。我认为英特尔董事会显然希望从中获得价值,但我认为他们最初无法从中提取太多价值。我只是认为解放英特尔的设计团队将是一件很棒的事情。他们可以做更多这样的交易。他们可以在边缘(edge)与RISC-V(RISC-V指令集架构)合作。他们可以倾向于Arm,他们可以与TSM合作,但看起来这不会发生,但这是个好消息。

约翰·弗里尔: 是的,当地狱结冰时才会发生,对吧?我们拭目以待。你永远不知道。他们可能有一天醒来,然后说,“我们做吧。”

大卫·维兰特: 这让很多人感到惊讶,包括我。我完全同意你的分析。这是一个全面的胜利,对英伟达来说是巨大的胜利,对英特尔来说是巨大的胜利。向黄仁勋(Lip-Bu Tan)采取行动致敬,对客户来说也是一个好消息。我认为这对Arm来说是中性到积极的。这对Arm来说是积极的。顺便说一句,对TSM来说也是更多的好消息,因为他们将制造更多这些东西。对英特尔晶圆代工来说也是一点好消息,他们需要它,但对他们来说不是改变游戏规则的。

约翰·弗里尔: 是的,我认为随着AI的到来,这将是一个奇怪的市场。问题将是AI基础设施,但还有很多其他好消息。我们本周有很多视频,戴夫,下周在我们的AI工厂系列中,气候变化。Meta(Meta公司)举办了他们的眼镜大型活动。演示失败了。结果是分布式拒绝服务攻击(DDoS)。萨布吉特(Sarbjeet)对此有一个很棒的故事。看到演示失败真是令人难以置信。我们都见过那些,即使史蒂夫·乔布斯(Steve Jobs)也多次演示失败,人们总是展示成功的演示。但整个眼镜游戏,我听说亚马逊(Amazon)也将推出一款。他们即将在纽约市举办一个活动。所以我们将看看那是什么。OpenAI说他们将拥有一款设备,因为乔尼·艾维(Jony Ive)现在在那里有这笔交易。非常有趣的物联网(IoT)机会。

大卫·维兰特: 谈到演示,比尔·盖茨(Bill Gates)失败的演示比成功的演示多得多。事实上,我记不起比尔·盖茨成功的演示。我想我见过的每一个都失败了。他会说,“嗯,下次吧。我们最终会成功的。”那真是经典。

约翰·弗里尔: 所以我必须听听你对这个故事的看法。消费者新闻与商业频道(CNBC)报道称,消息来源称xAI(xAI人工智能公司)在据报道以1500亿美元估值筹集了100亿美元的债务和股权几周后,又以2000亿美元的投后估值(post-money valuation)筹集了100亿美元。埃隆·马斯克(Elon Musk)收购了X(X公司,原Twitter),创建了一个AI,购买了一堆GPU,然后去找金融家说,“我将值这么多钱。”现在,这有多么泡沫化?

大卫·维兰特: 非常泡沫化。——谁会想到Twitter会成为埃隆·马斯克主要的筹款工具,这真是令人难以置信?

约翰·弗里尔: 他有那个新的拟议薪酬方案,你看到了。

大卫·维兰特: 第一个万亿富翁。——谈论过,对吧?第一个万亿富翁,他必须让公司的价值达到10万亿美元,我想是这样。他将通过结合xAI,他将利用特斯拉(Tesla),他将利用太空探索技术公司(SpaceX),无聊公司(The Boring Company),他所有的资产,他将以某种方式将它们整合在一起。这个人做了一些了不起的事情。我知道很多人不喜欢他,但你必须钦佩他的创新能力。这个人做到这一点真是太疯狂了。他与他的整个特朗普(Trump)事件以及他来回争论,现在他又对美国政府不满,认为无法修复。他可能说得对,但我的意思是,他去攻击的问题简直荒谬。他现在用擎天柱机器人(Optimus)所做的事情,他深入其中。他说这会更难。嗯,也许不会,会比……我想他说,“这会比发射火箭更难。”也许不会,也许发射火箭更难。但——

大卫·维兰特: 他追求那些他认为会成为现实的大项目。比如机器人技术(robotics),我认为非常真实,这是我们在SiliconANGLE上最热门的内容系列之一。显然云总是很棒。整个本地数据中心,IAC工厂对内容的需求非常旺盛。机器人技术和机器人人工智能(robotics AI)非常热门,因为,第一,人们喜欢机器人。它非常未来主义。但有一个巨大的机器人产业将通过AI带来的软件层和所有马力得到提升,因为物理人工智能(physical AI)是真实存在的(physical AI 是什么?该如何理解?)我认为,两年前,詹森(Jensen)在GTC(GPU技术大会)上强调了这一点,去年他又加倍强调了数字孪生(digital twins)。但物理人工智能不仅仅是制造业机器人,它还包括人形机器人(humanoids),汽车(cars),汽车业正在转型。所以我非常关注物理人工智能的影响。如果你看看AI将如何影响物理方面,英伟达完全正确。他们的愿景是正确的。物理世界和数字世界的融合已经到来,一切都将为此重新架构。这是我们听到的共同主题。所有数据驱动或IT相关或旧的收集数据并用于创造价值的方式都将被删除并替换,永久删除或删除并替换为其他东西。我与一位企业家交谈,他说,软件将从资产负债表上作为费用删除,然后最终即时免费生成。所以我说,“你是什么意思?解释一下。”“嗯,如果你有Salesforce(Salesforce客户关系管理软件)许可证,例如,或者我们假设你有Workday(Workday企业管理软件),你正在为此付费。”“好的。”他说,“嗯,把那个成本去掉。”我说,“好的,这有点幻想。”再说一次,但这还有很多年,但如果你推演下去,戴夫,AI的经济学是颠覆性的。这就是为什么我如此关注整个FinOps(财务运营)与云的演变,因为FinOps正在向一般的财务运营转型,如果AI能降低成本,那将有助于底线。那是一个商业利益。

Physical AI,又称为Embodied AI(具身智能),指的是拥有“身体”、能够通过传感器感知物理世界、并利用其“身体”(执行器)与物理世界进行交互和执行任务的人工智能系统。

简单来说,我们可以做一个对比:

传统的/数字的AI (如ChatGPT, Midjourney):它们生活在数据和网络组成的数字世界里。它们的输入是文本、图片,输出也是文本、图片。它们没有身体,无法直接影响物理世界。你可以把它想象成一个纯粹的“数字大脑”。

Physical AI (如自动驾驶汽车, 人形机器人):它们生活在物理世界中。它们通过摄像头、雷达、触觉传感器等感知环境,通过电机、轮子、机械臂等行动和操作物体。它是一个集“感知-决策-行动”于一体的闭环系统。它不仅有“大脑”,更有“身体”。

大卫·维兰特: 好的。所以我们正在与CUBE研究合作的一件事,乔治·吉尔伯特(George Gilbert)正在领导这项工作,他的整个“服务即软件”(services-as-software)模型,他没有创造这个词,但他正在深入研究它意味着什么。正如你所记得的,如果你回到云和SaaS(软件即服务),我们在这里用来理解这个的框架是,技术模型、运营模型和商业模式都存在颠覆。所以如果你想想最初的SaaS,还记得它始于Salesforce。它是一个托管模型。还记得像ServiceNow(ServiceNow服务管理软件)这样的公司吗,他们有一个单一实例,他们有多实例,但它是单租户多实例。然后它随着Workday发展成为真正的、真正的云中多租户。所以它从一种一次性的复杂模式转变。所有本地部署的东西都是从头开始构建的雪花,而不是这种真正的SaaS模型。所以你从运营模型是你有这些独立的实例,然后它变成了一个批量业务模型,然后定价也改变了。还记得它是按席位收费,然后你有企业许可协议(ELAs),然后它变成了这种基于云的消费模型。嗯,在软件和服务的新范式中,也发生了一些类似的事情。所以你采用技术模型,你有数据堆栈(data stack)和数据管理(data management)以及应用程序逻辑(application logic)。它们都在融合。用户界面是生成式人工智能(generative AI)。所以你正在与系统对话。所以它是一个完全不同的技术模型。它就像Slack(Slack团队协作软件)与商业智能(BI)的结合,上面有一个代理系统。所以这很有趣。然后运营模型是你按订单生产。就像你可以使用代理重新格式化装配线,你现在有了差异化,但你仍然拥有批量优势。所以不是亨利·福特(Henry Ford)的一刀切,你实际上可以定制它,因为代理可以更快地工作并改革工作流程。然后商业模式你很难预测,对吧?你前期有大量的计算成本。你正在非常快速地折旧这些东西。从训练的角度来看,软件正在成为一项糟糕的业务,因为它们无法保持其护城河超过几个月。GPT-5(GPT-5人工智能模型)出来了,每个人都复制它,DeepSeeK正在复制它。所以当它进入推理(inference)时,看看这一切将如何发展会很有趣。你有数据和计算,这些原始输入,数据将给你带来竞争优势。所以商业模式正在演变。所以一切都在改变。约翰,你已经说过这个了。你说SaaS业务将完全改变。所以这促使我们去思考,“好的,它将如何改变?”正如我所说,乔治(George)领导了这项工作。所以我们基本上将围绕这个构建一个研究议程。

约翰·弗里尔: 是的,这非常重要,因为没有人拥有这种研究与产品主导增长(product-led growth)或经济影响分析。这有点混合。在我看来,这并不明显,但我与每个人交谈,甚至首席财务官(CFOs)都在研究如何构建未来的商业模式,无形资产(intangible assets),有形资产(tangible assets)。这意味着什么?所有这些都在变化,价值创造正在发生。所以营收正在增长,底线变得更有效率。所以AI的经济影响将是一个热门话题,这一切都将取决于幕后。很有趣,我正在浏览SiliconANGLE,看看我们有多少关于AI影响这个主题的故事,我看到了乔治·库尔茨(George Kurtz)在头版上的一段视频,来自CrowdStrike(CrowdStrike网络安全公司)。所以我想问,让我从托德(Todd)开始,但我知道你刚刚参加了他们为期三天的CrowdStrike活动,我想听听进展如何。他很少接受采访。他只和你坐下来。你是他唯一坐下来的人之一,CUBE是唯一一个——

大卫·维兰特: 他很棒。他确实和克莱默(Kramer)坐下来。我在这方面给他很多赞扬,因为在7月19日事件之后,他与克莱默坐下来,克莱默当时正在批评他。但他做得很好。库尔茨很棒。他非常低调。我不知道你是否曾经……是的,你见过他。你在RSA(RSA信息安全大会)见过他。

约翰·弗里尔: 是的。——之前。所以他基本上阐述了代理安全运营中心(agentic SOC)的愿景,他像尼尔·祖克(Nir Zuk)一样,基本上说,“看,安全必须改变。”我认为不同之处在于Palo Alto(Palo Alto Networks网络安全公司)已经重写了其堆栈,我认为CrowdStrike已经发展了其堆栈。所以这是一个变化,两家公司都做得很好。但他阐述了一个高度自动化的安全运营中心(SOC)的愿景。他使用了约翰,自动驾驶汽车(autonomous vehicles)的例子,其中零级是没有自动化。一级就像分析师辅助,你收到警报和建议,这很糟糕,每个人都讨厌它。然后你有二级,这是部分自动化,比如优先级排序和分类。然后人类说,“好的,这样做。”然后你有这种条件自主性,那是三级,AI进行调查然后响应,然后人类仍然在监督。然后是四级,就像,再次,四级是自动驾驶,你得到端到端响应,但手仍然在方向盘上。然后是完全自主,安全运营中心24小时不间断运行,无需人工干预。我们离那还有一段距离。就像我们离完全自动驾驶还有一段距离一样。

约翰·弗里尔: 不,不,现在有四级完全自动驾驶。我采访了——

大卫·维兰特: 是的,有四级但没有五级。这是他的观点。所以你有四级,我们会很快达到。然后完全自主,完全自动驾驶五级还需要一些时间。但他阐述了愿景,再次向乔治·吉尔伯特(George Gilbert)致敬,他谈到了企业级通用人工智能(enterprise AGI)。当我们写那篇萨姆·奥特曼(Sam Altman)、杰米·戴蒙(Jamie Dimon)的帖子时。乔治·库尔茨创造了安全通用人工智能(security AGI)这个词,在那里你基本上拥有,是的——

约翰·弗里尔: 感知安全(sentient security)。

大卫·维兰特: 对,所以他们宣布了一些代理。他们还宣布了一个名为AgentWorks(AgentWorks代理构建器)的代理构建器。我问他,“嗯,为什么不应该有人使用你的AgentWorks而不是谷歌(Google)或亚马逊(Amazon)的通用代理构建器?”他说,“嗯,我们有数据。我们有上下文中的硬核安全数据。我们可以定制这些东西。他们可能也可以定制。但我们有深度集成,我们所有的堆栈中都有治理。”所以他提出了一个非常强有力的论点,说明AI如何改变游戏,攻击者如何拥有优势,以及防御者必须快速行动。然后阐述了代理安全运营中心(agentic SOC)的愿景以及他们将如何实现。他们进行了两次收购,一次是几周前的Onum(Onum数据流平台),它做实时流式管道并将安全推向边缘,这很关键。然后他们收购了Pangea(Pangea可观测性平台),它提供对正在发生的事情的可观测性。它不仅仅是可观测性,因为他们可以对你的AI中正在发生的事情采取行动。因为有所有这些影子人工智能(shadow AI)正在发生,你不知道到底发生了什么。所以Pangea让你能够做到这一点。他们正在将这些整合到他们的堆栈中。最大的新闻,虽然没有被广泛报道,但你可以从股票中看到,他们举办了一个金融分析师日,他们一直都在阐述到2030年实现100亿美元的愿景。嗯,他们已经完成了一半。所以他们阐述了到2036年实现200亿美元的愿景,两天前股票大涨。分析师们都立即加入了。所以他们从7月19日事件中实现了V型复苏,他们正在大展拳脚,他们很棒。关于CrowdStrike Falcon(CrowdStrike Falcon安全平台)最后要说的是,约翰,它与我们用CUBE报道ServiceNow早期的日子非常相似。你还记得我们做的第一个吗?我们环顾四周,我们想,“哇,需要更多的生态系统。”我们四年前对CrowdStrike也说过同样的话。嗯,他们今年有8000人参加。生态系统正在分崩离析。每个人都想成为CrowdStrike的一部分,因为他们拥有飞轮效应,云原生(cloud native)与AWS Marketplace(AWS Marketplace云市场),他们自己的市场推广,现在生态系统正在爆炸式增长,他们正在大展拳脚。

约翰·弗里尔: 是的,对于这些正在转型的公司来说,这是一个相当大的演变。他们必须这样做,CrowdStrike,Palo Alto,两家领先的公司。所以如果你不站在AI方面的历史正确一边,你就完了。L4 SOC会很棒,但你知道即使在自动驾驶汽车上有多难,我从我采访这家从头开始构建L4汽车的公司中学到了,这很难。你必须从第一天起就从底层开始构建它。Waymo(Waymo自动驾驶公司),旧金山(San Francisco)每个人都知道,它正在进入其他城市,那是一个L2(二级自动驾驶)与改装。所以这意味着——

大卫·维兰特: 谁?谁是L2?哦,我以为Waymo是L4。

约翰·弗里尔: 不,它是一个用软件改装的L2。换句话说,整辆车不是从头开始建造的。所以这家公司,Tensor,我想是这个名字,他们正在将整辆车建造为L4。还记得Waymo只是捷豹(Jaguars)与——

大卫·维兰特: 是的,——。是的,对。——。所有东西都是后来添加的,所以它是改装的。传感器(sensors)和所有激光雷达(LiDAR)以及所有遥测技术(telemetry),所有这些东西都内置在实际的结构中。所以它看起来不同。而且系统是私有的。它不与互联网通信。它完全是——

大卫·维兰特: 私人网络。

约翰·弗里尔: 它是私人网络。它基本上是一个移动的AI工厂。英伟达也参与其中。他们正在使用英伟达芯片。英伟达会喜欢这个故事的,当他们看到它时。这确实是一个引人入胜的故事。但我的意思是,如果你发生刮蹭,修理起来会花费你一大笔钱,但它将是一个奢侈品。你可以在车里。它完全自主,整个内饰和用户体验都与你的数字生活方式同步。它会告诉你什么时候开会,它知道什么时候该做什么,它完全是为这种体验而设计的。所以它的价格也会非常高。它将为那些想要一个酷炫、闪亮的新玩具的奢侈品买家定价,字面意思。但这就是它的发展方向。所以我们拭目以待。

大卫·维兰特: 嗯,库尔茨(Kurtz)是这样描述的,我不知道这一点,就是你有一个控制平面(control plane),本质上,嗯,汽车有自己的控制,但随后在云端,你有数据上传,并且有人可以在Waymo出现问题时进行观察。你以前坐过Waymo,它会卡住一分钟,你就会想,“快走啊。”据说是有一些人在干预,说,“哦,我们得检查一下情况。给你。”我当时没有意识到,Waymo有人在循环中。我不知道。我以为没有人为干预。所以我问他,“在安全领域实现完全自动驾驶会比在汽车领域更难吗?”他不知道答案。但我知道一些专家说,“嘿,”他们指出,“我们不让人们在16岁之前开车是有原因的,因为大脑必须发育,它是一个学习系统。”而且车队需要像拜占庭容错(Byzantine Fault Tolerance)这样的东西才能实现完全自动驾驶。所以我不知道。我们拭目以待。这肯定比大多数人意识到的要花更长的时间。但你听埃隆(Elon)说,他说,“完全自动驾驶将比人类驾驶安全一个数量级,”我希望那一天能尽快到来。

约翰·弗里尔: 是的,我知道我们时间不多了,但我想很快听听你对安迪·贾西(Andy Jassy)本周评论的看法,萨布吉特(Sarbjeet)又发布了一篇很棒的帖子。他正在寻求根除官僚主义。

大卫·维兰特: 是的。你知道我对此的感受。

约翰·弗里尔: ——会议。是的。

大卫·维兰特: 我是在国际数据集团(IDG)的帕特·麦戈文(Pat McGovern)时代长大的,扁平化组织,保持公司精简,保持组织扁平化。他们过去常常强迫我们有8、10、12个直接下属,这很多,也许太多了,但那是一个扁平化组织。当时的理念是尽可能将决策权推到离客户最近的地方。扁平化组织,减少官僚主义,保持层级尽可能扁平,并不断创新。而这方面的缺点很有趣,因为IDG完全去中心化,而Zip(Zip公司)则高度中心化,Zip做得很好。他们是一个非常好的竞争对手,但他们是命令与控制组织。他们有良好的成本控制,很多很好的投资,在他们的许多出版物中实现了标准化。而IDG则是一千朵花盛开,两者都有效。但那是我成长的文化。所以,如你所知,我喜欢扁平化组织,去中心化公司。

约翰·弗里尔: 嗯,我们下周拭目以待,对于我们CUBE和CUBE研究的AI工厂系列来说,这将是一个非常重要的活动。



== END ==