知鱼
Surviving is nothing to be ashamed of. It's something to be proud of.

AI时代“零损失”:数据弹性如何重塑企业防御?

trylab 发布于 2025-10-13 14:48    40 次阅读

问题意识

AI浪潮席卷全球,企业正竞相拥抱其带来的巨大机遇。然而,在这场技术变革的“军备竞赛”中,我们是否真正做好了准备?当AI系统日益深入业务核心,生成海量数据并自主决策时,如何确保这些关键资产的“零损失”?本期文章将深入探讨AI时代下,数据弹性如何从根本上重塑企业的数据保护策略,揭示当前AI数据管理面临的严峻挑战,以及构建一个安全、可信、高效的AI服务层所必需的关键要素。我们将剖析AI成熟度与实际挑战之间的悖论,并展望未来企业如何通过数据弹性,将AI的潜力转化为持久的竞争优势。

===

阅读收获

  • 深入理解AI时代数据保护的严峻现状与挑战,特别是近==70%==的AI生成数据未受充分保护的风险。
  • 认识到网络在AI供应链中的战略角色,以及数据保护如何从传输层嵌入网络架构,确保数据安全与合规。
  • 洞察AI项目ROI普遍偏低的核心原因,并理解数据治理合规性数据管理在实现AI规模化价值中的决定性作用。
  • 掌握AI赋能数据保护的自动化趋势,以及如何通过自动化备份与恢复、强化策略执行,构建可持续的数据保留与恢复路径。

===

延伸思考

这次分享的内容就到这里了,或许以下几个问题,能够启发你更多的思考,欢迎留言,说说你的想法~

  1. 随着AI代理(Agentic AI) 的普及,您认为企业在数据血缘追踪因果关系证明跨代理协作的治理方面,将面临哪些前所未有的技术挑战与解决方案?
  2. 文章指出==70%==的AI生成数据未被充分备份,且推理数据成为主要攻击目标。在您的实际工作中,如何平衡AI创新速度数据安全合规性,并有效提升AI数据的弹性?
  3. 服务即软件”模式下,网络已成为AI供应链安全边界。您认为未来的AI原生网络架构应具备哪些核心特征,以更好地支持AI工作负载并确保数据弹性


👉 划线高亮 观点批注


Main

BREAKING ANALYSIS | 作者:David Vellante, Christophe Bertrand, Scott Hebner, Jackie McGuire, Bob Lalberte 和 Paul Nashawaty

服务即软件(service as software) 的转变将为所有行业的所有公司(不仅仅是技术供应商)带来学习曲线优势、软件般的边际经济效益以及赢家通吃的动态。

我们相信,那些能够更快地进入人工智能(AI) 经验曲线的公司,将相对于竞争对手获得大幅增长的收益。然而,我们的研究表明,数据管理的复杂性和数据保护的不足是首席AI官、首席技术官以及那些正在规划公司AI未来的业务线负责人的关键风险因素。

特别是,我们的调查数据显示,近 ==70%== 的公司保护的AI生成数据不足一半,而这些数据正是AI所承诺的竞争优势的来源。此外,AI能力的感知成熟度与实际成熟度之间似乎存在相当大的差异,在网络安全法规遵从治理数据集成能力等领域存在严重差距,我们认为这将挑战AI的成果。

在本期Breaking Analysis中,我们为您带来“零损失企业”:数据弹性作为AI服务层。在本期节目中,Christophe Bertrand将展示关于此主题的最新调查数据,并由TheCUBE研究团队成员Bob Laliberte、Paul Nashawaty、Jackie McGuire和Scott Hebner提供支持,他们将各自发表分析。

我们将分享最近一项研究的具体结果,该研究旨在深入了解AI时代数据保护如何演变,以及当前关键AI数据的保护程度。我们还将分享来自Enterprise Technology Research的一些AI投资回报率(ROI) 数据,并展望未来需要发生什么,以确保公司最关键的资产(即其数据)得到保护并为AI做好准备。最后,我们将探讨未来实现零损失企业的实际困难。

理解数据领域 零损失企业 的定义是什么?AI时代应加强数据保护意识,因为这将是企业、个人的核心资产。

研究目标

这项研究是基于今年夏天早些时候数据保护与AI峰会上富有洞察力的对话。因此,我们在北美地区对该主题进行了更多研究,共 ==300== 名受访者,资质良好,我们真正想了解的是信息技术专业人员基础设施专家在保护新兴AI基础设施以及利用AI本身作为其流程一部分方面的数据保护想法。

图1: 零损失企业:数据弹性作为AI服务层|858x482

应用开发(App/Dev)与网络弹性

在我们深入调查数据之前,让我们先看看应用开发(App/Dev)服务即软件(service as software)时代如何变化的关系,特别是在业务弹性的背景下。为此,我们请来了负责应用开发(App/Dev) 业务的Paul Nashawaty发表意见。

我们认为,服务即软件(services-as-software)网络弹性数据保护的影响反映了企业软件工作方式的根本性转变。旧的软件即服务(software-as-a-service) 模式——人们操作工具——正在让位于软件成为操作者的世界。AI驱动系统不仅仅是观察;它们还进行决策、行动和学习。根据Forbes的数据,这创造了 ==4.6万亿美元== 的机会,但它也改变了安全性弹性信任问责制

随着Agent 能力不断强化,软件将逐渐不再被人类直接操作,而是由Agent(代理)完成,人类和Agent的交互界面将基于LLM实现意图理解、监管执行。

这对开发者意味着什么。编码必须嵌入意图——这意味着每个行动都应该被授权、可审计和可逆。DevOps管道从仅仅交付软件演变为验证自动化行为。可观测性(Observability) 超越了正常运行时间和基本跟踪,转向理解发生了什么行动、由谁/什么以及为什么。

软件平台的可观测性将成为Agent的数据面,如何定义平台可观测性的接口和标准将是工业化具体落地的关键,这属于数据治理领域的-数据血缘概念。

平台工程成为治理的管理者。他们的使命是保护模型控制平面,强制执行策略运行时,并确保每个代理决策都是可证明、真实和可逆的。TheCUBE Research的报告显示,==92%== 的开发者表示他们需要现代平台进行创新;==87%== 的IT领导者认为可观测性(observability) 至关重要。即便如此,数据质量仍然是一个主要障碍。

底线是网络弹性数据保护应用开发(App/Dev) 现在无处不在,从代码到云。组织正在将弹性融入到将拥有数字业务的系统的每一层,在这个新时代,弹性就是商业模式

我们看到正在出现的更广泛影响:

  • 安全性和弹性作为当务之急。超越SaaS的转变要求在开发者体验和整个应用程序生命周期中实现授权可审计性可逆性
  • 开发者转型。开发者定义行动(不仅仅是应用程序编程接口),并具有清晰的上下文和回滚规则。模型提示数据管道成为版本化和受治理的依赖项。单元测试演变为验证意图安全性。
  • DevOps重塑。管道验证行为合规性,而不仅仅是部署成功——不再是“按下大绿按钮”就完事。
  • 新的弹性指标。我们看到AMTT/MTD(检测未经授权访问或行动的平均时间)和AMTTR(恢复的平均时间)的兴起,以及用于在压力下测试代理行为混沌代理
  • 平台工程和治理数据驱动的监督扩展:==92%== 需要现代工具;==87%== 认为可观测性(observability) 至关重要;==75%== 报告推动所有可观测性工具;==81%== 的首席信息官可持续性视为软件决策者云原生现代化可将碳足迹减少约 ==30%==。

服务即软件(services-as-software)时代,软件就是业务。赢家将通过自动化信任透明度来构建弹性,从而使自动化本身成为其覆盖范围和控制面的一部分。很多事情正在发生,在我们看来,这仅仅是个开始。

IT从业者认为AI正在成熟……但有一个问题

我们认为最新的报告(n= ==300==)捕捉到了这一时刻的悖论。当被问及“您如何描述您的组织AI成熟度水平?”时,有意义的群体报告他们正在成熟/进行中,但最突出的是第二栏——“成熟:AI已完全集成到运营中。”

这个头条结果令人震惊。我们的解释是,这些回答主要来自IT基础设施专业人员,可能存在一些热情偏差。集成可能是真实的,但范围有限——在特定流程中成熟,而不是在整个企业中。结论是AI是不可避免且正在进行中;悬而未决的问题是它将如何实施以及是否会正确实施。整个企业并非“由代理运行”。

图2: 组织AI成熟度水平

主要挑战表明AI成熟度不足

接下来的分析——主要挑战——强调了AI普遍成熟度不足的问题。受访者选择了三个项目(一个“选择你的毒药”受欢迎度排名)。前两个是决定性的——成本网络安全/网络弹性。在这之下是常见的成熟度问题组合(集成投资回报率(ROI)准备就绪),我们在之前的浪潮中也见过,包括虚拟化容器等,当时的说法是“尚未为黄金时段做好准备”。现在的不同之处在于投资的加速和一场军备竞赛——尽管在许多情况下缺乏明确的投资回报率(ROI)

图3: AI部署的主要挑战

ETR数据与MIT缺乏ROI的研究普遍一致

最近MIT的一项研究表明,==95%== 的AI项目未能带来切实的投资回报率(ROI),这在科技界一直是一个频繁讨论的话题。ETR最新的深入数据支持了这些发现的方向,如下所示。

图4: AI项目ROI对比:自建与外部采购

在比较“内部构建(build in-house)”与“外部采购(buy external)”时,实现持续规模化投资回报率(ROI) 的份额很小,更接近MIT的发现,即约 ==5%== 的生产部署看到了明确的投资回报率(ROI)。在我们看来,有三种力量驱动了这种差异:

范围(Scope)——早期实施范围狭窄。它们可能在有限的领域内“成熟”,而不是在整个企业范围内。

规模(Scale)——在句子中加上“规模化(at scale)”之前,一切都有效。许多部署都碰壁了。

数据(Data)——团队通常不知道正确的数据在哪里,或者数据不合规且不受治理。指导很少,风险真实存在,审慎的资本配置者不能简单地部署系统。

我们一直在使用的比喻是,这就像你建造了一个强大的工厂,我们正在学习如何利用核能级能量……但控制系统尚未完全安装。这是一个危险的游戏。我们的研究表明,市场将无论如何向前发展;赢家将是那些超越部署成功、控制成本和网络弹性、并在将AI拨到最大之前建立治理“控制” 的公司。

网络成为AI供应链——以及安全边界

我们认为,在AI时代网络扮演着战略性角色,而不仅仅是传输角色。它成为决定组织学习、适应和扩展AI速度的基础架构。在这种模式下,数据移动是产品管道,每个AI服务都依赖于训练环境推理节点边缘用户之间的有效流动。在我们看来,这需要基于遥测丰富的架构和闭环自动化构建的可编程API驱动AI编排的网络。这带来了软件般的经济效益AI经验曲线上更快的进步。

我们的研究强调了一个关键风险,即 ==70%== 的公司保护的AI生成数据不足一半。这个差距不仅仅是存储;它延伸到整个数据传输层。随着AI工作负载的分布式,数据保护必须嵌入到网络中,确保每个数据包在传输过程中都是安全的、受治理的、合规的。底线是,网络现在既是AI供应链又是安全边界。将数据保护网络架构AI运营对齐的企业不仅能降低风险,还能在AI驱动的经济中创造持久的竞争优势。

推理正在兴起,数据成为主要目标

我们认为,行业对“训练与推理”的执着在某种程度上忽略了更大的图景,即推理正在加速,随之而来的是更多的数据创建和更大的计算需求。在下面的调查截图中,标题为“AI数据是网络攻击的关键目标”,==300== 名受访者中有 ==72== 人(约 ==24%-25%==)报告至少发生过一次AI基础设施暴露。主要的热点推理时的数据——这正是AI活动的重点。

图5: AI数据是网络攻击的关键目标

我们对回复的分析(可能存在一些类别重叠)显示,前三大暴露都与数据相关——在我们看来,这是许多AI领导者超大规模厂商数据平台供应商低估(或轻描淡写)的关键点。我们对之前的网络弹性研究进行了深入分析,以隔离这在AI上下文中意味着什么——即使在早期阶段,即使投资回报率(ROI) 不确定,真正的暴露也正在浮现。

雪上加霜的是,攻击者本身也配备了AI。结果是一场军备竞赛AI驱动的对手越来越多地瞄准脆弱的AI投资。这意味着企业必须AI赋能其防御,否则将被超越。爆炸半径非常广,成功的攻击可能会破坏模型、损坏数据或侵蚀对输出的信任,从而使整个投资面临风险。如果数据不可信或模型变得不可信,结果将无法提供足够的回报——这可能是投资回报率(ROI) 有限的根本原因。

展望未来,随着代理(agents) 连接到其他代理并开始自主决策,这种风险变得更加严峻。组织将需要证明因果关系——决策是如何达成的——而不仅仅是产生了什么决策。风险正在迅速上升,但控制措施却没有跟上。在我们看来,市场想要奔跑,但在安全治理方面,我们仍在爬行。

数据合规性现实检查

我们认为一个严峻的事实正在被忽视,即代理式AI(agentic AI)生成式AI(generative AI) 将以组织未准备好的方式爆炸式增长数据量。每个训练模型——及其产生的工件——可能都需要保留相当长的时间。在高度监管的行业中,这种义务是明确的——例如,医疗保健记录通常必须保留 ==6== 到 ==10== 年(例如Medicare——从服务日期起 ==10== 年);萨班斯-奥克斯利法案(Sarbanes-Oxley) 要求许多金融文件保留 ==7== 年。许多行业都施加了类似的强制性要求。

使问题复杂化的是,我们仍然不知道AI生成交互将如何分类——是人机交互还是机器对机器事件。在没有新法规的情况下,企业应假定他们必须长期存储大量数据。尽管许多人预测劳动生产率会提高——甚至劳动力替代——但我们认为组织还将承担数据保留存储的巨大成本,以及保护这些数据的持续负担。

安全要求正在提高。加密标准——以及后量子密码学工作——正在迅速发展。如果企业没有为敏感数据集(例如Medicaid/Medicare)规划 ==10== 年的期限,他们将面临未来的不安全风险,除非这些记录得到非常强大的物理和逻辑保护

运营现实甚至更令人担忧,因为合规性意味着雇用和资助团队,以确保政策得到遵守并监控呈指数级增长的数据量。在我们看来,即将到来的环境是一个数据丛林,其中充满了密集、受监管且成本高昂的合规性法令保留治理安全设计模型图形处理单元(GPU) 一样,是AI战略的核心。驾驭它并非易事;忽视它将不是一个选择。

AI数据备份暴露出规模化下的令人不安的差距

我们认为以下数据集既清晰又令人深感担忧。当被问及“您的组织有多少百分比的AI生成数据包含在常规备份中?”时,受访者给出了 ==0%== 的“不知道”。这很罕见——这增强了对报告的信心。然而,约 ==70%== 的人报告备份的AI生成数据不足一半。对照保留规范——金融服务约 ==7== 年;医疗保健 ==7== 到 ==10== 年——这表明关键AI数据未被备份或保护。如果监管机构或法院要求重新创建而数据不存在,可能会产生负面后果。

图6: AI生成数据备份率

我们的观点,与调查设计一致,是IT基础设施专业人员正在回答——那些“不得不”支持AI基础设施存储安全网络的人。他们的回答表明,我们已经投入了资金,AI正在生成大量数据(未来还会更多),但我们没有保护它。备份被视为事后诸葛。

我们已经看到了每个新工作负载的这种模式——最佳实践滞后并必须迎头赶上——但AI不仅仅是一个工作负载。它是一种新的运营模式。任务是回归基础并执行以下操作:

  • 定位和管理数据——它在哪里?它是否受治理并为AI做好准备?
  • 保护输入——当数据注入模型应用程序代理框架时,确保适当的备份策略控制
  • 保护输出和关系——保留和保护模型输出以及合规性业务恢复所需的流程链接

底线是AI基础设施正在创造另一个数据怪物——不仅是为了支持更好的决策,也是为了在网络攻击者直接攻击数据时保护自身。如果这个问题不规模化解决,运营和成本影响是不可避免的。

AI数据丢失代价高昂

我们认为网络攻击数据丢失的成本在生产力损失监管风险声誉损害方面是众所周知的,特别是如果数据泄露给竞争对手。在我们的“AI数据丢失损害钱包”输出中,受访者给出了 ==0%== 的“不知道”——这些是了解丢失未备份AI数据后果的从业者。最直接的影响包括人员后果(是的,人们可能会失业)和损害组织的合规性失败,此外还有硬性和软性生产力成本

图7: AI数据丢失的成本影响

我们的观点是,随着AI部署的扩大和投资回报率(ROI) 的实现,合规性的优先级将提高——因为随着规模的扩大,风险和暴露也会增加,并且有遵守的强制要求。负担通常落在那些没有明确指导的团队身上,他们必须为不断发展的环境提供备份和恢复——在计算和存储的巨大投资以及随之而来的海量数据需要保护的情况下。

曾经“无聊”的学科——备份和恢复——现在比以往任何时候都更加关键。如果数据是业务的命脉,也是驱动业务的AI流程的命脉,那么备份恢复能力,无论原因如何(特别是网络事件),都必须是重中之重。这是对当前对结果的执着的一种反转,回归本源,回归基础,回归最佳实践。关注合规性这条线——随着项目的规模化,它可能会显著上升。

AI用于数据保护:立即自动化恢复

我们认为这个故事有两面——AI的数据保护数据保护的AI。翻转硬币,问题就变成了我们如何改善恢复态势

图8: AI在数据保护中的最有效用例

我们对上述数据(单选题,==100%== 回复)的解读是,最具影响力的用例是自动化备份和恢复。原因是数据太多,系统过于复杂,许多IT运营团队是通才——而不是备份AI基础设施的博士(至少目前还不是)。这对市场的影响是,数据保护网络恢复和更广泛的数据管理堆栈中的供应商必须构建自动化优先的能力。

还有一个来自IT一线的务实提醒:我们多年来一直在自动化备份,但自动化现在必须渗透到整个保护生命周期中,端到端地强化安全性可恢复性

另一点是关于磁带。我们今天不深入探讨,但我们的研究包括大量的磁带发现,我们相信磁带拥有强大的未来AI将生成海量原始数据和更多的元数据(用于合规性因果关系可解释性)。这些数据必须存储在经济上可行的地方。在规模化下,磁带保持着经济优势,我们的数据显示,许多知情的决策者已经将磁带视为AI时代保留的关键。我们将在单独的分析中涵盖详细信息。

底线是,AI作为一种功能集数据治理数据保护中扮演着至关重要的角色——不仅保护新兴的AI基础设施本身,还自动化恢复、收紧策略执行,并为组织提供一条可持续的路径,以在AI规模保留证明恢复数据。

数据保护中的AI投资增加 > 更多投资 > 供应商洗牌

我们认为行业正处于另一个拐点——类似于虚拟化和仍在发展的SaaS——这次以AI用于数据保护为中心。当被问及利用AI功能前瞻性策略时,==51%== 的受访者表示他们将投资数据保护并青睐将AI嵌入其解决方案的供应商。对于一项在两三年前通常被视为事后诸葛的能力来说,这是一个很大的数字。

图9: 数据保护中AI功能的投资策略

市场结构也在发生变化。网络恢复数据管理正在融合,我们预计AI驱动的保护将成为核心要求。我们研究主导的展望表明,==51%== 的意图可能在 ==18== 到 ==24== 个月内攀升至 ==75%== 到 ==80%==,届时这个问题将变得无关紧要,因为采用已成定局。

底线是,曾经的“备份和恢复”(现在实际上是网络恢复)领域的领导者将是那些深入而明智地集成AI、扩展数据网络安全功能,并证明可衡量收益的供应商。我们已经看到了股权/并购路线图的早期举动。我们预计一场不断升级的军备竞赛

为何如此紧迫?随着AI驱动更多数据和更大的运营复杂性,团队必须用更少的资源做更多的事情。买家希望供应商能够通过AI实现自动化、更好的支持、明智的恢复策略自动化灾难恢复(DR)规划,从而使保护更简单、更智能。在我们看来,“AI洗白(AI-washing)”是行不通的。供应商必须安全、智能地交付,以便客户能够更好、更快地保护环境。

信任与治理:当前不成熟,未来投资巨大——从数据开始

我们认为下面显示的数据强调了信任差距投资路径。一项新的、全面的调查——代理式AI未来指数(Agentic AI Futures Index)(==9== 月;n= ==625== 名AI专业人员,涵盖 ==13== 个行业、==9== 个职业、==3== 个国家)用数字证实了许多人的猜测。

图10: AI代理信任指数与治理框架成熟度

当前信任度:平均信任指数 ==2.4/5==。只有 ==49%== 的AI专业人员最终用户信任AI代理的输出——这清楚地表明还有工作要做。

当前治理框架:只有 ==29%== 的人报告已建立企业级标准化信任/治理框架。当前成熟度指数 ==2.8/5==——略高于信任度,因为组织正在努力弥补这一差距。

投资轨迹(未来 ==18== 个月):指数跃升至 ==3.8/5==,==73%== 的人计划在信任治理方面进行重大或战略性投资。解决问题的行动是真实且近期的。

投资从何开始:首要的控制优先级数据——来源保障保护——==72%== 的人提到了这一点。数据仍然是AI的命脉:没有可信的数据,就没有可信的AI

图11: 负责任的AI:治理与挑战

由此可见,上面关于“负责任的AI使用:治理与挑战”的图表显示,“不知道”的比例非常低,而“其他”为零。在我们看来,这表明受访者清楚地了解他们的障碍,并正在趋同于一组已知的问题。结合上述投资模式,结论是当前存在信任问题不成熟的框架,但组织正准备资助和实施解决方案——从数据控制开始——以使代理式AI(agentic AI) 进入负责任的、企业规模的使用。

负责任的AI治理:投资、降低复杂性、释放数据——否则无法实现规模化AI

我们认为,任务是您必须持续投资以降低网络风险、改善网络恢复并降低网络风险——实际上别无选择。最终用户必须为此提供资金;供应商必须扩展数据治理数据管理备份/恢复(现在扩展到网络恢复)的能力。

核心障碍是监管复杂性合规性数据治理信任始于保护治理管理数据以实现合规性的能力——这是其他AI信任组件所依赖的基础。下面的调查输出是一个“选择你的毒药”受欢迎度测试;其结果显示了许多重叠的、困难的挑战。

图12: 负责任的AI治理挑战

一个挑战显眼地位于中间,约占 ==25%==——在SaaS环境中利用数据。许多SaaS供应商将数据保留在他们的围墙花园中,并承诺他们自己的代理来操作这些数据。我们看到的一个悬而未决的问题是,企业是否应该提取这些数据并自行操作?市场将决定“正确”的答案,但控制影响是巨大的。

无论如何,我们的结论是,没有合规数据和没有网络弹性数据 = 没有规模化AI数据

我们认为企业正在跨越服务即软件(service-as-software) 的门槛,其中智能系统代理系统提供支持,网络既成为供应链又成为安全边界,而结果(而非接口)定义了价值。然而,数据显示信任度为 ==2.4/5==,只有 ==49%== 的人信任AI代理的输出,只有 ==29%== 的人拥有企业级治理,约 ==70%== 的人备份的AI生成数据不足一半,而推理数据已经是主要的攻击目标。军备竞赛已经到来——一边是 ==4.6万亿美元== 的机会,另一边是AI武装的对手——而规模化投资回报率(ROI) 仍然看起来像MIT发现的约 ==5%==。

我们的研究表明,赢家不会等待完美的清晰度。他们将在规模化过程中操作化控制——以治理目录作为控制点;行动治理(不仅仅是API);具有推理轨迹数据血缘代理可观测性可编程遥测丰富闭环网络备份和可恢复性作为一流(包括磁带等经济层级);以及DevSecOps无处不在的Day0/1/2实践。采购将随之而来——==51%== 的人已经青睐嵌入AI数据保护供应商,我们预计随着网络恢复数据管理的融合,这一比例将升至 ==75%-80%==。

在我们看来,==2025-2026年== 不会是代理之年——它将是代理十年。那些现在就将技术运营商业模式对齐——将数据弹性视为商业模式的企业——将最快地攀登学习曲线,将边际软件经济效益转化为持久优势,并定义下一代企业计算控制平面



== END ==