theNet by Cloudflare

平衡数据主权与 AI

如何在使用 AI 时保护敏感数据

将数据保存在原地

随着数据监管法规变得越来越复杂,了解数据的来源、去向以及由谁处理变得越来越重要。在世界许多国家/地区,数据法规要求数据必须保留在来源地区,除非外部企业可以证明其遵守这些法规。这个概念称之为“数据主权”:也就是说,数据受到其处理方所在国家或地区的法律监管。

然而,即使数据传输的目标地点或供应商本身合规,跨境数据传输也可能导致违规。例如,一些国家/地区的政府机构可能获得授权来审核跨境数据,但这会违反其他国家/地区的数据法规。

如果企业在没有采取充分保护措施的情况下将数据传输出来源区域,可能会面临严重的法律和财务后果。例如,2023 年,Meta 收到了一笔 13 亿美元的罚款,原因是其将数据从欧盟传输到美国,但没有对传输的数据提供充分的隐私保护。

上述情况促使数据本地化概念应运而生:为了维持数据监管合规和消费者信任,企业通常需要将数据保存在运营所在区域内。

数据本地化的理念是将数据保存在特定国家或地区内,而不是跨境传输数据后在偏远地区的服务器上处理或存储。但是,这种方法让云计算和外部第三方服务的使用变得更加复杂,因为此类服务通常无法以这种方式本地化。毕竟,云数据中心遍布全球,无论其支持的服务位于何处。

这意味着,对于许多企业而言,数据本地化的需求可能与人工智能 (AI) 发生冲突,而 AI 是当今最重要的云服务之一。


AI 已成为强大的商业工具

近年来,更加强大的硬件与日益完善的软件相结合,推动了 AI 技术应用的大幅提升。一些企业将 AI 纳入其流程,以协助预测建模、内容构思、研究、情绪分析和客户服务自动化麦肯锡等分析机构继续对生成式人工智能 (GenAI) 的商业用途不断扩展保持乐观。大多数企业没有时间或资源来构建自己的 AI 模型,因此,依赖于外部供应商来使用这些技术。

然而,AI 需要收集数据才能运行。AI 模型以用于训练复杂算法的大规模数据集为基础。大规模数据集可能,而且确实,存储在各种位置。但是,由于其可扩展性,用于训练 AI 的数据几乎总是存储在云端,以及遍布全球的数据中心。(摘自 OpenAI 消费者服务常见问题解答:“内容存储在 OpenAI 系统以及我们在美国和全球各地值得信赖的服务提供商的系统中 [已添加着重号]。”)

也就是说,上传到 AI 或用于训练生成式 AI 模型的数据不受最初拥有数据的企业的控制,并且很可能位于其来源的地理区域之外。

随着模型接收的输入更多,它们会不断进行微调。也就是说,输入可能会影响未来的输出,甚至作为未来的输出重新出现(后者对敏感数据构成风险,导致一些企业禁止员工使用生成式 AI)。这通常发生在缺乏监督或透明度的情况下,AI 用户可能不知道处理他们提供的数据的机器位于何处。同样令人担忧的是影子 AI,即:在缺乏 IT 团队监测或批准的情况下使用未经批准的 AI 工具。

在许多司法管辖区,这可能会让企业与数据主权要求发生冲突。与此类要求相冲突的风险包括:罚款(从小额罚款到像 Meta 公司那样的巨额罚款)、制裁、公共声誉受损以及客户信任下降。

另一方面,不使用 AI 并落后于竞争对手的风险,也会对企业构成类似的威胁。

总而言之:AI 非常有用,但对于在严格数据监管法规下运营的企业来说,AI 可能存在风险,除非它们能够找到一种数据主权友好的方法来运用 AI。


在不跨境传输数据的同时充分利用 AI 的方案

企业如何做才能避免跨境传输数据的风险,同时充分利用 AI?需要一种能够以本地化方式提供计算能力来为复杂的 AI 模型提供支持的方法。企业还需要确保能够控制数据存储和处理的位置,包括传输中的数据和静态数据。

因此,最佳出路是数据本地化与本地 AI 实例相结合,这些实例可以在第三方平台构建或由供应商预先构建。完全数据本地化需要全面控制数据存储位置、用户服务位置,以及加密密钥存储位置(因为这决定了数据以解密形式存储的位置)。这些功能必须与强大的全球 AI 网络集成,该网络在本地部署,并且具备足够的计算能力来按需运行 AI 模型。

企业同时面临着使用 AI 与确保数据本地化的需求,因此,需要一个充分了解这些需求并且能够提供支持的合作伙伴。Cloudflare 提供数据本地化套件,以支持那些需要满足数据主权要求的企业。更重要的是,Cloudflare for AI 让用户可以访问世界任何地方的 GPU,并为开发人员提供快速集成热门 AI 模型的方法。

Cloudflare 就影响当今技术决策者的最新趋势和主题发布了系列文章,本文为其一。



关键要点

阅读本文后,您将能够了解:

  • 数据本地化如何帮助维持监管框架合规

  • AI 服务与保持数据区域性存储之间的冲突

  • 使用 AI 时维持数据本地化的技术解决方案


相关资源


深入探讨这个话题

阅读《全球连通云:重新掌控 IT 和安全的方法》电子书,进一步了解如何简化和保护 AI 计划。

接收有关最流行互联网见解的每月总结。