利用MongoDB进行数据治理,防范构建生成式AI应用程序时的潜在安全风险

在这里插入图片描述
生成式人工智能(生成式AI)正在蓬勃发展,许多企业和初创公司正在运用AI工具来解决各自的用例问题。随着企业逐渐适应市场上的新技术范式转移,开发者社区和开源模型也在不断发展壮大。

构建智能生成式AI应用程序需要灵活运用数据。这其中涉及的一项核心要求就是数据治理,数据治理涵盖各种有助于确保数据安全性、机密性、准确性、可用性和可靠性的措施,涉及数据生命周期的流程、政策、措施、技术、工具和控制等方面。 企业在构建应用程序并将其部署至生产环境时,常常需要处理个人身份信息或商业敏感数据(如与知识产权相关的数据),因此,企业需要确保所有必要的控制措施均已落实到位。

企业在构建由生成式AI驱动的应用程序时,需要具备以下关键能力才能打造智能化、现代化的应用程序体验:
处理运营和分析工作负载的数据

  • 一个高度可扩展、高性能的数据平台
  • 一个能够处理各种数据类型的表达式查询API
  • 与各种成熟的开源LLM模型紧密集成
  • 原生向量搜索能力,如可实现语义搜索和检索增强生成(RAG)等嵌入技术

本文详细介绍MongoDB Atlas针对现代AI应用程序需求的安全控制功能。

在构建生成式AI应用程序时,有哪些潜在的安全风险

根据Retool发布的2023年AI现状报告,数据安全和数据准确性是开发AI应用时的两大痛点。 调查结果显示,三分之一的受访者认为数据安全是主要痛点,人们对此的担忧几乎与公司规模呈线性增长。

在这里插入图片描述

开发AI应用程序的主要痛点

企业在利用AI技术改善业务的同时,也应警惕潜在的风险。随着企业开始广泛尝试各种模型和AI工具,生成式AI可能会给企业带来意料之外的后果,增加上述风险的暴露程度。尽管企业在开发能够直接使用的生成式AI应用程序时会遵循深思熟虑、有条不紊的最佳实践,但企业必须同时部署严格的安全控制措施,以降低AI应用程序可能带来的重要安全风险。

以下是保障AI应用程序/系统安全的一些重要注意事项:

  • 数据安全和隐私:生成式AI基础模型依靠大量数据来训练和生成新内容。如果训练数据或RAG(检索增强生成)流程使用的数据包含个人数据或机密数据,那么这些数据可能会以无法预测的方式出现在输出结果中。因此,部署强有力的治理和控制措施至关重要 ,此举有助于确保机密数据不会通过输出结果泄露出去。
  • 知识产权侵权企业需要避免未经授权使用、复制或销售知识产权受法律保护的作品。 企业还需要确保在对AI模型进行训练时,输出结果中不含与现有作品相似的内容,以免侵犯原创作品的版权。这是AI系统的一个全新领域,因此相关法律也在不断完善中。
  • 监管合规性:AI应用程序必须遵守相关的行业标准和政策,如医疗领域的《健康保险可携性和责任法案》(HIPAA)、金融领域的
    PCI安全标准、保护欧盟境内公民个人数据的《一般数据保护条例》(GDPR)、《加州消费者隐私法案》(CCPA)等。
  • 可解释性:AI系统和算法有时并不透明,使得决策过程充满不确定性。可解释性是一个概念,指以人类能够接受的方式来解释机器学习模型及其输出结果,并且能够针对相同的输入信息生成可重复的输出结果。可解释性是AI应用程序构建信任和责任的关键 ,特别是在医疗、金融和安全等重要领域。
  • AI幻觉:AI模型可能会生成不准确的信息,也被称为“幻觉”。幻觉通常是由训练数据和算法的局限性造成的。 幻觉可能导致金融、医疗和保险行业违反监管规定;还有可能导致个人名誉受损甚至诽谤。

以上仅列举使用AI工具和系统时的部分注意事项。在实体安全、组织措施、人力资源(包括内部员工和合作伙伴)技术控制及系统监控和审计方面,还有更多需要注意的事项。逐一解决这些关键问题后,企业将可确保其在生产环境中部署的AI应用程序的合规性和安全性。

接下来,本文将介绍MongoDB开发者数据平台如何在安全控制和措施方面提供帮助。

MongoDB如何解决与生成式AI相关的安全风险和数据治理问题

MongoDB开发者数据平台基于MongoDB Atlas 构建,统一了操作、分析和生成式AI数据服务,让智能应用程序的构建更加简单易行。MongoDB Atlas的核心是其灵活的文档数据模型和开发者原生查询API。 这两者相结合可以显著加快开发者的创新速度,使其能够超越竞争对手,并把握生成式AI带来的全新市场机遇。

全球范围内的开发者和数据科学团队正在利用依托MongoDB、以AI为驱动的应用程序来推动创新。这些应用程序涵盖不同行业领域的众多用例,并依托MongoDB Atlas提供的安全控制能力。

在这里插入图片描述

MongoDB的安全与合规能力

MongoDB Atlas为所有组织数据提供嵌入式安全控制能力。 这些数据可以是应用程序数据、矢量嵌入数据和其相关的元数据,为生成式AI驱动的应用程序使用的所有数据提供全面的安全保护。Atlas可以将企业级特性与现有的安全协议和合规标准相集成。此外,Atlas还可简化数据库的部署和管理,同时为开发者构建弹性应用程序提供灵活性。 MongoDB有助于安全管理员轻松与外部系统集成,使开发者能够专注于满足业务需求。除了默认启用的关键安全特性外,MongoDB Atlas 还设计了符合企业安全要求的安全控件。 这些安全控件有助于企业在MongoDB平台上安全地构建AI应用程序,同时兼顾了前述注意事项,具体如下:

  • 数据安全

MongoDB默认启用访问控制和身份验证控制功能。 客户可以使用SCRAM、X.509证书、LDAP、AWS-IAM无密码身份验证和OpenID Connect等机制在平台上进行身份验证。MongoDB采用基于角色的访问控制(RBAC)来决定用户对MongoDB平台内各项资源的访问权限。 在构建AI应用程序时,数据科学家和开发者可以在训练或调优AI模型的同时,使用任意一种访问控制机制来调整用户访问和权限。企业可以通过部署访问控制机制,确保仅授权人员才可访问数据。

端到端数据加密MongoDB的数据加密工具可在数据传输(网络)、数据静态存储、数据使用过程(内存和日志)中为您的数据提供强有力的保护。 客户可以使用自动加密功能对个人身份信息(PII)、受保护的健康信息(PHI)或其他敏感数据等关键数据字段进行加密,确保数据在整个生命周期内都得到加密处理保护。除了静态加密和传输加密外,MongoDB还推出了可查询加密(Queryable Encryption)功能,可以对正在使用的数据进行加密。 可查询加密功能使应用程序能够在客户端对敏感数据进行加密,将加密数据存储在MongoDB数据库中,并在服务器端对加密数据进行查询,且无需对数据进行解密操作。

可查询加密功能是一种卓越的匿名化技术,可使敏感数据变得不可见。在RAG流程中使用MongoDB数据库存储的包含机密信息的公司专用数据时,可以使用可查询加密功能对这些数据进行匿名化处理,或者在数据库中存储敏感数据时也可以利用这一功能。

  • 监管合规和数据隐私

许多生成式AI的应用都受到数据隐私、知识产权和其他相关领域现行法律法规的约束。目前,全球各国正在面向AI制定和实施新的法律法规。MongoDB开发者数据平台对平台安全性、隐私和合规控制进行独立验证,帮助客户达成监管和政策目标,包括满足高度受监管行业和政府机构的特定合规需求等。

  • 定期安全审计

企业应定期开展安全审计,以发现数据安全实践中的潜在漏洞。此举有助于企业及时发现并解决安全漏洞。审计有助于识别和减少AI模型和数据中的风险和错误,并确保企业符合法规及标准要求。MongoDB支持粒度级别的审计功能,可以追踪数据的使用情况和具体内容,监控并检测任何未经授权的数据访问行为。

在使用AI模型时,还有哪些其他最佳实践和注意事项

使用可信的数据平台固然重要,但优先考虑安全性和数据治理同样重要,这一点已在前文述及。除了前文提到的数据安全、合规性和数据隐私,以下是其他一些需要注意的最佳实践和关注事项。

  • 数据质量

监测和评估输入数据的质量,有助于避免基础模型出现偏差。在训练模型数据时,务必确保训练数据在模型应用领域具有代表性。如果计划将模型应用于真实世界场景中,那么应对训练数据或RAG流程使用的数据进行监控。

  • 安全部署

使用安全加密渠道部署基础模型。部署强有力的身份验证和授权机制,以确保只有经过授权的用户和系统才能访问敏感数据和AI模型。实施敏感信息匿名化机制来保护用户隐私。

  • 审计追踪与监控

对模型训练、评估和部署活动进行周密的审计追踪和日志记录。持续监控数据输入和模型输出,以便及时发现意外情况或偏差。MongoDB会保留所有数据操作和数据处理的审计追踪与日志记录。 客户可以基于这些审计日志执行监控、故障排除和安全保障工作,包括入侵检测。我们采用自动扫描、自动预警和人工审核相结合的方法对数据进行监控。

  • 数据存储安全

遵循最佳实践来安全地存储原始数据和处理后的数据。如上所述,使用加密功能对静态数据和传输数据进行加密处理。

MongoDB服务器会自动启用静态数据加密功能。 加密操作在存储层以透明的方式进行;这意味着文件系统中的所有数据文件都会被完全加密,只有在内存中和传输过程中数据才会以未加密的形式存在。

总结

随着生成式AI工具的广泛应用,企业对数据的理解、保护和使用(定义与数据交互的角色、控制、流程和策略)变得比以往任何时候都更加重要。随着现代企业越来越多地采用生成式AI和LLM模型来更好地服务客户并获取更多数据洞察,强有力的数据治理变得不可或缺。只有了解潜在风险,并对数据托管平台的能力进行审慎评估,企业才能安全无虞地发挥这些工具的强大功能。

MongoDB Atlas

MongoDB Atlas 是 MongoDB 公司提供的 MongoDB 云服务,由 MongoDB 数据库的开发团队构建和运维,可以在亚马逊云科技、Microsoft Azure、Google Cloud Platform 云平台上轻松部署、运营和扩展。MongoDB Atlas 内建了 MongoDB 安全和运维最佳实践,可自动完成基础设施的部署、数据库的构建、高可用部署、数据的全球分发、备份等即费时又需要大量经验运维工作。让您通过简单的界面和 API 就 可以完成这些工作,由此您可以将更多宝贵的时间花在构建您的应用上。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/51151.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

基础算法--高精度数据(1)

高精度数据处理一般内容简单,写代码难度较大,可能部分内容涉及基础数学、初等数论等知识。请小心食用。不过本节不会给大家太难的高精度处理,我们第一次接触,不能劝退大家对吧。 高精度算法是指,利用基础或高级的数学…

盘古信息IMS MCM制造协同管理系统:为中小企业数字化转型量身打造的数字化方案

近年来,全球经济的不稳定性,给中小企业的经营和发展带来了巨大的挑战。为提升企业竞争力,中小企业纷纷谋求数字化转型路径,优化生产流程、提高运营效率、降低生产成本,以应对变幻莫测的市场环境。IMS MCM是盘古信息为广…

进阶-4.视图、存储过程、存储函数、触发器

视图、存储过程、存储函数、触发器 1.视图1.1 介绍1.2 语法1.3 视图的检查选项1.4 视图的更新1.5 视图作用1.6 案例 2.存储过程21. 介绍2.2 特点2.3 语法2.4 变量2.4.1 系统变量2.4.2用户自定义变量2.4.3 局部变量 2.5参数2.6条件语句2.6.1 if 语法2.6.2 case 2.7循环结构2.7.1…

通过IDEA创建spring boot的web项目

1.Fle->New->Project,选择Maven&#xff0c;点击Next 2.修改项目名称&#xff0c;点击Finish 3.项目创建完毕&#xff0c;等待Maven下载完成 4.修改pom.xml文件&#xff0c;改成如下内容 <?xml version"1.0" encoding"UTF-8"?> <pr…

增强管道数据流转(EPDR)技术的设计局限和替代

在前文中&#xff0c;我们介绍了EPDR技术的起源&#xff0c;以及使用该技术驱动的业余软件无线电平台专栏。已有玩家通过踩坑证明&#xff0c;进程管道交换数据时间延迟大&#xff0c;构造时间敏感系统难。除非采用传统的紧耦合设计及更大的颗粒度&#xff0c;否则很难在期望的…

Openstack 与 Ceph集群搭建(中): Ceph部署

文章目录 一、部署前说明1. ceph 版本选择依据2. ceph网络要求3. 硬件要求 二、部署架构三、部署过程1. 通用步骤2. 部署管理节点创建账号安装Cephadm运行bootstrap 3. 登录Ceph web4. 将其他节点加入集群同步ceph key安装ceph CLI命令行添加主机节点到集群添加OSD节点将监控节…

【Canvas与艺术】环形橄榄枝纹饰

【成图】 【代码】 <!DOCTYPE html> <html lang"utf-8"> <meta http-equiv"Content-Type" content"text/html; charsetutf-8"/> <head><title>环形橄榄枝(draft2)</title><style type"text/css&quo…

安卓蓝牙日志的获取方法

有过蓝牙调试经历的同学们可能都知道&#xff0c;在安卓系统中&#xff0c;在手机的设置–>开发人员页面下有一个开启蓝牙HCI信息收集日志选项开关&#xff0c;如下图中标红处&#xff0c; 打开该开关&#xff0c;就可以收集本机发送和接收的蓝牙HCI包。蓝牙包的数据会保存在…

git提交本地项目到远程仓库

1、查看项目目录&#xff0c;是否存在.git文件夹&#xff08;若存在则删除&#xff09; 2、登录git并新建一个空白项目 3、idea创建本地git仓库&#xff08;选择本地项目&#xff09; 4、添加要提交的项目&#xff08;项目右键&#xff09; 5、提交代码到本地仓库 6、配置远程…

轻松实现微服务间的无缝通信:OpenFeign入门指南

OpenFeign 前言1、导入依赖2、开启feign调用3、编写OpenFeign客户端4、Fegin接口实现5、Feign接口调用 前言 Spring Cloud OpenFeign是一种基于Spring Cloud的声明式REST客户端&#xff0c;它简化了与HTTP服务交互的过程。它将REST客户端的定义转化为Java接口&#xff0c;并且…

css 宫格样式内容上下结构

结构 <div class"sc-content-group"><div class"sc-content-item"><div class"sc-item-img"><el-image :src"src" :preview-src-list"[src]"></el-image></div><div class"s…

datax关于postsql数据增量迁移的问题

看官方文档是不支持的 数据源及同步方案_大数据开发治理平台 DataWorks(DataWorks)-阿里云帮助中心 (aliyun.com) 看了下源码有个postsqlwriter 看了下也就拼接sql 将 PostgresqlWriter中的不允许更新先注释了 让他过去先 然后看到 WriterUtil中的对应方法 getWriteTemplat…

咸鱼之王手游内购修复无bug运营版联网架设+后台

今天给大家带来一款单机游戏的架设&#xff1a;咸鱼之王手游。 另外&#xff1a;本人承接各种游戏架设&#xff08;单机联网&#xff09; 本人为了学习和研究软件内含的设计思想和原理&#xff0c;带了架设教程仅供娱乐。 教程是本人亲自搭建成功的&#xff0c;绝对是完整可…

【代码随想录训练营第42期 Day38打卡 - 动态规划Part6 - LeetCode 322. 零钱兑换 279.完全平方数 139.单词拆分

目录 一、做题心得 二、题目与题解 题目一&#xff1a;322. 零钱兑换 题目链接 题解&#xff1a;动态规划--完全背包 题目二&#xff1a; 279.完全平方数 题目链接 题解&#xff1a;动态规划--完全背包 题目三&#xff1a;139.单词拆分 题目链接 题解&#xff1a;动…

qt-16可扩展对话框--隐藏和展现

可扩展对话框 知识点extension.hextension.cppmain.cpp运行图初始化隐藏展现--点击--详细按钮 知识点 MainLayout->setSizeConstraint(QLayout::SetFixedSize);//固定窗口大小 extension.h #ifndef EXTENSION_H #define EXTENSION_H#include <QDialog>class Extens…

你是如何更精准地指引模型,激发其无尽的创造力?

随着大型语言模型日益凸显其重要性&#xff0c;发掘并充分利用它们的潜力&#xff0c;很大程度上依赖于我们如何巧妙构思和构造指令——即Prompt的精炼艺术。优化Prompt撰写技巧&#xff0c;将能够更好地引导大模型&#xff0c;为各类应用场景生成高质量的文本输出。分享出你的…

【STM32】C语言基础补充

学习过程中发现自己好些需要用到的C语言语法、特征都不太熟练了&#xff0c;特意记录一下&#xff0c;免得忘记了&#xff0c;以后遇到了新的也会继续更新 目录 1 全局变量 2 结构体 3 静态变量 4 memset()函数 5 使用8位的存储器存16位的数 1 全局变量…

Excel“取消工作表保护”忘记密码并恢复原始密码

文章目录 1.前言2.破解步骤3. 最终效果4.参考文献 1.前言 有时候别人发来的Excel中有些表格不能编辑&#xff0c;提示如下&#xff0c;但是又不知道原始密码 2.破解步骤 1、打开您需要破解保护密码的Excel文件&#xff1b; 2、依次点击菜单栏上的视图—宏----录制宏&#xf…

Keil C51 插件 快速复制一行

此插件解决的问题 目前 Keil 软件 只可以 先选中一行&#xff0c;再Ctrl C Ctrl V , 太麻烦了 Keil 插件 -- Python 代码 import sys# 插入当前行内容 def insert_line(current_file_path, line_number):line_to_insert # 读取文件内容with open(current_file_path, r, enc…

微信小游戏授权问题

微信小程序获取用户相关信息的接口&#xff0c;如wx.getUserCloudStorage&#xff0c;报错&#xff1a;please go to mp to announce your privacy usage。 需要在微信公众平台设置用户隐私保护。