AI大模型怎么备案?

随着人工智能技术的飞速发展,生成式AI正逐渐渗透到我们的日常生活和各行各业中。从文本创作到艺术设计,从虚拟助手到智能客服,AI的身影无处不在。然而,技术的创新与应用,离不开法律的规范与引导。为进一步保障和监管AI技术创新,我国出台了《生成式人工智能服务管理暂行办法》(以下简称《办法》),为AI技术的合规应用提供了明确的法律框架。此前,我国已经出台了针对深度合成算法的《互联网信息服务深度合成管理规定》(以下简称《深度合成规定》),明确了深度合成服务相关方的义务与主体责任。《办法》和《深度合成规定》构建了针对大模型的“双备案系统”,即“深度合成算法备案”和“大模型备案”。

今年4月,我国又颁布了一批已备案的生成式人工智能服务信息,这标志着对AI服务管理的进一步加强。本文将深入解析《办法》的核心要点,探讨大模型(生成式人工智能)备案的合规,帮助企业与开发者在享受AI技术红利的同时,确保每一步都符合法律规范,共同推动人工智能行业的稳健前行。

生成式AI大模型备案的要求

根据《生成式人工智能服务安全基本要求》需提供以下材料:语料安全、模型安全、安全措施,以及以上的安全自评估。各个板块的重点审查内容如下图所示。

1、语料安全

语料安全确保了大模型训练时使用的数据合规、安全。语料安全的板块涵盖以下内容:

  • 语料来源安全:对于特定语料来源,提供者在采集前后都应进行安全评估;含违法不良信息超过5%的语料不应采集或使用,且不应使用违反我国网络安全相关法律法规要求阻断的信息作为训练语料。

  • 语料来源多样性:应提高语料来源的多样性,确保每种语言和类型的语料都来自多个来源,并合理搭配境内外来源语料。

  • 语料来源可追溯性:使用开源语料时应具有相应的开源授权协议或文件,使用自采语料时应有采集记录,并且避免采集明确不可采集的语料。

  • 商业语料使用:使用商业语料时,应有法律效力的交易合同或合作协议,并应对交易方或合作方提供的语料、承诺、材料进行审核。

  • 语料知识产权保护:应设置知识产权负责人,建立管理策略,对语料中的知识产权侵权风险进行识别,不应使用有侵权问题的语料进行训练。

  • 语料的个人信息保护:使用包含个人信息的语料时,应获得个人信息主体的授权同意,或满足其他合法使用条件。

  • 安全评估:提供者对语料安全情况进行评估时,应采用人工抽检、关键词、分类模型等方法,确保抽样合格率达到规定标准。

  • 语料标注安全:应对标注人员进行安全培训、考核、划分,并指定标注的规则。同时应当对标注语料进行抽检。

2、模型安全

模型安全是为了确保生成式人工智能大模型产品在提供服务时所生成的内容的安全、准确、合法,同时保护知识产权和用户隐私。

  • 模型合规:如需基于第三方基础模型提供服务,应使用已经主管部门备案的基础型。

  • 内容安全性:训练时优先考虑生成内容的安全性,并引导模型产出积极内容。

  • 准确性和可靠性:提高生成内容中数据及表述与科学常识及主流认知的符合程度,减少其中的错误内容,并提高生成内容对使用者的帮助作用。

3.安全措施

建立全面的安全管理体系,包括合规性、风险控制、透明度、用户控制、未成年人保护、响应机制和系统安全性,以促进生成式人工智能服务的健康发展并保护用户权益。

  • 模型安全性:使用经备案的模型,并对关键场合,例如金融、医疗信心、基础设施的风险保护措施,和未成年人使用场景实施额外保护。

  • 服务透明度:公开服务信息、模型算法概要、个人信息用途;显著位置展示,易于用户访问

  • 用户输入信息:提供便捷方式让用户关闭信息训练功能;显著告知信息收集状态和关闭选项。

  • 内容标识:确保图片、视频等内容标识符合国家标准。

  • 计算系统安全:评估供应链安全,芯片支持硬件安全启动,保障系统安全运行。

  • 投诉举报机制:提供投诉举报途径,明确处理规则和时限。

  • 服务稳定性:隔离训练与推理环境,防范攻击;定期安全审计,建立备份和恢复策略。

注意,《生成式人工智能服务安全基本要求》还提出了一些其他条件,包括但不限于:

· 关键词库量不少于10000个,且具有代表性,每周最好至少按照网络需要更新一次词库。

· 建立完整的生成内容测试题库,总规模不少于20000题,且具有代表性。

· 建立完整的拒答测试题库,包含应拒答题库和非拒答题库各500题等等。

随着《生成式人工智能服务管理暂行办法》的实施,大模型备案所涉及到一系列相对复杂的流程与合规问题,对很多行业内的个体经营者提出了新领域的挑战。合规不仅是企业与开发者的责任,更是推动整个行业健康、有序发展的关键。在享受AI技术带来的便利和红利的同时,我们必须时刻保持警醒,确保每一步操作都在法律的框架之内。最后,如各位老友有任何AI领域的法律及合规问题,也随时欢迎来与飒姐共同探讨!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/pingmian/37247.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

cocos creator 调试插件

适用 Cocos Creator 3.4 版本,cocos creator 使用google浏览器调试时,我们可以把事实运行的节点以节点树的形式显示在浏览器上,支持运行时动态调整位置等、、、 将下载的preview-template插件解压后放在工程根目录下,然后重新运行…

kubernetes Deployment yaml文件解析

一、yaml文件示例 apiVersion: apps/v1 kind: Deployment metadata:labels:app: nginxname: nginxnamespace: mtactor spec:replicas: 4revisionHistoryLimit: 10selector:matchLabels:app: nginxstrategy:rollingUpdate:maxSurge: 25%maxUnavailable: 25%type: RollingUpdate…

C++:inline关键字nullptr

inline关键字 C中inline使用关键点强调 (1)inline是一种“用于实现的关键字”,而不是一种“用于声明的关键字”,所以关键字 inline 必须与函数定义体放在一起,而不是和声明放在一起 (2)如果希望在多个c文件中使用,则inline函数应…

树莓派4B_OpenCv学习笔记15:OpenCv定位物体实时坐标

今日继续学习树莓派4B 4G:(Raspberry Pi,简称RPi或RasPi) 本人所用树莓派4B 装载的系统与版本如下: 版本可用命令 (lsb_release -a) 查询: Opencv 版本是4.5.1: 今日学习 OpenCv定位物体实时位置,代码来源是…

阿里AIDC - 杭州 - 渗透测试岗

渗透测试岗 - 阿里AIDC - 杭州 面试开始 一、自我介绍 - 2分钟二、面试官提问与个人对答三、问面试官问题面试结束 结果:个人觉得悬,但是对方很有礼貌,说话态度也非常好总结:其实问题问的并不是特别难,主要是自己对攻击…

操作系统期末复习(对抽象概念的简单形象化)

操作系统 引论 定义与基本概念:操作系统是计算机硬件与用户之间的桥梁,类似于家中的管家,它管理硬件资源(如CPU、内存、硬盘),并为用户提供方便的服务(应用程序执行、文件管理等)。…

从 Linux 向 Windows 传文件和从 Windows 向 Linux 传文件的方法

这两种传递文件的方式是可行的,下面是对每种方式的具体说明和步骤: 1. 从 Linux 向 Windows 传文件 使用 Python 的 HTTP 服务器,可以在 Linux 端快速搭建一个简单的文件服务器。 步骤如下: 在 Linux 终端中,进入你…

IDEA SpringBoot整合SpringData JPA(保姆级教程,超详细!!!)

目录 1. 简介 2. 创建SpringBoot项目 3. Maven依赖引入 4. 修改application.properties配置文件 5. Entity实体类编写 6. Dao层接口开发 7. 测试接口开发 8. 程序测试 1. 简介 本博客将详细介绍在IDEA中,如何整合SpringBoot与SpringData JPA,以…

用于程序搜索的智能融合算法的设计与实现(C++,已用于程序中)

该程序搜索算法是我最近写的软件中使用到的算法,软件的项目地址如下:https://github.com/ghost-him/QuickLaunch/。建议打开源码,找到对应的代码后再阅读本文章。 该算法已经应用在软件中,并且取得了令我自己很满意的效果。 前言…

TIOBE 6月榜单出炉!编程语言地位大洗牌,谁才是王?

C历史上首次超越C!!! TIOBE 公布了 2024 年 6 月编程语言的排行榜:https://www.tiobe.com/tiobe-index/ 排行榜 以下列出的语言代表了第51至第100名。由于它们之间的差异相对较小,编程语言仅以字母顺序列出。 ABC, A…

如何实现HPC数据传输的高效流转,降本增效?

高性能计算(HPC)在多个行业中都有应用,涉及到HPC数据传输的行业包括但不限于: 1.科学研究:在物理学、化学、生物学、地球科学等领域进行模拟和建模。 2.工程和产品设计:进行复杂系统的设计和分析&#xf…

CesiumJS【Basic】- #023 加载webm文件(Entity方式)

文章目录 加载webm文件(Entity方式)1 目标2 代码2.1 main.ts3 资源文件加载webm文件(Entity方式) 1 目标 使用Entity方式加载webm文件 2 代码 2.1 main.ts /** @Author: alan.lau* @Date: 2024-06-16 11:15:48* @LastEditTime: 2024-06-16 11:43:02* @LastEditors: al…

江山欧派杯2024全国华佗五禽戏线上线下观摩交流比赛在亳州开幕

6月28日,2024全国华佗五禽戏线上线下观摩交流比赛在安徽省亳州市开幕。 此次比赛是由安徽省亳州市文化旅游体育局和安徽省非物质文化遗产保护中心主办、亳州市华佗五禽戏协会(国家级非遗华佗五禽戏保护单位)和亳州市传统华佗五禽戏俱乐部&…

linux 设置程序自启动

程序随系统开机自启动的方法有很多种, 这里介绍一种简单且常用的, 通过系统的systemd服务进行自启动。 第一步: 新建一个.service文件 sudo vim /etc/systemd/system/myservice.service[Unit] DescriptionMy Service #Afternetwork.target[…

【鸿蒙】稍微理解一下Stage模型

鸿蒙的Stage模型是HarmonyOS多端统一的应用开发框架中的一个核心概念,用于描述应用的界面层次结构和组件之间的关系。下面将详细解析Stage模型的主要组成部分和特点: 模型组成: UIAbility组件:这是应用中负责绘制用户界面的组件&a…

LeetCode:经典题之206、92 题解及延伸

系列目录 88.合并两个有序数组 52.螺旋数组 567.字符串的排列 643.子数组最大平均数 150.逆波兰表达式 61.旋转链表 160.相交链表 83.删除排序链表中的重复元素 389.找不同 1491.去掉最低工资和最高工资后的工资平均值 896.单调序列 206.反转链表 92.反转链表II 141.环形链表 …

【应用开发二】GPIO操控(输出、输入、中断)

1 操控GPIO方式 控制目录:/sys/class/gpio /sys/class/gpio目录下文件如下图所示: 1.1 gpiochipX目录 功能:当前SoC所包含的所有GPIO控制器 i.mx6ull一共包含5个GPIO控制器,分别为GPIO1~5分别对应gpiochip0、gpiochip32、gpi…

视频共享融合赋能平台LntonCVS安防监控平台现场方案实现和应用场景

LntonCVS国标视频融合云平台采用端-边-云一体化架构,部署简单灵活,功能多样化。支持多协议(GB28181/RTSP/Onvif/海康SDK/Ehome/大华SDK/RTMP推流等)和多类型设备接入(IPC/NVR/监控平台)。主要功能包括视频直…

【2024大语言模型必知】做RAG时为什么要使用滑动窗口?句子窗口检索(Sentence Window Retrieval)是什么?

目录 1. 传统的向量检索方法,使用整个文档检索,为什么不行? 2.句子滑动窗口检索(Sentence Window Retrieval)工作原理 3.句子滑动窗口检索(Sentence Window Retrieval)的优点 1. 传统的向量检…

区块链的技术架构:节点、网络和数据结构

区块链技术听起来很高大上,但其实它的核心架构并不难理解。今天我们就用一些简单的例子和有趣的比喻,来聊聊区块链的技术架构:节点、网络和数据结构。 节点:区块链的“细胞” 想象一下,区块链就像是一个大型的组织&a…