大模型备案安全评估报告编写说明

 

一、语料安全评估

(一)评估内容

1.文本训练语料规模

训练语料存储规模,按文本格式存储时的语料大小。

训练语料数量,按词元(Token)计数。

2.各类型语料规模

训练语料中的中文文本、英文文本、代码、图片、音频、视频及其他语料的规模。

3.训练语料来源

训练语料来源的组成情况,按照开源语料、自采语料、商业语料进行分类。

境外开源网站语料内中文文本、英文文本、代码、图片、音频、视频及其他语料的规模。

自采语料内中文文本、英文文本、代码、图片、音频、视频及其他语料的规模。

商业语料内中文文本、英文文本、代码、图片、音频、

视频及其他语料的规模。

4.语料标注数量

语料标注的数量,仅限文本和图片,按标注单元计数,通常按条数、张数。

5.标注人员情况

标注人员的数量,标注人员的类型,通常包括内部、外包。

标注人员培训时间、培训数量等情况。

6.标注规则

按照《生成式人工智能服务管理暂行办法》第四条要求制定的标注规则。

7.标注内容准确性核验

标注内容准确性人工核验比例。

8.语料合法性

语料来源合法性情况。

语料是否包含侵害他人知识产权内容。

语料是否包含违法违规的个人信息内容。

(二)评估结论

评估结论应包括以下内容:

1.语料是否符合《生成式人工智能服务管理暂行办法》相关规定,是否含有违反我国法律法规明确禁止的内容。

2.语料中包含个人信息语料的数量、种类,是否符合《生成式人工智能服务管理暂行办法》规定。

3.因语料产生知识产权纠纷的风险分析。

4.防范语料安全风险的措施和建议。

二、模型安全评估

1.语料内容评估

采用人工抽检,说明抽检数量与合格率。

采用关键词抽检,说明抽检数量与合格率。

采用分类模型抽检,说明抽检数量与合格率。

2.生成内容评估

采用人工抽检,说明抽检数量与合格率。

采用关键词抽检,说明抽检数量与合格率。

采用分类模型抽检,说明抽检数量与合格率。

3.涉知识产权、商业秘密的评估

评估方法、评判标准以及评估结果等。

4.涉民族、信仰、性别等的评估

评估方法、评判标准以及评估结果等。

5.涉透明性、准确性、可靠性等的评估

评估方法、评判标准以及评估结果等。

三、安全措施评估

1.模型适用人群、场合、用途

服务的适用人群,是否适用未成年人、学生等。

适用场合,是否适用关键信息基础设施、自动控制、医疗信息服务、心理咨询等。

服务范围,是否限定或未限定特定领域。

2.服务过程中收集保存个人信息情况

服务过程中收集保存个人信息情况,包括个人信息的类型、数量、用途以及保存期限。

3.收集个人信息征得个人同意情况

收集个人信息征得个人同意的方式。

4.受理处理使用者查阅、复制、更正、补充、删除个人信息请求的情况

受理处理的条件以及途径方法。

5.图片、视频标识情况

标识的样式,按1:1比例贴入。

标识在图片、视频中的具体位置。

标识频度,如每帧、跳帧等。

6.接受公众或使用者投诉举报情况

接受公众或使用者投诉举报的途径及反馈方式。

7.服务协议情况

上述1至6内容是否已经写入模型服务协议。

8.非法内容拦截措施

监看人员的数量。

预置关键词拦截情况,并提供预置关键词拦截列表。

分类模型的检测情况,说明分类模型研制情况和准确性。

9.拒答率

拒绝回答或者以简单模板回答数量占总测试数量的比率。

10.模型更新、升级

在何种情况下重新进行预训练,如较频繁发现生成非法内容。

重新预训练所需的时间。

计划优化训练(fine-tuning)的频度及所需时间。

四、总体结论

生成式人工智能(大语言模型)安全评估的评估结论重点应包括以下内容:

1.是否符合《生成式人工智能服务管理暂行办法》的相关规定。

2.语料、模型、安全措施等方面存在的主要风险。

3.模型上线提供服务后主要安全风险预判及防范措施建议。

4.如果模型上线提供服务后对用户和社会造成损害,服务提供者是否具备相应处置能力。

5.是否建议上线提供服务。

五、备案建议

如果企业能自己做,可以考虑安排产品、算法、法务等团队成员一起完成大模型备案、算法备案,毕竟找代办公司也是一笔几万块的不少的支出费用,如果自己办理有困难,也欢迎站内信、留言交流。

关于我们

算法备案超过100个项目经验,国内算法备案第一梯队,大模型备案也有多个成功案例,欢迎沟通交流。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/59275.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

ElementUI<el-table></el-table>表格中固定列横向滚动条无法拖动解决

当表格有固定列会出现横向滚动条无法拖动问题,尤其是固定列固定在左边且表格没数据的时候。这可能是因为固定区域盖住了横向滚动条,不是视觉上的覆盖,是去拖动时没有触发效果。 解决方法如下: 1.修改层级 使用z-index&#xff0…

ctfshow web系列

声明: 本文章只适用于网络安全交流与学习,请读者遵循网络安全法,若读者从事一些与网络安全不相关的事情,结果均与本人无关!!! 是ctfshow的web题:https://www.ctf.show/ web3: 开局提示使用php include get url include()函数是…

善用Git LFS来降低模型文件对磁盘的占用

将讲一个实际的例子:对于模型文件,动辄就是好几个G,而有的仓库更是高达几十G,拉一个仓库到本地,稍不注意直接磁盘拉满都有可能。 比如:meta-llama-3.1-8b-instruct,拉到本地后发现居然占用了60G…

十四届蓝桥杯STEMA考试Python真题试卷第二套第五题

来源:十四届蓝桥杯STEMA考试Python真题试卷第二套编程第五题 本题属于迷宫类问题,适合用DFS算法解决,解析中给出了Python中 map() 和列表推导式的应用技巧。最后介绍了DFS算法的两种常见实现方式——递归实现、栈实现,应用场景——迷宫类问题、图的连通性、树的遍历、拓朴排…

MYSQL安装(ubuntu系统)

rpm -qa 查询安装软件包 ps axj 查询服务 卸载mysql(万不得已) ps axj | grep mysql 查看是否存在mysql服务 systemctl stop mysqld 关闭该服务 rpm -qa | grep mysql 查安装mysql安装包 rmp -qa | grep mysql | xargs (yum apt) -y remove进行批量…

智能提醒助理系列-jdk8升级到21,springboot2.3升级到3.3

本系列文章记录“智能提醒助理”产品建设历程,记录实践经验、巩固知识点、锻炼总结能力。 本篇介绍技术栈升级的过程,遇到的问题和解决方案。 一、需求出发点 智能提醒小程序 当前使用的是jdk8,springboot2.3,升级到jdk21和springboot3.3 学…

MMdetection3D环境配置

为啥要写这个?:没看网上有这个全的环境配置教程T^T 首先说明一下,由于mmdetection3d官方文档说支持Linux平台,实验性支持windows,所以我们选择Linux平台进行开发 0.Linux双系统安装 参考这个视频即可 Windows 和 U…

openapi回调地址请求不通过

目录 1. 验证url接口get请求本地自测报错 2. 测试回调模式成功不返回结果 3. 测试回调模式返回结果带双引号 对接企业微信 产生会话回调事件 接口问题解决 1. 验证url接口get请求本地自测报错 java.lang.IllegalArgumentException: Last encoded character (before the pa…

Chrome和夸克谁更护眼

在当今数字化时代,我们每天长时间面对电脑和手机屏幕,眼睛的健康问题变得越来越重要。浏览器作为我们日常使用频率极高的工具,其护眼功能的优劣直接影响到我们的视觉舒适度。本文将对Chrome和夸克两款主流浏览器进行对比,探讨它们…

命令行参数、环境变量、地址空间

命令行参数: int main(int argc, char *argv[ ]),main的参数可带可不带。argc参数通常代表后面的char *argv的元素个数有多少。 在linux中会把输入的字符串存到char *argv[ ]中,在数组的结尾为NULL。 命令行参数可以让同一个程序可以通过不同…

基于Matlab 模拟停车位管理系统【源码 GUI】

系统对进入停车位的车辆进行车牌识别,将识别出来的车牌号显示出来;然后对车主进行人脸识别,框出车主照片的人脸部分作为车主信息的标记,记录在系统库中。车辆在库期间,系统使用者可以随意查看车辆与车主信息的获取过程…

SpringBoot项目集成ONLYOFFICE

ONLYOFFICE 文档8.2版本已发布:PDF 协作编辑、改进界面、性能优化、表格中的 RTL 支持等更新 文章目录 前言ONLYOFFICE 产品简介功能与特点Spring Boot 项目中集成 OnlyOffice1. 环境准备2. 部署OnlyOffice Document Server3. 配置Spring Boot项目4. 实现文档编辑功…

学习笔记:微服务技术栈(一)服务治理框架SpringCloud

教学视频链接: 【SpringCloudRabbitMQDockerRedis搜索分布式,系统详解springcloud微服务技术栈课程|黑马程序员Java微服务】 目录 前言一、认识微服务1.1 服务架构1.2 微服务架构1.3 SpringCloud 二、服务拆分及远程调用2.1 服务拆分细节2.2 服务间调用 …

前端小练习——星辰宇宙(JS没有上限!!!)

前言:在刚开始学习前端的时候,我们会学习到前端三件套中的JavaScript,可能那时候读者没有觉得JavaScript这个语言有多么的牛逼,本篇文章将会使用一个炫酷的案例来刷新你对JavaScript这个语言的认知与理解。 ✨✨✨这里是秋刀鱼不做…

【网络】传输层协议TCP(下)

目录 四次挥手状态变化 流量控制 PSH标记位 URG标记位 滑动窗口 快重传 拥塞控制 延迟应答 mtu TCP异常情况 四次挥手状态变化 之前我们讲了四次挥手的具体过程以及为什么要进行四次挥手,下面是四次挥手的状态变化 那么我们下面可以来验证一下CLOSE_WAIT这…

XingHan-Team团队官网系统源码 全开源

XingHan-Team 官网程序是一个现代化的企业官网管理系统,由星涵网络工作室开发。 本系统提供了完整的网站内容管理功能,包括用户管理、内容发布、成员查询、成员申请等功能。 源码下载:https://download.csdn.net/download/m0_66047725/8995…

vrrp和mstp,vrrp和byd

vrrp和mstp 思路 vrrp是用来虚拟网关,噢,是虚拟一条虚拟网关 优先级,priority越大越优先,优先级相同,哪个的路由器的vrrp先起来,谁就是主 mstp是快速生成树协议,防止环路用的 优先级越小越优…

图说复变函数论重大错误:将无穷多各异平面误为同一面

黄小宁 医学若将前所未知的“新冠”病毒误为已熟知的流感病毒,后果...;数学将前所未知的点集误为已熟知的集就会引出一连串的重大错误。 h定理:点集AB的必要条件是A≌B。 证:(1)任何图≌自己是几何学最起码…

SpringBoot技术:打造新闻稿件管理平台

2相关技术 2.1 MYSQL数据库 MySQL是一个真正的多用户、多线程SQL数据库服务器。 是基于SQL的客户/服务器模式的关系数据库管理系统,它的有点有有功能强大、使用简单、管理方便、安全可靠性高、运行速度快、多线程、跨平台性、完全网络化、稳定性等,非常…

深入理解DMA(直接存储器访问)

直接存储器访问(DMA,Direct Memory Access)是一种允许外设和内存之间直接传输数据的机制,旨在提高数据传输的效率,减少CPU的负担。在传统的数据传输中,CPU负责所有的数据移动和处理,这导致CPU资源被大量占用,影响系统的整体性能。而DMA的出现,正是为了优化这一过程,使…