ChatGLM-6B在法律数据集上微调

目录

数据集

训练和推理

依赖

训练

推理


数据集

数据集:lawzhidao_filter.csv (工作台 - Heywhale.com)

处理:

1)筛选'is_best'=1的行,删除'reply'为空的行,在'title'和'question'中选择描述长的列,最后csv文件只包含两列数据['title','reply']。

2)转为json格式(和ChatGLM-6B中ptuning提供的AdvertiseGen数据集一样的格式)。

首先将columns名称改为['content','summary']。(这是因为一开始没注意到可以改train.sh的参数,就把columns改成和AdvertiseGen数据集中一样的了)

代码主要部分是:

df = pd.read_csv(file path)
df.columns = ['content','summary']
df20= df[:20] # 实际中是用split_num将数据集划分为train、val两个部分
df20.to_csv('ori_20.csv',index=False)df1 = []
for i in df20.index:content = df20.loc[i]['content']summary = df20.loc[i]['summary']df_new = {'content':content,'summary':summary}df_new = json.dumps(df_new, ensure_ascii=False)df1.append(df_new)
joined_str = '\n'.join([str(d) for d in df1])
f1 = open('df20.json', 'w')
f1.write(joined_str)
f1.close()

转为json文件后,前十条预览:

['{"content": "在法律中定金与订金的区别订金和定金哪个受", "summary": "“定金”是指当事人约定由一方向对方给付的,作为债权担保的一定数额的货币,它属于一种法律上的担保方式,目的在于促使债务人履行债务,保障债权人的债权得以实现。签合同时,对定金必需以书面形式进行约定,同时还应约定定金的数额和交付期限。给付定金一方如果不履行债务,无权要求另一方返还定金;接受定金的一方如果不履行债务,需向另一方双倍返还债务。债务人履行债务后,依照约定,定金应抵作价款或者收回。而“订金”目前我国法律没有明确规定,它不具备定金所具有的担保性质,可视为“预付款”,当合同不能履行时,除不可抗力外,应根据双方当事人的过错承担违约责任。"}\n','{"content": "盗窃罪的犯罪客体是什么,盗窃罪的犯罪主体", "summary": "盗窃罪的客体要件本罪侵犯的客体是公私财物的所有权。侵犯的对象,是国家、集体或个人的财物,一般是指动产而言,但不动产上之附着物,可与不动产分离的,例如,田地上的农作物,山上的树木、建筑物上之门窗等,也可以成为本罪的对象。另外,能源如电力、煤气也可成为本罪的对象。盗窃罪侵犯的客体是公私财物的所有权。所有权包括占有、使用、收益、处分等权能。这里的所有权一般指合法的所有权,但有时也有例外情况。根据《最高人民法院关于审理盗窃案件具体应用法律若干问题的解释》(以下简称《解释》)的规定:“盗窃违禁品,按盗窃罪处理的,不计数额,根据情节轻重量刑。盗窃违禁品或犯罪分子不法占有的财物也构成盗窃罪。”"}\n','{"content": "非法微整形机构构成非法经营罪吗", "summary": "符合要件就有可能。非法经营罪,是指未经许可经营专营、专卖物品或其他限制买卖的物品,买卖进出口许可证、进出口原产地证明以及其他法律、行政法规规定的经营许可证或者批准文件,以及从事其他非法经营活动,扰乱市场秩序,情节严重的行为。"}\n','{"content": "入室持刀行凶伤人能不能判刑", "summary": "对于入室持刀伤人涉嫌故意伤害刑事犯罪,一经定罪,故意伤害他人身体的,处三年以下有期徒刑、拘役或者管制。犯前款罪,致人重伤的,处三年以上十年以下有期徒刑;致人死亡或者以特别残忍手段致人重伤造成严重残疾的,处十年以上有期徒刑、无期徒刑或者死刑。相关法律规定《中华人民共和国刑法》第二百三十四条故意伤害他人身体的,处三年以下有期徒刑、拘役或者管制。犯前款罪,致人重伤的,处三年以上十年以下有期徒刑;致人死亡或者以特别残忍手段致人重伤造成严重残疾的,处十年以上有期徒刑、无期徒刑或者死刑。本法另有规定的,依照规定。"}\n','{"content": "对交通事故责任认定书不服怎么办,交通事故损", "summary": "事故认定书下发后,如果你对认定不满意,可在接到认定书3日内到上一级公安机关复议。"}\n','{"content": "喝完就又去唱歌回家时去了车祸去唱歌我同意了车是我开的", "summary": "需要结合具体情况判断,看是否酒驾和交通事故责任的划分,根据责任承担责任,赔偿损失。"}\n','{"content": "二审一般要多久", "summary": "《民事诉讼法》对二审的审限作出了规定,一般会在立案一个月内开庭,在三个月内审结,但最长也可以超过三个月。《民事诉讼法》第一百七十六条人民法院审理对判决的上诉案件,应当在第二审立案之日起三个月内审结。有特殊情况需要延长的,由本院院长批准。人民法院审理对裁定的上诉案件,应当在第二审立案之日起三十日内作出终审裁定。"}\n','{"content": "欠钱没有欠条有录音能起诉吗", "summary": "录音资料经过鉴定证实未经剪辑、拼凑、篡改和臆造,并有其他相关证据相印证的,可以认定其效力。"}\n','{"content": "从合伙经营公司撤资,只给欠条有用吗", "summary": "欠条是债权凭证,欠条依据的基础法律关系有事实、不违法的,欠条有效。解除合伙关系,如果经合伙人清算,产生合法欠款,欠条有效。"}\n','{"content": "哪些情况可以先行刑事拘留", "summary": "有下列情形之一的,可以先行拘留:(一)正在预备犯罪、实行犯罪或者在犯罪后即时被发觉的;(二)被害人或者在场亲眼看见的人指认他犯罪的;(三)在身边或者住处发现有犯罪证据的;(四)犯罪后企图自杀、逃跑或者在逃的;(五)有毁灭、伪造证据或者串供可能的;(六)不讲真实姓名、住址,身份不明的;(七)有流窜作案、多次作案、结伙作案重大嫌疑的。公安机关拘留人的时候,必须出示拘留证。"}\n']

训练和推理

模型:ChatGLM-6B (GitHub - THUDM/ChatGLM-6B: ChatGLM-6B: An Open Bilingual Dialogue Language Model | 开源双语对话语言模型)

依赖

安装依赖软件包(根据实际环境):pip install transformers==4.27.1和pip install -U datasets

训练

修改了train.sh中的参数 :文件路径、模型路径、max_steps(1000)和quantization_bit(8)

运行时间:1h54min

loss:3.0降到1.9

GPU:V100 用到了9GB

内存:32GB内,没仔细看

推理

GPU:V100用到了13GB

代码用的是ptuning中README.md的模型部署部分,改了CHECKPOINT_PATH为训练后的路径。

推理效果一般:

[('在饭店上班的地方刀不小心掉脚上了还没有报工伤保险呢,农村合作医疗可以报销吗','1、先到当地劳动部门申请工伤认定,如果单位不申请的话,职工个人就必须在受伤之日起一年内申请;2、如果经工伤鉴定构成伤残的,根据伤残等级,按照工伤保险条例的规定享受工伤保险待遇,包括工伤保险的医疗待遇、的护理待遇、的营养待遇、医疗费、')]

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/661629.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C++面试:数据库不同存储引擎的区别以及如何选择

目录 基础 具体选择原则 Mysql如何选择 创建表时指定存储引擎 修改现有表的存储引擎 查看表的存储引擎 注意事项 总结 在数据库管理系统中,不同的存储引擎提供了不同的存储机制、索引技术、锁定水平和其他功能。以MySQL为例,它支持多种存储引擎&…

认识 SYN Flood 攻击

文章目录 1.什么是 SYN Flood 攻击?2.半连接与全连接队列3.如何防范 SYN Flood 攻击?参考文献 1.什么是 SYN Flood 攻击? SYN Flood 是互联网上最原始、最经典的 DDoS(Distributed Denial of Service)攻击之一。 SYN…

【PyRestTest】进行Benchmarking测试

PyRestTest支持通过Curl请求本身收集比较差的网络环境下的性能指标。 基准测试:它们扩展了测试中的配置元素,允许你进行相似的REST调用配置。然而,它们不对HTTP响应情况进行验证,它只收集指标数据。 下列选项被指定用于benchmar…

[C#][opencvsharp]opencvsharp sift和surf特征点匹配

SIFT特征和SURF特征比较 SIFT特征基本介绍 SIFT(Scale-Invariant Feature Transform)特征检测关键特征: 建立尺度空间,寻找极值关键点定位(寻找关键点准确位置与删除弱边缘)关键点方向指定关键点描述子 建立尺度空间&#xff0…

SpringBoot RestTemplate 设置挡板

项目结构 代码 BaffleConfig /*** Description 记录配置信息* Author wjx* Date 2024/2/1 14:47**/ public interface BaffleConfig {// 是否开启挡板的开关public static boolean SWITCH true;// 文件根目录public static String ROOT_PATH "D:\\TIS\\mock";// …

最新2024如何解决谷歌浏览器Chrome谷歌翻译无法使用问题

快速恢复谷歌浏览器一键翻译功能在Chrome 中安装好【翻译】插件 Macbook 操作步骤: 1点击“前往”,打开“前往文件夹” 2 在对话框中输入“/etc” 囝找到“hosts”文件,复制粘贴到桌面 3 在复制的文件最后新起一行,输入并保存&am…

【Java】小白友好的MyBatis基础学习笔记

目录 MyBatis简介 MyBatis使用流程 配置文件(mybatis-config.xml) 映射文件(UserMapper.xml) DAO 接口(UserMapper.java) 使用 MyBatis Mapper代理 MyBatis核心配置文件 MyBatis参数类型和传递 …

VUE3+TS使用OpenSeadragon学习之旅,实现多图片切换效果

1.官方网站&#xff1a;OpenSeadragon 2.使用npm下载插件&#xff1a;npm install openseadragon 3.在 index.html文件引入资源 <link rel"stylesheet" href"node_modules/openseadragon/build/openseadragon/openseadragon.css" /><script src…

消息队列的应用场景

消息队列的应用场景 消息队列中间件是分布式系统中重要的组件&#xff0c;主要解决应用耦合&#xff0c;异步消息&#xff0c;流量削锋等问题实现高性能&#xff0c;高可用&#xff0c;可伸缩和最终一致性架构使用较多的消息队列有ActiveMQ&#xff0c;RabbitMQ&#xff0c;Ze…

用户界面(UI)、用户体验(UE)和用户体验(UX)的差异

对一个应用程序而言&#xff0c;UX/UE (user experience) 设计和 UI (user interface) 设计非常重要。UX设计包括可视化布局、信息结构、可用性、图形、互动等多个方面。UI设计也属于UX范畴。正是因为三者在一定程度上具有重叠的工作内容&#xff0c;很多从业多年的设计师都分不…

ffmpeg合成mp3音频,解决音频属性不一致问题

1. 需求&#xff0c;amr转成mp3&#xff0c;再将此mp3和其他mp3合成 2. 问题&#xff1a;拼接后的第一段音频可以播放&#xff0c;第二段自动跳过&#xff0c;无法播放。 3. 解决&#xff1a; 3.1 查看各文件属性 # 查看amr转为mp3文件的属性&#xff1a;ffprobe 文件名&am…

嵌入式软件工程师面试题——2025校招社招通用(C/C++)(五十一)

说明&#xff1a; 面试群&#xff0c;群号&#xff1a; 228447240面试题来源于网络书籍&#xff0c;公司题目以及博主原创或修改&#xff08;题目大部分来源于各种公司&#xff09;&#xff1b;文中很多题目&#xff0c;或许大家直接编译器写完&#xff0c;1分钟就出结果了。但…

C语言实现12种排序算法

1.冒泡排序 思路&#xff1a;比较相邻的两个数字&#xff0c;如果前一个数字大&#xff0c;那么就交换两个数字&#xff0c;直到有序。 时间复杂度&#xff1a;O(n^2)&#xff0c;稳定性&#xff1a;这是一种稳定的算法。 代码实现&#xff1a; void bubble_sort(int arr[],…

mysql innodb 之 buffer pool

1 buffer pool 是什么 buffer pool为内存中的一个数据块&#xff0c;主要由三部分组成&#xff1a; 1&#xff09;缓存中的数据页–存储业务数据&#xff0c;大小和磁盘中的数据页大小一样&#xff0c;均为16K。 注&#xff1a;缓冲池和磁盘之间进行数据交换的单位是-数据页 2…

Redis的bitmap使用不当,我内存爆了

背景 最近发现Redis的内存持续暴涨&#xff0c; 涨的有点吓人&#xff0c;机器都快扛不住了&#xff0c;不得不进行Redis内存可视化分析&#xff0c;发现大量的String类型的大key 经分析&#xff0c;最近上线了页面UV的统计&#xff0c;那目前如何做的呢&#xff1f; 通过访…

Ubuntu重装kubernetes集群

重新初始化Kubernetes&#xff08;K8s&#xff09;通常是在集群出现问题或需要重新配置时的一种解决方法。以下是重新初始化K8s的一般步骤&#xff1a; 警告&#xff1a;重新初始化K8s将导致数据丢失&#xff0c;请确保在执行此操作之前进行充分备份。 1.备份数据 在重新初始…

Redux状态管理(运行机制及实例)

背景&#xff1a; JavaScript需要管理的状态越来越多&#xff0c;越来越复杂;这些状态包括服务器返回的数据、缓存数据、用户操作产生的数据等等&#xff0c;也包括一些UI的状态&#xff0c;比如某些元素是否被选中&#xff0c;是否显示加载动效&#xff0c;当前分页。 状态之…

Camille-学习笔记-测试流程和测试设计

## 测试用例学习路线 startmindmap * 测试用例 ** 黑盒测试方法论 *** 等价类 *** 边界值 *** 因果图 *** 判定表 *** 场景法 *** 基于模型的测试 ** 白盒测试方法论 ** 测试用例基础概念 ** 测试用例设计 ** 面试测试用例设计 ** 常用测试策略与测试手段 endmindmap **测试用…

浅谈信号完整性分析

什么是信号完整性?在过去的低速时代,电平跳变时信号上升时间较长,通常几个 ns。器件间的互连线不至于影响电路的功能,没必要关心信号完整性问题。但在今天的高速时代,随着 IC输出开关速度的提高,很多都在皮秒级,不管信号周期如何,几乎所有设计都遇到了信号完整性问题。…

【ACL 2023】Enhancing Document-level EAE with Contextual Clues and Role Relevance

【ACL 2023】Enhancing Document-level Event Argument Extraction with Contextual Clues and Role Relevance 论文&#xff1a;https://aclanthology.org/2023.findings-acl.817/ 代码&#xff1a;https://github.com/LWL-cpu/SCPRG-master Abstract 与句子级推理相比&…