CBLUEbenchmark代码跑通

CBLUEbenchmark 跑通

github源地址
1.配置

  • 数据下载
    新建文件夹CLBUEDatasets,将数据放在该文件夹下
  • 模型下载到github源地址中选择一个模型来下载:
    在这里插入图片描述
    将下载好的模型放在一个专门放模型的文件夹下,我这里是bert
    文件如下所示放置:
    在这里插入图片描述
    2.训练模型(以CMeEE任务为例):
    首先更改examples\run_ee.sh文件
#!/usr/bin/env bashDATA_DIR="../CBLUEDatasets"TASK_NAME="ee"
MODEL_TYPE="bert"
MODEL_DIR="../bert/"#这里是模型存放路径
MODEL_NAME="chinese_wwm_ext_pytorch"#需要使用的模型
OUTPUT_DIR="../data/output"#输出结果地址
RESULT_OUTPUT_DIR="../data/result_output"MAX_LENGTH=128echo "Start running"if [ $# == 0 ]; thenpython ../baselines/run_classifier.py \#这里记得baselines前面加上../--data_dir=${DATA_DIR} \--model_type=${MODEL_TYPE} \--model_dir=${MODEL_DIR} \--model_name=${MODEL_NAME} \--task_name=${TASK_NAME} \--output_dir=${OUTPUT_DIR} \--result_output_dir=${RESULT_OUTPUT_DIR} \--do_train \--max_length=${MAX_LENGTH} \--train_batch_size=16 \--eval_batch_size=16 \--learning_rate=3e-5 \--epochs=5 \--warmup_proportion=0.1 \--earlystop_patience=100 \--max_grad_norm=0.0 \--logging_steps=200 \--save_steps=200 \--seed=2021
elif [ $1 == "predict" ]; thenpython ../baselines/run_classifier.py \#这里也记得加上--data_dir=${DATA_DIR} \--model_type=${MODEL_TYPE} \--model_name=${MODEL_NAME} \--model_dir=${MODEL_DIR} \--task_name=${TASK_NAME} \--output_dir=${OUTPUT_DIR} \--result_output_dir=${RESULT_OUTPUT_DIR} \--do_predict \--max_length=${MAX_LENGTH} \--eval_batch_size=32 \--seed=2021
fi

然后直接执行bash run_ee.sh 对模型进行训练
中间保存的一些数据放在data/output下,运行结束后会有:
在这里插入图片描述

3.预测模型
执行

bash run_ee.sh predict

预测结果会放在data/result_output下:
在这里插入图片描述

4.检查格式是否正确
将原任务的test.json重命名为test_raw.json和测试结果放在format_checker文件夹下:
在这里插入图片描述
然后执行

python format_checker_CMeEE.py CMeEE_test_raw.json CMeEE_test.json

格式正确会:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/772242.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

宁德时代与特斯拉合作;钟睒睒连续四次中国首富丨 RTE 开发者日报 Vol.171

开发者朋友们大家好: 这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE (Real Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、…

全自动引流,每日500+粉丝的秘诀

在如今竞争激烈的市场环境下,如何有效地吸引和保持精准粉丝成为了每个企业主或网红必须面对的问题。然而,许多人可能误以为全自动引流就意味着无人参与,实际上,它更多的是借助一些自动化工具和策略来提升我们的工作效率。今天&…

阿尔吉侬的花束 (典bfs)

0326重写&#xff0c;一个小时终于成功了 #include<algorithm> #include<iostream> #include<cstring> #include<queue>using namespace std;int t; int r,c; char mp[210][210]; bool vis[210][210]; struct node{int x,y; }; int dx[] {1,-1,0,0};…

《量子计算:揭开未来科技新篇章》

随着科技的不断发展&#xff0c;量子计算作为一项颠覆性的技术逐渐走进人们的视野&#xff0c;引发了广泛的关注和探讨。本文将围绕量子计算的技术进展、技术原理、行业应用案例、未来趋势预测以及学习路线等方向&#xff0c;深入探讨这一领域的前沿动态和未来发展趋势。 量子…

springboot swagger 接口文档分组展示

例如将 controller 分成四类&#xff0c;分别放到四个包下&#xff1a; xxx.xxx.xxx.controller.manage xxx.xxx.xxx.controller.client xxx.xxx.xxx.controller.authority xxx.xxx.xxx.controller.common SwaggerConfig.java&#xff1a; import io.swagger.annotations.Api…

【Java程序设计】【C00367】基于(JavaWeb)Springboot的粮仓管理系统(有论文)

TOC 博主介绍&#xff1a;java高级开发&#xff0c;从事互联网行业六年&#xff0c;已经做了六年的毕业设计程序开发&#xff0c;开发过上千套毕业设计程序&#xff0c;博客中有上百套程序可供参考&#xff0c;欢迎共同交流学习。 项目简介 项目获取 &#x1f345;文末点击卡片…

【Python系列】获取字符串的长度

&#x1f49d;&#x1f49d;&#x1f49d;欢迎来到我的博客&#xff0c;很高兴能够在这里和您见面&#xff01;希望您在这里可以感受到一份轻松愉快的氛围&#xff0c;不仅可以获得有趣的内容和知识&#xff0c;也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

STL标准模板库(C++

在C里面有已经写好的标准模板库〈Standard Template Library)&#xff0c;就是我们常说的STL库&#xff0c;实现了集合、映射表、栈、队列等数据结构和排序、查找等算法。我们可以很方便地调用标准库来减少我们的代码量。 size/empty 所有的STL容器都支持这两个方法&#xff0c…

家用洗地机到底怎么选?四大宝藏品牌强推

现在洗地机已经不是什么冷门清洁家电了&#xff0c;我问过身边不少朋友&#xff0c;发现大家在选购的路上&#xff0c;大致分为两派&#xff0c;一类是按照销量和好评来判断优劣&#xff0c;另一类朋友就比较讲究了&#xff0c;会去搜索很多的相关知识&#xff0c;但在这个过程…

阅读笔记(ICIP2023)Rectangular-Output Image Stitching

“矩形输出”图像拼接 Zhou, H., Zhu, Y., Lv, X., Liu, Q., & Zhang, S. (2023, October). Rectangular-Output Image Stitching. In 2023 IEEE International Conference on Image Processing (ICIP) (pp. 2800-2804). IEEE. 0. 摘要 图像拼接的目的是将两幅视场重叠的…

工作中遇到的疑难杂症,以及解决办法

一 pagehelper和自定义mybatis拦截器冲突bug 1.1 问题描述 当在springboot工程&#xff0c;持久层使用mybatis&#xff0c;且使用pagehelper实现分页功能&#xff0c;当随着业务发展&#xff0c;需要自定义一个mybatis的拦截器实现sql的打印&#xff0c;但是出现拦截器失效&…

【JavaScript】JavaScript 程序流程控制 ⑦ ( do-while 循环概念 | do-while 循环语法结构 )

文章目录 一、while 循环1、while 循环概念2、do-while 循环语法结构 二、do-while 循环代码示例1、打印 1-5 数字2、打印 1-10 累加和 一、while 循环 1、while 循环概念 JavaScript 中的 do-while 循环 是 while 循环的变体 , 是 一种 后测试 循环 , 该循环的 循环体 至少执行…

入门编程,一定要从C语言开始吗?

对于编程入门学习者&#xff0c;C语言肯定不是首选。建议先确定自己的发展方向&#xff0c; 如果打算做Web 开发&#xff0c;可以先从学习HTML,CSS,Javascript开始&#xff0c;后台使用Node.JS&#xff0c;也是用Javascript 来编程, 可降低入门门槛。 在开始前我有一些资料…

Copilot 编程助手的介绍及使用

介绍 Copilot 是2021年由 GitHub 与 OpenAI 合作研发的一款编程助手&#xff0c;同时也是全球首款使用OpenAI Codex模型&#xff08;GPT-3后代&#xff09;打造的大规模生成式AI开发工具。 Copilot 底层模型目前经过了数十亿行公开代码的训练&#xff0c;与大多数代码辅助工具…

中科数安 || 防止公司内部文件资料 \数据外泄,图档透明加密防泄密软件,源代码防泄露系统。

#文件防泄密软件# 中科数安是一家专注于信息安全领域的高科技企业&#xff0c;其提供的防止公司内部文件资料及数据外泄的解决方案主要包括图档透明加密和源代码防泄露系统等核心服务。 中科数安 | 图档、源代码防止外泄系统 PC地址&#xff1a; www.weaem.com 1. 图档透明加…

大学宠物医疗试题及答案,分享几个实用搜题和学习工具 #学习方法#笔记#知识分享

大学开学&#xff0c;就意味着又回到了被线性代数、大学物理等测验题折磨的状态了……网站无法手动输入题干公式&#xff0c;初高中用过的搜题软件又都搜不到&#xff0c;想找个答案解析仿佛在大海捞针&#xff01;不过不用怕&#xff0c;今天小林就把从大学攒到毕业工作都在使…

pta L1-082 种钻石

L1-082 种钻石 分数 5 全屏浏览 切换布局 作者 陈越 单位 浙江大学 2019年10月29日&#xff0c;中央电视台专题报道&#xff0c;中国科学院在培育钻石领域&#xff0c;取得科技突破。科学家们用金刚石的籽晶片作为种子&#xff0c;利用甲烷气体在能量作用下形成碳的等离子体…

【微服务】Gateway

文章目录 1.基本介绍官方文档&#xff1a;https://springdoc.cn/spring-cloud-gateway/#gateway-starter1.引出网关2.使用网关服务架构图3.Gateway网络拓扑图&#xff08;背下来&#xff09;4.Gateway特性5.Gateway核心组件1.基本介绍2.断言3.过滤 6.Gateway工作机制 2.搭建Gat…

Nacos部署(一)Linux部署Nacos2.3.x单机环境

&#x1f60a; 作者&#xff1a; 一恍过去 &#x1f496; 主页&#xff1a; https://blog.csdn.net/zhuocailing3390 &#x1f38a; 社区&#xff1a; Java技术栈交流 &#x1f389; 主题&#xff1a; Nacos部署&#xff08;一&#xff09;Linux部署Nacos2.3.x单机环境 ⏱️…