transformers evaluate

☆ Evaluate

https://huggingface.co/docs/evaluate/main/en/installation

★ 解决方案

常用代码

# 查看支持的评估函数
evaluate.list_evaluation_modules(include_community=True)# 加载评估函数
accuracy = evaluate.load("accuracy")# load function description
print(accuracy.description)# load function input description
print(accuracy.inputs_description)
# IN jupyter
accuracy# compute evaluation metric
results = accuracy.compute(references=[...],predictions=[...])# Iterative calculation evaluation indicators
for ref,pred in zip([...],[....]):accuracy.add(references=ref,predictions=pred)
accuracy.compute()# multiple evaluation compute
clf_metrics = evaluate.combine(['accuracy','f1','recall','precision'])
clf_merics.compute(predicitons = [...], references = [...])
# 也可以封装成函数,然后更新字典
import evaluate
acc_metric = evaluate.load('accuracy')
f1_metric = evaluate.load('f1')
def eval_metrics(eval_predict):predictions,labels = eval_predictpredictions = predictions.argmax(axis=-1)acc = acc_metric.compute(preditions = predictions,references=labels)f1 = f1_metric.compute(predictions = predictions, references = labels)acc.update(f1)  # 这里更新字典return acc# 评估对比可视化
from evaluate.visualization import radar_plot # 目前只支持雷达图# 也可以对比多个模型在同一个数据集上的表现
#也可以对比同一个模型在不同数据集上的表现
data = [....]
models = [....]
plot = radar_plot(data = data,model_names=model_names)

✅ 总结

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/web/35552.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

uORF调控翻译-植物综述

这篇文献《uORFs: Important Cis-Regulatory Elements in Plants》详细介绍了上游开放阅读框(uORF)在植物中的重要调控作用。以下是文献的详细总结: 核心内容总结 1. 引言 基因表达的调控涉及多个层面,包括mRNA的转录、翻译和翻…

Linux操作系统通过实战理解CPU上下文切换

前言:Linux是一个多任务的操作系统,可以支持远大于CPU数量的任务同时运行,但是我们都知道这其实是一个错觉,真正是系统在很短的时间内将CPU轮流分配给各个进程,给用户造成多任务同时运行的错觉。所以这就是有一个问题&…

个人网站搭建-步骤(持续更新)

域名申请 域名备案 域名解析 服务器购买 端口转发 Nginx要在Linux上配置Nginx进行接口转发,您可以按照以下步骤进行操作: 安装Nginx(如果尚未安装): 使用包管理工具(如apt, yum, dnf, 或zypper&#x…

高考志愿不知道怎么填?教你1招,用这款AI工具,立省4位数

高中的岁月,就像一本厚厚的书,我们一页页翻过,现在,终于翻到了最后一页。但这不是结束,这是新的开始,是人生的新篇章。 高考落幕,学子们在短暂的放松后,又迎来了紧张的志愿填报。 “…

【面试系列】最全的IT行业岗位要求及必备技能

欢迎来到我的博客,很高兴能够在这里和您见面!欢迎订阅相关专栏: ⭐️ 全网最全IT互联网公司面试宝典:收集整理全网各大IT互联网公司技术、项目、HR面试真题. ⭐️ AIGC时代的创新与未来:详细讲解AIGC的概念、核心技术、应用领域等内容。 ⭐️ 全流程数据技术实战指南:全面…

C++版本号处理3 - 版本号比较

1. 关键词2. verutil.h3. verutil.cpp4. 测试代码5. 运行结果6. 源码地址 1. 关键词 关键词: C 版本号处理 版本号比较 跨平台 实现原理: 通过字符串分割,对每一段的版本号进行逐一比较。 应用场景: 要基于版本号做一些逻辑…

Android 自定义实现灯带跑马灯效果

public class MyMarqueeView extends View {private Paint paint;private RectF rect;private float startX, startY, endX, endY;private float currentX,currentY;/*** 灯大小*/private int radius 15;/*** 多少毫秒绘制一个圆点* 最小80*/private int time 100;/*** 绘制的…

使用bootstrap框架做一个Aotm Blog个人博客

使用bootstrap框架做一个Aotm Blog个人博客,展示一些自己的个人信息,有四个博客分类:心情记录、学习笔记、旅行相册、美食打卡。 主界面图: 心情记录界面 学习笔记界面: 旅行相册界面: 美食打卡界面&#…

深入探索:大型语言模型消除幻觉的解决之道

随着人工智能技术的飞速发展,大型语言模型(LLMs)已经成为自然语言处理领域的明星。它们以其庞大的知识库和生成连贯、上下文相关文本的能力,极大地推动了研究、工业和社会的进步。然而,这些模型在生成文本时可能会产生…

Unity保存玩家的数据到文件中(Unity的二进制序列化)

文章目录 文章运行环境什么是二进制序列化读写文件构造函数 自定义二进制序列化 文章运行环境 Unity2022 什么是二进制序列化 Unity中的二进制序列化是一种将游戏对象或数据结构转换为二进制格式的过程,以便于存储或网络传输。这使数据能够以高效的方式保存&…

liburing和Linux io_uring源码阅读

liburing 版本 系统内核版本: Linux 5.15.0-107-generic #117~20.04.1-Ubuntu x86_64 GNU/Linux 源代码版本: gitgithub.com:torvalds/linux.git v5.15 阅读入口 从最简单的代码看起,即阅读入口:examples/io_uring-test.c 此源文件内部调用liburing相关…

富唯智能推出的AMR复合机器人铝板CNC上下料方案

随着科技的不断进步,CNC加工行业正面临着前所未有的变革。传统的CNC上下料方式已无法满足现代生产对效率、精度和安全性的高要求。在这样的背景下,富唯智能推出的AMR复合机器人铝板CNC上下料方案,以其智能化、自动化的特点,引领了…

Mind+在线图形编程软件(Sractch类软件)

Scratch作为图形编程软件,可以为小朋友学习编程提供很好的入门,是初次接触编程的小朋友的首选开发软件。这里介绍的Mind软件与Sractch用法几乎完全一致,并且可以提供在线免安装版本使用,浏览器直接打开网址: ide.mindp…

LeetCode.32最长有效括号详解

问题描述 给你一个只包含 ( 和 ) 的字符串,找出最长有效(格式正确且连续)括号子串的长度。 解题思路1 有效的括号字符串意味着每一个左括号 ( 都可以找到一个相匹配的右括号 )。栈可以帮助我们追踪尚未匹配的括号,并有效地处理…

Micro-ROS是什么?

Micro-ROS是ROS(Robot Operating System,机器人操作系统)生态系统的一个重要组成部分,专为微控制器(Microcontrollers)设计的轻量级ROS版本。它的目标是在资源有限的嵌入式平台上实现ROS 2的功能&#xff0…

RocketMQ:日常开发中有哪些使用MQ的场景

什么是消息队列? 消息队列是一种通信方法,允许应用程序通过发送和接收消息来互相通信。这些消息/任务/指令存储在一个中间介质中(即队列),并由生产者发送,消费者接收。 使用场景 场景一:任务…

对于使用 C 语言开发的跨平台应用,如何解决不同操作系统和硬件架构带来的底层差异和兼容性问题?

在使用C语言开发跨平台应用时,可以采取以下方法来解决不同操作系统和硬件架构带来的底层差异和兼容性问题: 使用平台无关的标准库:使用C语言标准库提供的函数和数据类型,避免直接使用操作系统特定的函数和数据类型。 使用条件编译…

昇思25天学习打卡营第1天|基本介绍

MindSpore 基本介绍设计理念层次结构 基本介绍 昇思MindSpore是一个全场景深度学习框架,旨在实现易开发、高效执行、全场景统一部署三大目标。 易开发:API友好、调试难度低高效执行:包括计算效率、数据预处理效率和分布式训练效率全场景&am…

手写SpringMVC之ApplicationContextListener

什么是Spring MVC? Spring Web MVC是基于Servlet API构建的原始Web框架,从一开始就包含在Spring Framework中。正式名称“Spring Web MVC”来自其源模块的名称( spring-webmvc ),但它通常被称为“Spring MVC”。 手写…

hive-LEAD() over() 取字段的下一个值

lead(status,1,null) over(partition by shop oreder by month) as next_status --lead()参数1:目标字段;参数2:步长(是取下1个还是下2个);参数3:取不到给NULL SELECTa.related_org_code,a.camera_id,a.event_ti…