书生模型实战L1---OpenCompass 评测

书生模型实战系列文章目录

第一章 入门岛L0(Linux)
第二章 入门岛L0(python)
第三章 入门岛L0(Git)
第四章 基础岛L1(书生全链路开源介绍)
第五章 基础岛L1(Demo)
第六章 基础岛L1(Prompt)
第七章 基础岛L1(RAG)
第八章 基础岛L1(XTuner 微调)
提示:以上内容可以看往期文章
第九章:基础岛L1(OpenCompass 评测)


文章目录

  • 书生模型实战系列文章目录
  • 作业
    • 基础作业
    • 进阶作业
  • 提交作业
    • 基础作业提交
    • 进阶作业提交
  • 一、OpenCompass 是什么?


作业

基础作业

在这里插入图片描述

进阶作业

在这里插入图片描述

提交作业

基础作业提交

在这里插入图片描述

进阶作业提交

暂未完成

一、OpenCompass 是什么?

https://rank.opencompass.org.cn/leaderboard-multimodal/?m=REALTIME

上海人工智能实验室科学家团队正式发布了大模型开源开放评测体系 “司南” (OpenCompass2.0),用于为大语言模型、多模态模型等提供一站式评测服务。其主要特点如下:

开源可复现:提供公平、公开、可复现的大模型评测方案

全面的能力维度:五大维度设计,提供 70+ 个数据集约 40 万题的的模型评测方案,全面评估模型能力 丰富的模型支持:已支持 20+
HuggingFace 及 API 模型 分布式高效评测:一行命令实现任务分割和分布式评测,数小时即可完成千亿模型全量评测
多样化评测范式:支持零样本、小样本及思维链评测,结合标准型或对话型提示词模板,轻松激发各种模型最大性能
灵活化拓展:想增加新模型或数据集?想要自定义更高级的任务分割策略,甚至接入新的集群管理系统?OpenCompass 的一切均可轻松扩展

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/52248.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

打卡学习Python爬虫第五天|使用Xpath爬取豆瓣电影评分

思路:使用Xpath爬取豆瓣即将上映的电影评分,首先获取要爬取页面的url,查看页面源代码是否有我们想要的数据,如果有,直接获取HTML文件后解析HTML内容就能提取出我们想要的数据。如果没有则需要用到浏览器抓包工具&#…

【Oracle19c】手工数据统计信息并导入dmp数据

1、数据统计信息 1.设置并行收集 SQL> set timing on SQL> exec dbms_stats.set_global_prefs(CONCURRENT,TRUE);2.开始收集全库统计信息 begin dbms_stats.gather_database_stats(ESTIMATE_PERCENT>DBMS_STATS.AUTO_SAMPLE_SIZE, method_opt > for all indexed c…

网络初识部分

1.网络 单机时代-局域网时代-广域网时代-移动互联网时代 局域网时代:通过路由器把几个电脑连接起来。 广域网时代:把更多的局域网连接到一起,构成的网络更庞大,可能已经覆盖了一个城市/国家/全世界。 2.什么是路由器&#xff…

React Native中好用的UI组件库

文章目录 前言1.React Native ElementsStar数超24K地址 2.React Native UI KittenStar数超20K地址 3.NativeBaseStar数超20K地址 前言 下面是React Native中一些常用的UI库 1.React Native Elements Star数超24K 官方介绍 React Native Elements 的目标是提供一套用于在 Rea…

洛谷官方精选题单解析(持续更新~)

首页 - 洛谷 | 计算机科学教育新生态 https://www.luogu.com.cn/ 真题解析-CCF-GESP编程能力等级认证 https://gesp.ccf.org.cn/101/1010/index.html 我会陆续针对每一道题目发独立博客,剖析解题思路、知识点及代码。 目录 1、【入门1】顺序结构(1…

Node.js自学速通---- 24-8-22 22-44

目录 一、安装 Node.js二、Node.js 的基本概念三、创建第一个 Node.js 应用四、使用模块五、创建 HTTP 服务器六、案例:文件服务器 Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行环境,可以让 JavaScript 在服务器端运行。 一、安装 Node.js 打…

ORA-01950表空间使用权限报错排查

ORA-01950表空间使用权限报错排查 报错信息授权但是没用?到底谁没权限?报错信息 用户USER2对表USER1.T1本身有DML权限。 用户USER2往USER1的表T1插入数据报错 ORA-01950: Error : 1950, Position : 20, SQL = INSERT INTO USER1.T1 (L_DATE)VALUES (:1 ) RETURNING ROWID …

三维模型单体化软件:地理信息与遥感领域的精细化革命

在地理信息与遥感科学日新月异的发展浪潮中,单体化软件作为一股强大的驱动力,正引领着我们迈向空间信息处理与应用的新纪元。本文旨在深度解析单体化软件的核心价值、技术前沿、实践应用及面临的挑战,共同探讨这一技术如何塑造行业的未来。 …

Python生成JMeter测试脚本----HTTP信息头管理器和用户定义的变量

前言 之前的文章写了怎么用python生成JMeter脚本,生成了测试计划、线程组、Http监听器组件、响应断言、查看结果树、汇总报告、聚合报告、响应时间图。本篇内容接着讲怎么用python生成HTTP信息头管理器和用户定义的变量组件。 HTTP信息头管理器 信息头管理器的内…

client网络模块的开发和client与server端的部分联动调试

客户端网络模块的开发 我们需要先了解socket通信的流程 socket通信 server端的流程 client端的流程 对于closesocket()函数来说 closesocket()是用来关闭套接字的,将套接字的描述符从内存清除,并不是删除了那个套接字,只是切断了联系,所以我们如果重复调用,不closesocket()…

解决图片导入Excel后变成横向问题

最近有同事遇到图片打开的时候是竖向的,导入Excel后就变成横向了 我在网上搜了一下,没找到直接的答案 我猜大概是用了某些软件做处理(例如压缩分辨率)但是没处理干净 后来经过多次尝试,发现只要用windows自带的画图软件…

FouriDown: Factoring Down-Sampling into Shuffling and Superposing

摘要 https://openreview.net/pdf?idnCwStXFDQu 空间下采样技术,如步长卷积、高斯下采样和最近邻下采样,在深度神经网络中至关重要。在本文中,我们重新审视了空间下采样家族的工作机制,并分析了先前方法中使用的静态加权策略所…

【头条的AI IDE MarsCode】

文章目录 1、AI云端IDE2、网址3、可以直接导入github上的仓库代码4、总结 1、AI云端IDE 操作很简单,打开豆包MarsCode 云端 IDE,通过 GitHub 链接导入 Cambrian-1 代码库,向豆包MarsCode 提问。让豆包MarsCode 介绍 Cambrian-1 项目&#xf…

安卓主板_MTK联发科主板定制开发|PCBA定制开发

MTK联发科安卓主板,采用MT6762八核平台方案,支持谷歌Android 11.0系统,MT6762采用ARM八核A53内核芯片、主频高达2.0GHz,GPU采用ARM PowerVR GE8329650MHZ,支持主流19201080分辨率,支持硬解H.264&#xff0c…

十分钟教会你在python中使用Redis

文章目录 一、Redis 简介二、Redis 特性三、Redis 使用场景四、Redis 客户端与常用命令五、Redis在Python上的操作1. 安装 redis-py 库2. 连接Redis服务器3. 数据操作字符串操作设置键值对 set(key, string)获取字符串 get(key)检查键是否exists(key)删除键delete(key)批量设置…

Win10安装ChatTTS-2024-cuda10.1

0x00 前言 ChatTTS是专门为对话场景设计的文本转语音模型,例如大语言助手对话任务。它支持英文和中文两种语言。最大的模型使用了10万小时以上的中英文数据进行训练。目前在huggingface中的开源版本为4万小时训练且未SFT的版本。 0x01 准备环境 版本操作系统Win1…

鸿蒙内核源码分析(忍者ninja篇) | 都忍者了能不快吗

ninja | 忍者 ninja是一个叫 Evan Martin的谷歌工程师开源的一个自定义的构建系统,最早是用于 chrome的构建,Martin给它取名 ninja(忍者)的原因是因为它strikes quickly(快速出击).这是忍者的特点,可惜Martin不了解中国文化,不然叫小李飞刀更合适些.究竟有多块呢? 用Martin自…

Uniapp使用InnerAudioContext返回内部 audio 上下文 ,获取不到duration当前音频的长度,如何解决?

原因:其实是wx的bug,这个问题在开发环境中,并不会遇到。而是真机测试或发版后,就获取不到duration。 解决:我们只要去手动播放音频后,就会抓取到duration。 代码示例 关键代码 this.audioContext.play(); //手动播放音频 完整代码 Audio…

本地Docker部署Navidrome音乐服务器与远程访问听歌详细教程

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:kwan 的首页,持续学…

StarRocks 存算分离数据回收原理

前言 StarRocks存算分离表中,垃圾回收是为了删除那些无用的历史版本数据,从而节约存储空间。考虑到对象存储按照存储容量收费,因此,节约存储空间对于降本增效尤为必要。 在系统运行过程中,有以下几种情况可能会需要删…