开源中文大语言模型汇总

基于英文模型增量预训练的中文模型

LLama系列:

llama作为开源社区的宠儿,有许多基于它的中文模型,下面列举比较流行的一些模型

  • hfl/chinese-llama-2:https://github.com/ymcui/Chinese-LLaMA-Alpaca
  • Linly-Al/Chinese-LLaMA-2:https://huggingface.co/hfl/chinese-llama-2-7b
  • Atom:https://huggingface.co/FlagAlpha/Atom-7B

如果要学习如何做模型训练,推荐学习hfl/chinese-llama-2。如果是要选择强大的中文llama,推荐选Atom。

Mistral系列:

Mistral是超越llama的最强开源模型之一,由于发布时间晚于llama,因此其中文版本较少。

  • openbuddy-mistral:https://huggingface.co/OpenBuddy/openbuddy-mistral-7b-v13-base。openbuddy持续更新了llama、mistral、gemma等模型的中文版本,推荐大家去https://huggingface.co/OpenBuddy找找宝藏。
  • Chinese-Mistral:https://huggingface.co/itpossible/Chinese-Mistral-7B-v0.1。这是huggingface最新开源的中文Mistral,包括base和instruct两个版本。其C-Eval、C-MMLU、MMLU分数高于其他llama、mistral变体,具有较强的中英文能力。
  • JiuZhou:https://huggingface.co/itpossible/JiuZhou-base。该模型的基座模型为Chinese-Mistral,采用大规模中英文地球科学相关语料进行增量预训练,并使用了多种优化方法。由于地球科学是交叉性非常强的学科,因此其C-Eval、C-MMLU、MMLU分数进一步提高。不仅在专业领域表现出较强的语义理解能力,而且能力泛化到通用领域。C-Eval榜单显示,其中文能力仅次于Chatglm2-6B。模型包括base和instruct两个版本。

如果大家需要选用强大的中文Mistral,推荐选JiuZhou。

从头训练的中文模型

  • Qwen系列
  • Chatglm系列
  • Baichuan系列
  • Yi系列

后面持续更新

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/795622.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

dfs,LeetCode 1026. 节点与其祖先之间的最大差值

一、题目 1、题目描述 给定二叉树的根节点 root,找出存在于 不同 节点 A 和 B 之间的最大值 V,其中 V |A.val - B.val|,且 A 是 B 的祖先。 (如果 A 的任何子节点之一为 B,或者 A 的任何子节点是 B 的祖先&#xff0…

Linux高级IO——多路转接之select

文章目录 0. 前言1. 五种IO模型2. 非阻塞IO3. selectselect_serverselect缺点 0. 前言 在应用层用户调用read或者write方法读写的时候,本质上是是拷贝函数。 例如调用read的时候,如果底层接收缓冲区没有数据,那么就会阻塞式的等待&#xff1…

Berkeley CS

Eta Kappa Nu (HKN), Mu Chapter61 A计算机科学 61A — 计算机程序的结构和解释(4 学分) Python4 61 B计算机科学 61B — 数据结构(4 学分) Java4 61 C计算机科学 61C — 机器结构(4 学分)4 CS 70计算机…

真--开源个人收款系统方案--部署方案

继上文:真--个人收款系统方案,今天主要推出部署方案 1.下载源码 首先需要下载源码,源码地址:PayServer: 个人收款系统方案 - Gitee.com 并且pip下载依赖库: Flask2.5.1 Flask-Cors3.0.10 gevent23.6.0 websockets10.9 urllib31.26.1 2.修改配置 路径下有两个py文件&#xf…

Docker简单介绍、特点、与虚拟机技术的区别、核心概念及在CentOS 7 中安装卸载Docker

目录 一、什么是Docker 二、特点 三、Docker与虚拟机技术的区别 四、Docker的核心概念 Docker仓库与仓库注册服务器的区别 五、CentOS7在线安装Docker 安装配置 卸载 一、什么是Docker Docker是一个开源的容器化平台,用于打包、部署和运行应用程序。它利用…

C语言——找单身狗1

题目描述: 在一个整形数组中,只有一个数字出现一次,其他数组都是成对出现的,找出那个只出现一次的数字。 例如: 数组中:1,2,3,4,5,4,3…

【airtest】自动化入门教程(四)Poco元素定位

目录 一、基础操作 1、通过属性名等方式 2、通过属性组合 3、子节点方式 4、子节点加属性组合方式 5、孙节点offspring 6、兄弟节点sibling 7、父节点parent 8、正则表达式 9、直到某个元素出现 10、直到某个元素消失 二、通过局部坐标定位 1、使用局部坐标系的cli…

电商系列之风控安全

> 插:AI时代,程序员或多或少要了解些人工智能,前些天发现了一个巨牛的人工智能学习网站,通俗易懂,风趣幽默,忍不住分享一下给大家。点击跳转到网站。 坚持不懈,越努力越幸运,大家…

使用Python的SQLite和Tkinter库来创建一个简单的查询

要使用Python的SQLite和Tkinter库来创建一个简单的查询系统,你可以遵循以下步骤: 安装所需的库: 如果你还没有安装sqlite3和tkinter库,可以使用pip进行安装。但通常,sqlite3是Python的标准库,而tkinter在大…

【Spring进阶系列丨第七篇】Spring框架新注解分类及详解

文章目录 一、Spring新注解1.1、Configuration注解1.1.1、定义一个类1.1.2、使用Configuration注解修饰类1.1.3、作用 1.2、Bean注解1.2.1、定义bean1.2.2、在主配置类中注册bean1.2.3、测试容器中是否有该bean1.2.4、注册bean的同时可以指定bean名称1.2.5、补充内容1.2.5.1、案…

JAVA IO流学习

File类: File类是java.io包中很重要的一个类 File类的对象可以代表一个文件或者目录,可以修改文件大小、文件最后修改日期、文件名等 File对象不能操作文件的具体数据,即不能对文件进行读和写的操作 File的构造方法: File&…

什么时候外部依赖接口慢拖死应用?

A应用调用B应用,当B应用的接口响应耗时平均都在3000ms的时,如果当前A调用B的请求数达300/s 那么在3s内A应用在途的请求数 300 * 3 900 ,按照servlet原理一个http的请求需要一个线程提供服务,即需要900个线程提供服务&#xff0c…

如何用Python读取Excel中的高亮标注,并统计不同高亮标注的数量

业务场景:当我们对Excel表格标记了不同颜色,我们怎么统计不同颜色的文本框的数量呢? 解决思路: 读取文本框的颜色种类颜色有哪些统计每个种类的个数 from openpyxl import load_workbookdef count_highlighted_colors_in_column…

政安晨【AIGC实践】(一):在Kaggle上部署使用Stable Diffusion

目录 简述 开始 配置 执行 安装完毕,一键运行 结果展示 政安晨的个人主页:政安晨 欢迎 👍点赞✍评论⭐收藏 收录专栏: 人工智能数字虚拟世界实践 希望政安晨的博客能够对您有所裨益,如有不足之处,欢迎在评论区提…

MySQL中的redo log 和 undo log

undo log和redo log 先引入两个概念: 当我们做了一些操作 (update/delete/insert),提交事务后要操作MySql中的数据。 为了能够提升性能,引入了两块区域:内存结构和磁盘结构。 磁盘结构: 主要存储的就是数据页&#x…

【C语言基础】:文件操作详解(前篇:准备知识)

文章目录 一、什么是文件以及文件的分类1.1 程序文件1.2 数据文件1.3 文件名 二、文本文件和二进制文件2.1 数据在文件中的存储 三、文件的打开和关闭3.1 流和标准流3.1.1 流3.1.2 标准流 3.3 文件指针3.5 文件的打开和关闭 一、什么是文件以及文件的分类 文件是指存储在计算机…

编程新手必看,学习python中字符串数据类型内容(8)

1、 Python3 字符串 字符串是 Python 中最常用的数据类型。我们可以使用引号( ’ 或 " )来创建字符串。 创建字符串很简单,只要为变量分配一个值即可。例如: var1 Hello World! var2 "Runoob"Python 访问字符串中的值 Python 不支持单…

Linux(centos7)部署spark

Spark部署模式主要有4种:Local模式(单机模式)、Standalone模式(使用Spark自带的简单集群管理器)、Spark On Yarn模式(使用YARN作为集群管理器)和Spark On Mesos模式(使用Mesos作为集…

自动化运维(九)Ansible 之Jinja2 模板

Jinja2 是一个 Python 的模板引擎库,常用于生成动态的文本内容,如配置文件、HTML 页面等。Ansible 使用 Jinja2 作为默认的模板引擎,用于在 playbook 中动态生成文件内容。 Jinja2 模板允许你在文本中使用变量、条件语句、循环等功能,以实现动态内容的生成。模板文件通常以 .j…

【python】模块测试方法三步走

第一步:写 main 函数 # 你的模块...if __name__ __main__:# 你的测试部分from .. import 上级模块名上级模块名.上级模块函数 ...# 测试部分第二步:加 __init__ 略 第三步:python -m 在项目目录下执行 python -m 命令 python -m 包.模块…