Llama3中文聊天项目全能资源库

Llama3 中文聊天项目综合资源库,集合了与Lama3 模型相关的各种中文资料,包括微调版本、有趣的权重、训练、推理、评测和部署的教程视频与文档。1. 多版本支持与创新:该仓库提供了多个版本的Lama3 模型,包括基于不同技术和偏好的微调版本,如直接中文SFT版、Instruct偏好强化学习版、趣味版等。此外,还有Phi3模型中文资料仓库的链接,和性能超越了8b版本的Llama3。2. 部署与使用:项目提供了网页部署的代码和教程,使用户可以轻松地在网页上使用这些模型。部署教程包括如何在Streamlit上部署这些模型进行在线体验。3. 训练与推理资源:除了已经提供的模型,仓库还包括多种训练和推理的资源,如训练教程、推理脚本、优质训练数据集的整理等。4. 扩展和增强:项目还在计划中包括增加更多的扩展如角色扮演增强模型、长上下文支持等,旨在提升模型的功能和适应更多复杂场景的能力。
808cb24a80fcdc5c41d499229164f4ee.jpeg添加图片注释,不超过 140 字(可选)


da178585c785478c4552ce76eb09533a.jpeg添加图片注释,不超过 140 字(可选)
可用Chat版模型整理lama3相关对话版本优质权重整理:shareAl系列:1.base预训练+直接中文SFT版训练数据:https://modelscope.cn/datasets/baicai003/Llama3-Chinese-dataset/summaryV1版0penCSG满速下载:https://opencsg.com/models/shareAl/llama3-Chinese-chat-8bWiseModel满速下载:https://wisemodel.cn/models/shareAl/llama3-Chinese-chat-8bV2版modelscope:https://modelscope.cn/models/baicai003/Llama3-Chinese_v2/summary2.Instruct+继续中文SFT版modelscope模型下载:https://modelscope.cn/models/baicai003/llama-3-8b-Instruct-chinese_v2/summary3.Instruct+强化学习中文版

  • DPO 表情趣味版(10分钟左右可训练好,对原多语言instruct版最小化性能损伤,实测超过大多中文大量训练版)
  • Modelscope:下载:https://modelscope.cn/models/baicai003/Llama3-Chinese-instruct-DPO-beta0.5/summary
  • 偏好学习数据集:DP0-zh-en-emoji
  • Base预训练+海量中文优质数据增量预训练:正在进行中
  • 70b 中文版:计划中。

4.下面几个版本因对话模版格式不同暂时不支持网页部署推理,需要用fastchat体验

  • Base+ 中文SFT: https://modelscope.cn/models/zhuangxialie/Llama3_Chinese_Sft/files
  • Base+ ORPO: https://modelscope.cn/models/zhuangxialie/Llama3-Chinese-ORPO/summary 偏爱长对话
  • Instruct + DPO: https://www.modelscope.cn/models/zhuangxialie/Llama3-Chinese-DPO/summary 偏爱长对话

5.llama3 Pro(加block版,推荐网友积极在该方案上做更多尝试、探索)linjh1118网友(第一个ORPO偏好对齐+扩展2*blocks):htps://github.com/linjh1118/Llama3-Chinese-0RPO6.llama3 Moe增强版cooper12121-lama3-8x8b-MoE: https://github.com/cooper12121/llama3-8x8b-MoE7.长上下文版本联通微调版v2(中文,28k上下文):https://huggingface.co/UnicomLLM/Unichat-llama3-Chinese-8B-28K

  • 262k上下文(英文):https://huggingface.co/gradientai/Llama-3-8B-nstruct-262k
  • 262k上下文(中文):计划中
  • 无限上下文版本:计划中,参考:https://medium.com/neoxia/lm-infini-attention-with-linear-complexity-3209b87a77c3

8.其他普通中文微调版本

  • 联通微调版(SFT,网友尝试反馈幻觉多):
  • https://www.modelscope.cn/models/UnicomAl/Unichat-llama3-Chinese/summary-
  • Openbuddy微调版(SFT,据说不错):
  • https://www.modelscope.cn/models/0penBuddy/openbuddy-llama3-8b-v21.1-8k/summary
  • zhichen微调版(ORPO方法,应该是第一个orpo):https://github.com/seanzhang-zhichen/llama3-chinese
  • shenzhi-wang微调版(ORPO方法,说是第一个orpo):https:/huggingface.co/shenzhi-wang/Llama3-8B-Chinese-Chat
  • Rookie微调版(SFT):https://github.com/Rookie1019/Llama-3-8B-nstruct-Chinese-hit-sz klc lab
  • 微调版本:https://github.com/zyg18181818/Llama-3-Chinese

9.破解安全限制系列(暂时只支持英文)

  • Unholy:https://huggingface.co/Undi95/Llama-3-Unholy-8B
  • neural-chat: https://hf-mirror.com/Locutusque/llama-3-neural-chat-v1-8b
  • dolphin: https://huggingface.co/cognitivecomputations/dolphin-2.9-llama3-8b

10.v-llama3 多模态图文版 (英文,支持视觉问答)

  • Bunny-Llama-3-8B-V:https://wisemodel.cn/models/BAAl/Bunny-Llama-3-8B-V
  • llava-llama-3-8b: https://huggingface.co/xtuner/llava-llama-3-8b-v1_1

11.agent工具能力增强版ModelScope Chinese Agent版V1(中文,可根据要求帮你选择工具)https://modelscope.cn/models/swift/Llama3-Chinese-8B-nstruct-Agent-v1/summary基于EmoLLM心理数据微调的Llama3-8B-Instruct 模型

  • EmoLLM 3.0 在线体验链接
  • EmoLLM Llama3心理咨询室V3.0 https://st-app-center-006861-9746
  • ilroxvg.openxlab.space/
  • 或者前往0penXLab EmoLLM3.0-Llama3启动

https://openxlab.org.cn/apps/detai/chg0901/EmoLLM-Llama3-8B-nstruct3.0模型链接**OpenXLab**https://openxlab.org.cn/models/detai/chg0901/EmoLLM-Llama3-8B.-Instruct3.0ModelScopehttps://modelscope.cn/models/chg0901/EmoLLM-Llama3-8B-Instruct3.0/summary新增Phi3模型中文资料仓库(性能超越llama3 8b,以小搏大),正在适配中https://github.com/CrazyBoyM/phi3-Chinese新增趣味版,数据集已开源:https://modelscope.cn/models/baicai003/Llama3-Chinese-instruct-DP0-beta0.5/summary模型测评
284f1b2a2e19e658c7a83146fca806e1.jpeg添加图片注释,不超过 140 字(可选)

ac61257390536959ae236f25556ecb87.jpeg添加图片注释,不超过 140 字(可选)
可用训练工具整理下面的库都是相当好用的,代码封装简洁又清晰,如果你也想微调个自己的llama3 中文定制版,不要错过

  • Firefly-https://github.com/yangjianxin1/Firefly
  • 萤火虫-https://github.com/yangjianxin1/Firefly
  • LLaMA-Factory-https://github.com/hiyouga/LLaMA-Factory
  • unsloth-https://github.com/unslothai/unsloth
  • Xtuner-https://github.com/SmartFlowAl/Llama3-XTuner-CN
  • SWlFT-https://github.com/modelscope/swift
  • 高性价比gpu资源:https://www.ucloud.cn/site/active/gpu.html?ytag=gpu_697558837_tongyong_toutiao

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/837036.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

STK12 RPO模块学习(2)

一、Coast RPO Sequence 这个序列运行卫星直到它达到了下面三个条件之一。 1)截至时间。2)圈数到达了限制。3)其他条件,比如近地点。 默认情况下,Astrogator使用“Earth HPOP Default v10”预报器。你能够修改呈其他修改器。下…

【Linux线程(一)】线程初理解

前言: (一)线程的概念 (二)线程的理解 (三)示例 (四)线程优缺点 线程的优点 线程的缺点 (五)线程和进程的切换 1.线程的切换 2.进程的切换…

【Docker学习】重启容器的docker restart

命令: docker container restart 描述: 重启一个或多个容器 用法: docker container restart [OPTIONS] CONTAINER [CONTAINER...] 别名: docker restart(docker的一些命令可以简写,docker restart就等同于docker cont…

对Windows超融合S2D的一些补充

先说一个不知道算不算BUG的例子,下面这个存储池是用两台服务器各2块10G建立的,除去系统保留的部分,显示还有13G可用。 但如果使用其新建虚拟磁盘会显示可用的空间为0 然后我又各增加了一块10G硬盘进池,变成了可用空间为30.5GB …

JavaEE之线程(4)——线程安全、线程安全的原因,synchronized关键字

前言 在本栏的前面的内容中,我们介绍了线程的创建、Thread 类及常见方法、线程的状态,今天我们来介绍一下关于线程的另一个重点知识——线程安全。 一、线程安全 基本概念: 线程安全的确切定义是复杂的,但我们可以这样认为&…

哪里可以找到可靠的代理IP?

需要代理来访问受限制的网站或改善您的在线隐私?别再犹豫了!在这篇博文中,我们将探讨您可以使用的选项,并提供有关在哪里获取代理的指导。 首先,让我们了解什么是代理及其工作原理。代理充当您的设备和互联网之间的中介…

《Mybatis》系列文章目录

什么是 MyBatis? MyBatis 是一款优秀的持久层框架,它支持自定义 SQL、存储过程以及高级映射。MyBatis 免除了几乎所有的 JDBC 代码以及设置参数和获取结果集的工作。MyBatis 可以通过简单的 XML 或注解来配置和映射原始类型、接口和 Java POJO&#xff…

【触想智能】无风扇工控一体机的优点与定制要求分析

随着工业自动化的不断推进,工控一体机作为自动化生产的核心设备,在工业生产中发挥着越来越重要的作用。 在工控一体机的设计中,散热是一个非常关键的问题,而无风扇工控一体机的出现为解决这个问题提供了新方法。 无风扇工控一体机…

Rx(Reactive Extensions)的由来

既然我们已经介绍了响应式编程,现在是时候了解我们的明星了:响应式扩展,通常简称为Rx。微软开发了Reactive扩展库,使其易于处理事件流和数据流。在某种程度上,时变值本身就是一个事件流;每个值更改都是一种类型的事件它会更新依赖…

使用Docker安装Nginx

一、Nginx介绍 Nginx 是一款高性能的开源 Web 服务器和反向代理服务器,具有高效能、高稳定性、低资源消耗等优点。可以处理大量并发请求,支持多种协议,还能实现负载均衡、缓存等功能,在互联网应用中被广泛使用。在Nginx中&#xf…

【数据可视化01】matplotlib实例介绍1

目录 一、引言二、实例介绍1.柱状图1)简单柱状图2)堆叠柱状图 2.线条形式3.折线图(多子图)4.散点图5.水平和垂直线条6.饼状图1)饼状图2)“条形饼”图 一、引言 matplotlib是一个用于绘制数据可视化的Python库。它可以创建各种静态…

虚拟资源在线交易服务平台源码 线上虚拟商品交易平台搭建

在信息爆炸的时代,虚拟资源、素材、源码系统等等以其独特的魅力,逐渐成为人们日常生活和工作中不可或缺的一部分。如何高效地获取、管理和交易这些虚拟资源,分享一款虚拟资源在线交易服务平台源码,轻松搭建线上虚拟商品交易平台&a…

C++之Eigen库基本使用(下)

1、常见变换 Eigen::Matrix3d //旋转矩阵(3*3) Eigen::AngleAxisd //旋转向量(3*1) Eigen::Vector3d //欧拉角(3*1) Eigen::Quaterniond //四元数(4*1) Eigen::Isom…

Docker运行出现iptables: No chain/target/match by that name报错如何解决?

在尝试重启 Docker 容器时遇到的错误信息表明有关 iptables 的配置出了问题。这通常是因为 Docker 需要配置网络,而 iptables 规则没有正确设置或被意外删除。具体到你的错误信息中,报错 iptables: No chain/target/match by that name 表示 Docker 尝试…

深入理解与应用C++ Vector

1. C Vector 简介与基本使用 C 的 vector 是一个序列容器,用于表示可变大小的数组。它结合了数组的高效元素访问和动态大小调整的灵活性。与静态数组相比,vector 的大小可以根据需要自动调整,这是通过在底层使用动态数组来实现的。当新元素被…

【Day2:JAVA变量、数据类型、运算符的认识】

目录 1、变量的介绍、定义、使用2、标识符2.1 概念2.2 标识符的命名规则2.3 标识符的命名规范 3、数据类型3.1 基本数据类型3.2 引用数据类型 4、Scanner键盘录入4.1 键盘录入效果介绍4.2 键盘录入的三个步骤 5、运算符5.1 运算符和表达式5.2 算数运算符5.3 自增自减运算符5.4 …

【教学类-55-02】20240512图层顺序挑战(四格长条纸加黑色边框、4*4、7张 、43200张去掉非7色有23040张,去掉重复样式有几种?)

作品展示 背景需求: 之前的代码吗存在几个问题,最大的问题是不能生成“”长条黑边框”” 【教学类-55-01】20240511图层顺序挑战(四格长条纸)(4*4)和“手工纸自制参考图”-CSDN博客文章浏览阅读485次&…

使用Navicat将MySql数据库导入和导出

一,导出数据表 1.使用Navicat打开数据库,右键数据库,点击转储SQL文件,点击结构和数据。 2.选择生成文件的地方 3.等待生成完成 4.生成完成 二,导入数据库表和数据SQL文件 1.新建一个数据库 2.右键选择运行SQl文件 记…

如何利用甘特图来提高资源的是使用效率?

在项目管理中,甘特图是一种常用的工具,用于规划和跟踪项目进度。它通过条形图的形式展示项目的时间表和任务依赖关系,帮助项目经理和团队成员清晰地了解项目的时间线和进度。通过合理利用甘特图,可以显著提高资源的使用效率&#…

一文入门DNS

概述 DNS是一个缩写,可以代表Domain Name System,域名系统,是互联网的一项基础服务。也可以代表Domain Name Server,域名服务器,是进行域名和与之相对应的IP地址相互转换的服务器。DNS协议则是用来将域名转换为IP地址…