Qwen及Qwen-audio大模型微调项目汇总

Qwen及Qwen-audio可微调项目调研

    • 可用来微调方法/项目汇总
    • ps.大语言模型基础资料

可用来微调方法/项目汇总

  1. Qwen github 项目自带的finetune脚本
    可以参考https://blog.csdn.net/qq_45156060/article/details/135153920
  2. PAI-DSW中微调千问大模型(阿里云的一个产品)
    https://gallery.pai-ml.com/#/preview/deepLearning/nlp/qwen_1_8b_chat
    https://zhuanlan.zhihu.com/p/677059792
  3. 魔搭社区的微调框架SWIFT已经支持了Qwen1.5全系列模型的微调和推理
    https://zhuanlan.zhihu.com/p/681662566
  4. Firefly项目微调千问大模型
    https://blog.csdn.net/sinat_37574187/article/details/132107473
    https://github.com/yangjianxin1/Firefly
  5. https://github.com/hiyouga/LLaMA-Efficient-Tuning
    改名了 https://github.com/hiyouga/LLaMA-Factory
  6. 基于llama的高star的github开源项目汇总
    (1)https://github.com/FlagAlpha/Llama2-Chinese
    (2)https://github.com/hiyouga/LLaMA-Efficient-Tuning
    改名了 https://github.com/hiyouga/LLaMA-Factory
    (3)https://github.com/yangjianxin1/Firefly
    (4)https://github.com/LinkSoul-AI/Chinese-Llama-2-7b
    (5)https://github.com/michael-wzhu/Chinese-LlaMA2

以上的项目,目前只有SWIFT框架支持Qwen-audio的微调。

ps.大语言模型基础资料

  1. 大语言模型入门
    https://www.cnblogs.com/yourenbo/p/18060256
  2. 通俗解读大模型微调(主要解释基础概念)
    https://www.wehelpwin.com/article/4231
  3. 大模型微调项目/数据集调研汇总(时间有点早了,早期的模型和项目)
    https://zhuanlan.zhihu.com/p/624079704?utm_id=0

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/763979.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

maven archetype 和普通的maven有啥区别

Maven是一个项目管理和构建自动化工具,主要用于Java项目,它基于项目对象模型(POM)。Maven可以通过其POM文件管理项目的构建、报告和文档。 而Maven Archetype是Maven的一个插件,主要用于为用户创建基于某个模版的新项…

Django日志(一)

一、概念与配置 1.1、概述 日志是程序员经常在代码中使用快速和方便的调试工具。它在调试方面比print更加的优雅和灵活 而且日志记录对于调试很有用,可以提供更多,更好的结构化,有关应用程序的状态和运行状况的信息 Django框架的日志通过python内置的logging模块实现的,可…

TCP TLS

TCP(传输控制协议)是一种面向连接的协议,用于在网络上可靠地传输数据。它提供了数据分段、重传、流量控制和拥塞控制等功能,以确保数据的可靠传输。TCP在传输层上工作,它使用IP(Internet协议)作…

LeetCode2671. Frequency Tracker

文章目录 一、题目二、题解 一、题目 Design a data structure that keeps track of the values in it and answers some queries regarding their frequencies. Implement the FrequencyTracker class. FrequencyTracker(): Initializes the FrequencyTracker object with …

前端视角如何理解“时间复杂度O(n)”

定义 时间复杂度是O(n) 意味着算法的执行时间与输入数据的大小成正比。 这里的n表示输入数据的数量。 假设有一个数组,需要遍历这个数组并打印出每个元素的值。 这个操作的时间复杂度就是O(n),因为你需要执行n次操作,其中n是数组的长度。 …

力扣由浅至深 每日一题.11 加一

少年气,是历经千帆举重若轻地沉淀,也是乐观淡然笑对生活的豁达 —— 24.3.22 加一 给定一个由 整数 组成的 非空 数组所表示的非负整数,在该数的基础上加一。 最高位数字存放在数组的首位, 数组中每个元素只存储单个数字。 你可以…

IPC通信--socket

1.windows环境 在C中,Windows环境下实现socket通信的客户端与服务端的流程如下: 创建套接字:使用socket()函数创建一个套接字。绑定套接字:使用bind()函数将套接字与一个地址(IP和端口)绑定在一起。监听连…

基于Gabor滤波器的指纹图像识别,Matlab实现

博主简介: 专注、专一于Matlab图像处理学习、交流,matlab图像代码代做/项目合作可以联系(QQ:3249726188) 个人主页:Matlab_ImagePro-CSDN博客 原则:代码均由本人编写完成,非中介,提供…

2024年【山东省安全员C证】考试试卷及山东省安全员C证复审模拟考试

题库来源:安全生产模拟考试一点通公众号小程序 山东省安全员C证考试试卷是安全生产模拟考试一点通生成的,山东省安全员C证证模拟考试题库是根据山东省安全员C证最新版教材汇编出山东省安全员C证仿真模拟考试。2024年【山东省安全员C证】考试试卷及山东省…

一个线程可以有几个Handler,几个Looper,几个MessageQueue对象?

一个线程可以有多个Handler,但是只有一个Looper对象,只有一个MessageQueue对象。 在Looper的prepare方法中创建了Looper对象,并放入到ThreadLocal中,并通过ThreadLocal来获取looper的对象, ThreadLocal的内部维护了一个ThreadLocalMap类, 里…

【Linux】信号的处理{信号处理的时机/了解寄存器/内核态与用户态/信号操作函数}

文章目录 0.对于信号捕捉的理解1.信号处理的时机1.1 何时处理信号?1.2 内核态和用户态1.3 内核态和用户态的切换 2.了解寄存器3.信号捕捉的原理4.信号操作函数4.1sighandler_t signal(int signum, sighandler_t handler);4.2int sigaction(int signum, const struct…

express+mysql+vue,从零搭建一个商城管理系统15--快递查询(对接快递100)

提示:学习express,搭建管理系统 文章目录 前言一、安装md5,axios二、新建config/logistics.js三、修改routes/order.js四、查询物流信息五、试错与误区总结 前言 需求:主要学习express,所以先写service部分 快递100API…

工业项目中你连DCS系统都没见过?

什么是DCS DCS,即分散控制系统,是一种用于监控和控制工业过程的系统。它通过连接多个控制器、传感器和执行器实现自动化控制,提高生产效率和安全性。在中国,随着工业化和自动化水平的提高,DCS技术得到了广泛应用和快速…

创建Message对象的方式及区别?Message.obtain()怎么维护消息池 ?Handler 有哪些发送消息的方法?

Message对象创建的方式有哪些, 区别? 直接new一个obtain()方法获取handler.obtainMessage()方法获取。 下面两个方式是从对象池中获取,可以避免message对象重复的创建。 Message.obtain()怎么维护消息池的Handler &…

外包干了10天,技术倒退明显

先说情况,大专毕业,18年通过校招进入湖南某软件公司,干了接近6年的功能测试,今年年初,感觉自己不能够在这样下去了,长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能测试&#xf…

推免保研夏令营/预推免面试记录—北大软微

0x00简述 0x01 面试经历 0x02 相关资料下载 0x00简述 0x01 面试经历 0x02 相关资料下载 挖坑待写

SpringMVC 简介及入门级的快速搭建详细步骤

MVC 回顾 MVC,即Model-View-Controller(模型-视图-控制器)设计模式,是一种广泛应用于软件工程中,特别是Web应用开发中的架构模式。它将应用程序分为三个核心组件: Model(模型)&#…

面试问答示范

文章目录 请做个自我介绍您的学历是统招吗?可以在学信网查询吗是全日制吗是双证吗?请介绍一下你上家公司的情况。介绍一下你们公司的服务器架构(网络架构)。说说你在工作中处理过的最棘手的技术问题讲一讲上家公司做过的项目为什么…

网络安全作业4

title: 文件上传/文件包含漏洞学习 date: 2016-04-25 21:52:19 categories: 安全 tags: Web安全 ** 文件上传漏洞 ** 在Web程序中,经常需要用到文件上传的功能。如用户或者管理员上传图片,或者其它文件。如果没有限制上传类型或者限制不严格被绕过&…

代码随想录笔记|C++数据结构与算法学习笔记-哈希表(一)|有效的字母异位词、两个数组的交集、快乐数、两数之和、四数相加II

文章目录 242.有效的字母异位词哈希法解法解题思路伪代码c代码 349.两个数组的交集set解决伪代码c代码 数组解决 202.快乐数思路伪代码讲解C代码 1.两数之和思路map解题过程伪代码C代码 454.四数相加II整体思路map解题过程注意事项伪代码C代码 《代码随想录链接》 本文基于代码…