深度学习-75-大语言模型LLM之基于llama.cpp和Transformers与Qwen(通义千问)因果语言模型交互

深度学习-75-大语言模型LLM之基于llama.cpp和Transformers与Qwen(通义千问)因果语言模型交互

bicheng/2025/4/8 7:29:01/文章来源:https://blog.csdn.net/qq_20466211/article/details/142460911

文章目录

1 Qwen2.5
- 1.1 模型介绍
- 1.2 Qwen2.5-0.5B模型
- 1.3 llama.cpp支持Qwen架构
2 下载模型
- 2.1 Huggingface镜像网站整体下载
- 2.2 阿里魔塔社区整体下载
- 2.3 模型Qwen2.5-0.5B-Instruct-IQ3_M.gguf
3 推理方式
- 3.1 llama.cpp启动模型
- - 3.1.1 补全
  - 3.1.2 聊天
- 3.2 使用transformers库
- - 3.2.1 加载模型
  - 3.2.2 调用
4 参考附录

1 Qwen2.5

Qwen(通义千问)。

Qwen2.5开源了，共有7个尺寸规模，包括：0.5B、1.5B、3B、7B、14B、32B和72B，分别有Base模型和Instruct模型。
本次全是Dense模型，没有MoE模型。
同时还开源了Qwen2.5-Coder模型和Qwen2.5-Math模型。
还开了GGUF、GPTQ和AWQ 3种量化模型。

1.1 模型介绍

(1)训练数据从Qwen2的7T Tokens扩展到了Qwen2.5的18T tokens。
(2)上下文最大长度128K，其中超过32K的部分利用YARN来进行外推处理，并且最大生成长度8K（从1K升级到 8K），更大的输出长度意味着可以更容易适配到cot输出上。
(3)结构化数据（如表格）理解能力更强，并且输出json效果更好，同时适配多样的系统提示词，增强角色扮演能力。
(4)更强的代码和数学能力，借助Qwen2-Math的数据到Qwen2.5上，让基模表现更好。
(5)模型依旧采用RoPE、SwiGLU、RMSNorm和GQA。
(6)依然是多语言模型：支撑29种语言，包括中文、英语、法语、西班牙语、葡萄牙语、德语、意大利语、俄语、日语、韩语、

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/bicheng/64564.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

Flask入门：打造简易投票系统

Flask入门：打造简易投票系统

目录准备工作创建项目结构编写HTML模板编写Flask应用代码解读进一步优化结语 Flask，这个轻量级的Python Web框架，因其简洁和易用性，成为很多开发者入门Web开发的首选。今天，我们就用Flask来做一个简单的投票系统，让你快速上手Web开发，同时理解Flask的核心概…

阅读更多...

ApacheStruts2 目录遍历与文件上传漏洞复现（CVE-2024-53677,S2-067）（附脚本）

ApacheStruts2 目录遍历与文件上传漏洞复现（CVE-2024-53677,S2-067）（附脚本）

0x01 产品描述： Apache Struts 2 是一个用于JAVA的MVC框架，它用于快速开发web应用。它的设计目标是使得开发者能够更容易的处理web应用的展现层，数据层，和业务层。0x02 漏洞描述： CVE-2024-53677 漏洞的根本原因是 Struts 框架中不安全的文件上传处理机制。攻击者利用 CVE…

阅读更多...

Cadence学习笔记 9 器件封装匹配

Cadence学习笔记 9 器件封装匹配

基于Cadence 17.4，四层板4路HDMI电路更多Cadence学习笔记：Cadence学习笔记 1 原理图库绘制Cadence学习笔记 2 PCB封装绘制Cadence学习笔记 3 MCU主控原理图绘制Cadence学习笔记 4 单片机原理图绘制Cadence学习笔记 5 四路HDMI原理图绘制Cadence学习笔记…

阅读更多...

2011年IMO几何预选题第5题

2011年IMO几何预选题第5题

△ A B C \triangle ABC △ABC 内心为 I I I, 外接圆在 B B B, C C C 两点处的切线交于 P P P, D D D, E E E 分别为 B I BI BI, C I CI CI 与外接圆的交点, D E DE DE 分别交 A B AB AB, A C AC AC 于点 M M M, N N N, 过 M M M 作 B I BI BI 平行线, 过 N N …

阅读更多...

Python构造方法：对象的“开机启动程序”

Python构造方法：对象的“开机启动程序”

在Python中，构造方法（__init__）是一个类的“生命之初”，定义了每个对象从“出生”到“投入使用”的整个初始化过程。那既然类里可以直接写属性，为什么还需要构造方法呢？ 构造方法的核心作用：创…

阅读更多...

Superset 和 Appsmith的对比

Superset 和 Appsmith的对比

对于报表数据需要给到前端进行定制化展示，并且直接提供基于报表的 API 让前端调用，以下是对 Superset 和 Appsmith 的对比分析： 1. Apache Superset API 支持 Superset 提供 REST API 接口，可以让前端调用获取报表数据。前端可以…

阅读更多...

idea | maven项目标红解决方案 | 强制刷新所有依赖

idea | maven项目标红解决方案 | 强制刷新所有依赖

场景：父pom多模块，新增时，依赖正常，但是application.yml看起来没被springboot识别，试过rebuild、重开idea清除缓存，重新maven面板reload all maven projects, 试过pom文件的依赖先移除再重新粘贴导入进来&a…

阅读更多...

Nginx常用配置详解(1)

Nginx常用配置详解(1)

Nginx常用配置详解一、全局块（main）配置在Nginx的配置文件中，最外层的部分是全局块。这部分配置通常会影响Nginx服务器整体的运行参数。 worker_processes 作用：这个配置指令用于指定Nginx工作进程的数量。工作进程是Nginx处理…

阅读更多...

单幅图像合成 360° 3D 场景的新方法：PanoDreamer，可同时生成全景图像和相应的深度信息。

单幅图像合成 360° 3D 场景的新方法：PanoDreamer，可同时生成全景图像和相应的深度信息。

论文介绍了一种从单幅图像合成 360 3D 场景的新方法。该方法以连贯的方式生成全景图及其相应的深度，解决了现有最先进方法（如 LucidDreamer 和 WonderJourney 的局限性。这些方法按照生成轨迹依次添加细节，通常在循环回输入图像时导致可见的接…

阅读更多...

Linux —— 管理进程

Linux —— 管理进程

一、查看进程运行态（Running） 定义：处于运行态的进程正在 CPU 上执行指令。在单 CPU 系统中，同一时刻只有一个进程处于运行态；在多 CPU 或多核系统中，可能有多个进程同时处于运行态。示例： 当…

阅读更多...

Kubernetes中subPath

Kubernetes中subPath

在Kubernetes（K8s）中，当容器关闭时，其使用的subPath目录的清理行为取决于几个因素。首先，subPath允许Pod中的容器挂载共享卷的一个子目录，而不是整个卷。这种机制有助于避免不同容器间的文件冲突。容器关闭…

阅读更多...

前端(组件传参案例)

前端(组件传参案例)

父组件(商品详情页) 子组件上边放大图底下缩小轮播图需求分析：父组件获取图片数据，传给底下子组件进行进行轮播，实现父组件给子组件传参。然后底下子组件轮播后，把当前图片下标给父组件，实现子组件给父组件传参。父组…

阅读更多...

Linux基础 -- 查看程序注册了的信号的方案

Linux基础 -- 查看程序注册了的信号的方案

程序注册了哪些信号的方案方法 1：使用 strace 动态追踪信号处理注册 strace 是一个强大的工具，可以动态捕获程序对信号的处理注册行为（如 sigaction 或 signal 系统调用）。示例启动程序并追踪信号注册： strace…

阅读更多...

数据库设计的四大原则：优化性能、保证一致性与高效处理

数据库设计的四大原则：优化性能、保证一致性与高效处理

目录一. 数据冗余最小化二. 数据一致性三. 事务处理四. 查询性能优化数据库设计不仅是关于创建表和字段的简单任务，更是构建一个高效运行、易于维护且能够确保数据一致性的系统的核心。一个好的数据库设计不仅能提升应用程序的性能，还能为未来的…

阅读更多...

What‘s Next on TON 成都站｜聚焦生态创新，共享技术前沿

What‘s Next on TON 成都站｜聚焦生态创新，共享技术前沿

2024 年，TON 生态为何持续吸引全球开发者和用户的关注？在经历了一系列重要的技术更新和生态扩展后，TON 正在迎来一个爆发式增长的阶段。作为全球四城巡回沙龙的第三站，成都站的活动将如何继续推动这一势头，带来哪些不容…

阅读更多...

算法-动态数组-62.不同路径

算法-动态数组-62.不同路径

一、题目二、思路解析 1.思路： 对于找到目的地它的来源主要来源于目的地的上一格和目的地的左一格 2.常用方法： 无 3.核心逻辑： 1.处理边界： a.只向右移动，至始至终只有一条路径 for(int i0;i<m;i){dp[i][0]1; } …

阅读更多...

近端策略优化（Proximal Policy Optimization, PPO）详解

近端策略优化（Proximal Policy Optimization, PPO）详解

✅作者简介：2022年博客新星第八。热爱国学的Java后端开发者，修心和技术同步精进。 🍎个人主页：Java Fans的博客 🍊个人信条：不迁怒，不贰过。小知识，大智慧。 💞当前专栏…

阅读更多...

Windows 系统如何高效搭建 Linux 开发环境，一步步解锁内核源码

Windows 系统如何高效搭建 Linux 开发环境，一步步解锁内核源码

每日禅语人闲桂花落，夜静春山空。月出惊山鸟，时鸣春涧中。人人皆以为王维只是在写自然界景物的美丽，其实这首诗不只体现了自然界的美丽，更是诗人内心的写照，体现了诗人心中禅心与禅境的完美结合。这首诗的境界之所以如…

阅读更多...

C++循环斐波那契数列

C++循环斐波那契数列

1.斐波那契数列，又称黄金分割数列、因数学家莱昂纳多斐波那契（Leonardoda Fibonacci）以兔子繁殖为例子而引入，故又称为“兔子数列”。如果每对兔子（一雄一雌）每月能生殖一对小兔子（一雄一雌&…

阅读更多...

2024年A特种设备相关管理证考试题库及A特种设备相关管理试题解析

2024年A特种设备相关管理证考试题库及A特种设备相关管理试题解析

为了确保特种设备的安全运行，提高特种设备管理人员的专业素质，2024年A特种设备相关管理证考试题库已经更新，并配备了详细的试题解析。以下是从题库中精选的10道试题，每道试题都附有答案和解析，帮助考生更好地理解考试内…

阅读更多...

最新文章