使用go-llama.cpp 运行 yi-01-6b大模型，使用本地CPU运行，速度挺快的

使用go-llama.cpp 运行 yi-01-6b大模型，使用本地CPU运行，速度挺快的

news/2025/4/27 1:55:28/文章来源:https://blog.csdn.net/freewebsys/article/details/136176433

1，视频地址

2，关于llama.cpp 项目

https://github.com/ggerganov/llama.cpp

LaMA.cpp 项目是开发者 Georgi Gerganov 基于 Meta 释出的 LLaMA 模型（简易 Python 代码示例）手撸的纯 C/C++ 版本，用于模型推理。所谓推理，即是给输入-跑模型-得输出的模型运行过程。

那么，纯 C/C++ 版本有何优势呢？

无需任何额外依赖，相比 Python 代码对 PyTorch 等库的要求，C/C++ 直接编译出可执行文件，跳过不同硬件的繁杂准备；
支持 Apple Silicon 芯片的 ARM NEON 加速，x86 平台则以 AVX2 替代；
具有 F16 和 F32 的混合精度；
支持 4-bit 量化；

golang 的项目地址：

https://github.com/go-skynet/go-llama.cpp

3，准备工作，解决cgo编译问题

关于go-llama.cpp 项目地址：

https://github.com/go-skynet/go-llama.cpp

首先下载模型：

https://hf-mirror.com/TheBloke/Yi-6B-GGUF/tree/main

在这里插入图片描述
然后运行测试：

在这里插入图片描述

虽然模型回答的不太对，但是可以运行了，速度确实还可以。

4，只要是llama.cpp支持的模型就可以

在这里插入图片描述
已经支持很多模型了，都需要测试下效果。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/692152.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

手撕C语言习题

手撕C语言习题

定义一个表示公交线路的结构体，要求有线路名称(例如 616)，起始站，终点站，里程等成员， 定义结构体数组，用来存储多条条公交线路信息，要求能够输出从指定起始站发车的所以公交线路信息。 2、定义…

阅读更多...

【软考高项】【教材知识梳理】- 15 - 第15章 - 项目风险管理

【软考高项】【教材知识梳理】- 15 - 第15章 - 项目风险管理

一、基本问题 1：按照可预测性，风险分哪三类？ （1）已知风险：如项目目标不明确， 过分乐观的进度计划， 设计或施工变更和材料价格波动等。（2）可预测风险&#xff…

阅读更多...

NVIDIA Corporation 在 GitHub 的官方主页

NVIDIA Corporation 在 GitHub 的官方主页

NVIDIA Corporation 在 GitHub 的官方主页 References https://github.com/NVIDIA References [1] Yongqiang Cheng, https://yongqiang.blog.csdn.net/

阅读更多...

力扣题目训练（17）

力扣题目训练（17）

2024年2月10日力扣题目训练 2024年2月10日力扣题目训练551. 学生出勤记录 I557. 反转字符串中的单词 III559. N 叉树的最大深度241. 为运算表达式设计优先级260. 只出现一次的数字 III126. 单词接龙 II 2024年2月10日力扣题目训练 2024年2月10日第十七天编程训练，今…

阅读更多...

Python系列（17）—— 位运算符

Python系列（17）—— 位运算符

Python中的位运算符（Bitwise Operator） 一、引言位运算符是直接对整数的二进制位进行操作的运算符。在Python中，位运算符可以对整数进行位级别的运算，如按位与（AND）、按位或（OR）、…

阅读更多...

Mysql Day06

Mysql Day06

sql优化插入数据大批量插入数据主键顺序插入性能高于乱序插入 load data local infile /root/load_user_100w_sort.sql into table tb_user fields terminated by , lines terminated by \n ; 主键优化这个黄色的都是一个一个Page 主键乱序插入之后会变成1-3-2&#x…

阅读更多...

qt - 19种精美软件样式

qt - 19种精美软件样式

qt - 19种精美软件样式一、效果演示二、核心程序三、下载链接一、效果演示二、核心程序 #include "mainwindow.h"#include <QtAdvancedStylesheet.h> #include <QmlStyleUrlInterceptor.h>#include "ui_mainwindow.h" #include <QDir&g…

阅读更多...

从零开始学习Netty - 学习笔记 - NIO基础 - ByteBuffer: 简介和基本操作

从零开始学习Netty - 学习笔记 - NIO基础 - ByteBuffer: 简介和基本操作

NIO基础 1.三大组件 1.1. Channel & Buffer Channel 在Java NIO（New I/O）中，“Channel”（通道）是一个重要的概念，用于在非阻塞I/O操作中进行数据的传输。Java NIO提供了一种更为灵活和高效的I/O处理方…

阅读更多...

基于微信小程序的日语学习的系统，附源码

基于微信小程序的日语学习的系统，附源码

博主介绍：✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ 🍅文末获取源码联系🍅 👇🏻 精彩专栏推荐订阅👇…

阅读更多...

中台的介绍及讲解

中台的介绍及讲解

什么是中台公司在新的一年规划中提出了新的发展战略，我们老板听说最近中台的概念很火，让我们调研公司实习中台战略的可行性，于是乎最近一段时间被老板折腾得够呛。刚开始并不理解什么是中台… 因此，写篇博客先简单介绍下什么是中…

阅读更多...

mp3播放器

mp3播放器

无界面播放器一、首先需要一个存放音乐文件的路径 #include <stdio.h> #include <stdlib.h> #include <unistd.h> #include <sys/types.h> #include <sys/wait.h> #include <glob.h> #include <signal.h>int menu(void); void fu…

阅读更多...

24-k8s的附件组件-Metrics-server组件与hpa资源pod水平伸缩

24-k8s的附件组件-Metrics-server组件与hpa资源pod水平伸缩

一、概述 Metrics-Server组件目的：获取集群中pod、节点等负载信息； hpa资源目的：通过metrics-server获取的pod负载信息，自动伸缩创建pod； 参考链接： 资源指标管道 | Kubernetes https://github.com/kuberne…

阅读更多...

Syntax error in cmake code when parsing string

Syntax error in cmake code when parsing string

CMake Error at D:\androidProjects\Android-mxxxx\app\src\main\jni\CMakeLists.txt:51 (add_library): Syntax error in cmake code when parsing string blog.csdnimg.cn/direct/794c8ba78dc747e99d200ca4b93e3450.png 解决办法，把路径的双斜杠改成单斜杠即可 D…

阅读更多...

mysql中文首字母排序查询

mysql中文首字母排序查询

MySQL中的排序涉及到字符集和排序规则。默认情况下，MySQL按照ASCII码对字符进行排序，数字>字母>中文。但是，特殊字符（非字母、数字、中文）的排序需要一些额外处理。试过SUBSTRING、LEFT等，都不能完美…

阅读更多...

静态时序分析：SDC约束命令set_input_delay详解

静态时序分析：SDC约束命令set_input_delay详解

相关阅读静态时序分析https://blog.csdn.net/weixin_45791458/category_12567571.html?spm1001.2014.3001.5482 本章将讨论使用set_input_delay命令对输入端口的约束。首先需要说明的是，在进行静态时序分析时，任何一条时序路径都需要有约束&#xff0…

阅读更多...

如何使用安卓平板远程Ubuntu服务器通过VS Code远程开发

如何使用安卓平板远程Ubuntu服务器通过VS Code远程开发

文章目录 1.ubuntu本地安装code-server2. 安装cpolar内网穿透3. 创建隧道映射本地端口4. 安卓平板测试访问5.固定域名公网地址6.结语正文开始前给大家推荐个网站，前些天发现了一个巨牛的人工智能学习网站， 通俗易懂，风趣幽默，…

阅读更多...

【.NET Core】常见C#代码约定

【.NET Core】常见C#代码约定

【.NET Core】常见C#代码约定文章目录【.NET Core】常见C#代码约定一、概述二、代码预定的目标三、代码约束工具和分析器四、C#语言准则五、字符串约定5.1 使用字符串内插来连接短字符串5.2 插入大文本时，使用System.Text.StringBuilder对象六、数组约定七、委托…

阅读更多...

php数组运算符比较 isset、is_null、empty的用法和区别

php数组运算符比较 isset、is_null、empty的用法和区别

php数组运算符 1. 数组运算符2. 判断两个数组是否相等3. isset、is_null、empty的用法和区别 1. 数组运算符注意：只会保留第一个数组中的键值对，而忽略后面数组中相同键名的元素，如果想要合并两个数组并覆盖相同键名的元素，可以…

阅读更多...

C/C++区别、优劣详解!!!!!

C/C++区别、优劣详解!!!!!

文章目录 C/C区别、优劣详解1. C和C的基本区别1.1 语法特性1.2 编程范式 2. C和C的共同之处2.1 编译方式2.2 使用库 3. C和C的优劣势分析3.1 C语言的优劣3.1.1 优势3.1.2 劣势 3.2 C语言的优劣3.2.1 优势3.2.2 劣势 4. 总结 C/C区别、优劣详解 C和C是两种流行的编程语言&#…

阅读更多...

C与C++的性能差距来源于哪里？

C与C++的性能差距来源于哪里？

C与C的性能差距来源于哪里？ 在开始前我有一些资料，是我根据网友给的问题精心整理了一份「C的资料从专业入门到高级教程」， 点个关注在评论区回复“888”之后私信回复“888”，全部无偿共享给大家！！&#xf…

阅读更多...

最新文章