【hugging face】bitsandbytes中8 bit量化的理解

【hugging face】bitsandbytes中8 bit量化的理解

news/2025/4/18 14:52:04/文章来源:https://blog.csdn.net/qq_42725437/article/details/134889861

8 位量化使数十亿参数规模的模型能够适应更小的硬件，而不会降低性能。 8 位量化的工作原理如下：
1.从输入隐藏状态中按列提取较大值（离群值）。
2.对 FP16 中的离群值和 int8 中的非离群值执行矩阵乘法。
3.改变非异常值结果以将值拉回到 FP16，并将它们添加到 FP16 中的异常值结果中。
在这里插入图片描述

因此，本质上，我们执行矩阵乘法以节省精度，然后将非异常值结果拉回到 FP16，而非异常值的初始值和按比例缩小后的值之间没有太大差异。你可以看下面的例子

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.mzph.cn/news/208639.shtml

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

相关文章

unity中：搭建在线AR应用

unity中：搭建在线AR应用

使用Imagine WebAR - Image Tracker插件部署WebGL应用在使用Imagine WebAR - Image Tracker插件进行WebGL应用开发时，有两个关键知识点需要掌握： 1. 部署到支持HTTPS的服务器由于WebGL应用需要访问用户的摄像头，因此必须在支持HTTPS的服…

阅读更多...

微前端模块联邦技术

微前端模块联邦技术

目录介绍基本使用演示用法初始化配置文件 remote 项目 host 项目为什么讲这个呢，很多人觉得他不是微前端，也有人定义它也是微前端，看怎么理解了，我觉得他是一个去中心化技术，它可以让多个独立构建的应用…

阅读更多...

【力扣100】9.和为k的子数组

【力扣100】9.和为k的子数组

添加链接描述 class Solution:def subarraySum(self, nums: List[int], k: int) -> int:# 思路是从第一个元素开始遍历，加到爆，就把指针向前移一位result0for i in range(len(nums)):# 如果爆了，就向后移一位if i!len(nums)-1:ji1sumnums…

阅读更多...

高并发爬虫用Python语言适合吗？

高并发爬虫用Python语言适合吗？

不管你用什么语言没在进行高并发前，有几点是需要考虑清楚的，；例如：数据集大小，算法、是否有时间和性能方面的制约，是否存在共享状态，如何调试（这里指的是日志、跟踪策略）…

阅读更多...

C#云LIS系统源码 B/S架构，SaaS模式，可扩展性强

C#云LIS系统源码 B/S架构，SaaS模式，可扩展性强

基于B/S架构的云LIS检验系统源码，整个系统的运行基于WEB层面，只需要在对应的工作台安装一个浏览器软件有外网即可访问。全套系统采用云部署模式，部署一套可支持多家医院检验科共同使用。采用.Net Core新的技术框架、DEV报表、前端js封装、分…

阅读更多...

腾讯云CentOS8 jenkins war安装jenkins步骤文档

腾讯云CentOS8 jenkins war安装jenkins步骤文档

腾讯云CentOS8 jenkins war安装jenkins步骤文档一、安装jdk 1.1 上传jdk-11.0.20_linux-x64_bin.tar.gz 1.2 解压jdk安装包文件 tar -zxvf jdk*.tar.gz 1.3 在/usr/local 目录下创建java目录 cd /usr/local mkdir java 1.4 切到java目录，把jdk解压文件改名为jd…

阅读更多...

【抽象策略模式】实践

【抽象策略模式】实践

前言刚果商城，用户登录 Or 注册发送邮箱验证码场景，使用抽象策略模式实现什么是抽象策略模式抽象策略模式是一种行为型设计模式，它允许定义一系列算法，将每个算法封装起来，并使它们可以互相替换。这使得客户端代码…

阅读更多...

Java_LinkedList链表详解

Java_LinkedList链表详解

目录前言 ArrayList的缺陷链表链表的概念及结构链表的种类 1.单向或双向 2.带头或不带头 3.循环或不循环 LinkedList的使用什么是LinkedList LinkedList的使用 LinkedList的构造 LinkedList的其他常用方法介绍 LinkedList的遍历 ArrayList和LinkedList的…

阅读更多...

OpenCL学习笔记（四）手动编译开发库（ubuntu+gcc+rk3588）

OpenCL学习笔记（四）手动编译开发库（ubuntu+gcc+rk3588）

前言笔者本次使用的是RK3588的开发板，内部烧写的是ubuntu20.04，gcc版本是9 本文档简单记录下编译的过程，有需要的小伙伴可以参考下一、安装所需软件 1.安装git，教程比较多，不再重复 2.安装cmake，教程…

阅读更多...

UWB的matlab仿真源码

UWB的matlab仿真源码

作品详细文章与下载链接第一部分:TR-UWB信号的产生和调制简介该实践涉及使用 MATLAB 生成和调制 TR-UWB 信号。超宽带信号是一类在频谱中具有宽带而不是窄带的信号信号，具有时间宽度的脉冲产生它。在本次实践中,MATLAB 程序是开发用于生成基带 TR-UWB 信号,我们用…

阅读更多...

在Windows电脑上获取硬盘ID的方法

在Windows电脑上获取硬盘ID的方法

如果你想在Windows电脑上获取硬盘的ID，可以使用DiskPart命令。以下是具体步骤： 打开命令提示符按下Win键R，输入cmd，然后回车，即可打开命令提示符。输入diskpart并回车在命令提示符中输入diskpart，然后…

阅读更多...

WordPress 注册/重置密码/更改密码钩子

WordPress 注册/重置密码/更改密码钩子

wordpress在提供邮件提醒的地方都留了hook，方便让开发者自定义。最新在添加第三方登录时遇到虚拟邮箱发信问题，为了防止给指定邮件地址后缀发信，可以利用如下wordpress提供的钩子来实现。 //https://www.wwttl.com/101.html //禁止用户注册时…

阅读更多...

用23种设计模式打造一个cocos creator的游戏框架----(十)迭代器模式

用23种设计模式打造一个cocos creator的游戏框架----(十)迭代器模式

1、模式标准模式名称：迭代器模式模式分类：行为型模式意图：提供一种方法顺序访问一个聚合对象中的各个元素，且不需要暴露该对象的内部表示. 结构图： 适用于： 1、当你需要遍历一个复杂的数据结构…

阅读更多...

promethesu告警规则配置，alertmanager通过webhook通知

promethesu告警规则配置，alertmanager通过webhook通知

文章目录前言一、promethesu告警二、告警配置编写rule文件prometheus配置prometheus产生告警三、告警通知prometheus 配置 alertmanageralertmanager 配置 webhook通知编写接口接收 webhook 总结前言如果没有学习过prometheus的基础和监控的同学，可以先过一遍这…

阅读更多...

融合科技，升级医疗体验——医院陪诊服务的技术创新

融合科技，升级医疗体验——医院陪诊服务的技术创新

随着科技的迅猛发展，医疗服务领域也在积极借助技术手段提升患者体验。本文将探讨如何利用先进的技术代码，将医院陪诊服务推向新的高度。 1. 医疗预约系统的实现 # 通过Python代码实现医疗预约系统 class MedicalAppointment:def __init__(self, patie…

阅读更多...

【Python】Numpy库近50个常用函数详解和示例，可作为工具手册使用

【Python】Numpy库近50个常用函数详解和示例，可作为工具手册使用

本文以yolo系列代码为基础，在其中查找用到的numpy函数，包含近50个函数，本文花费多天，三万多字，通过丰富的函数原理和示例对这些函数进行详解。以帮助大家理解和使用。目录 np.array()运行示例 np.asarray()函数解析运…

阅读更多...

unity 2d 入门飞翔小鸟场景延续（八)

unity 2d 入门飞翔小鸟场景延续（八)

1、新建c#脚本如下代码，在前方生成生成自身图片并3s后销毁自身，在碰撞物体后小鸟死亡后不删除自身 using System.Collections; using System.Collections.Generic; using UnityEngine;public class CopyScene : MonoBehaviour { //要复制的对象public…

阅读更多...

Amazon CodeWhisperer 提供新的人工智能驱动型代码修复、IaC 支持以及与 Visual Studio 的集成...

Amazon CodeWhisperer 提供新的人工智能驱动型代码修复、IaC 支持以及与 Visual Studio 的集成...

Amazon CodeWhisperer 的人工智能（AI）驱动型代码修复和基础设施即代码（IaC）支持已正式推出。Amazon CodeWhisperer 是一款用于 IDE 和命令行的人工智能驱动型生产力工具，现已在 Visual Studio 中推出，提供预…

阅读更多...

uniapp封装websocket文件（app、h5兼容）

uniapp封装websocket文件（app、h5兼容）

适合场景：只需要发送一次数据，服务器可以实时返回数据进行渲染。 socket文件 let isSocketClose false; // 是否关闭socket let reconnectCount 5; // 重连次数 // let heartbeatInterval ""; // 心跳定时器 let socketTask null; // web…

阅读更多...

uniapp实战 —— 开发微信小程序的调试技巧

uniapp实战 —— 开发微信小程序的调试技巧

手机真机调试微信小程序开发版和体验版的小程序，域名没有备案时想调试接口访问效果，可以按下述方式操作： 在手机上点右上方三个点，点击“开发调试”，开启调试模式，即可真机访问接口（跳过域名校…

阅读更多...

最新文章