【C/C++ 汇编语言 Verilog】越界截断——数据越界问题的多角度分析

0 前言

0.1 讨论层级和范围

  • 讨论层级
    • 计算机底层:硬件层次与汇编指令层次
    • 信息与二进制位
  • 讨论范围
    • 信息的存储与运算在汇编语言与Verilog HDL中的联系与区别
    • 事实上,数据越界截断问题,在计算机体系的任何层次,都可能发生,并且他们遵循的法则基本是一致的

0.2 其他说明

  • 信息与数据,本质上来讲没有区别,信息就是数据,数据就是信息。为方便起见,在本文中,全部都称数据
  • 数据越界问题的分析,在实际应用中有以下用途
    • 在一开始设计的时候避免越界问题的发生
    • 在发生错误的时候有能力分析出其原因

1 一个概念

越界丢失法则:超过存储能力的数据,会被截断,从而导致丢失,也可以称为越界截断

这就好比,一个水桶一旦装满水,再灌水会溢出来,溢出的水就是丢失了
越界丢失

1.1 越界截断

我们知道,数据在计算机中是以二进制信息存储的,即一串一串的二进制数

01011101
01111000

对于上图所示的,是两个8位的二进制位串。

下面将通过演示说明,什么是越界截断,对于8个二进制位来说,所能表示的最大数据就是8位全部是1

11111111

如果再给这个数值加1,那么就会数值就变成:

100000000

这是9位二进制数,但实际上计算机只能存储8位,因此超过其所能承受的范围,最高位的1将会被截断,从而造成数据丢失

被截断00000000

也就变成了:

00000000

这就是数据的越界截断

有些读者可能会误以为越界丢失就是归零,因此我再举一个例子,以消除误解。

对于8个二进制位来说,如果给他施加了达到10个二进制位的数字

1100101010

那么它的最高两位将会丢失

被截断00101010

也就变成了:

00101010

1.2 越界截断建模——水溢出模型

数据的越界丢失,就好比水桶满了,多出的水会溢出,但是水桶的水并不会消失,只是多出来的水丢失了
越界丢失

1.3 补充概念——溢出

当数据发生越界,超出了容器容纳范围时,我们称发生了溢出

2 两个方向

对于越界截断现象,有两个考虑的方向。

2.1 数据的存储——水桶储水模型

信息的存储是指,将信息直接存储起来
就好比将水放进水桶中
水放进水桶中

2.2 数据的运算——水处理模型

信息的运算是指,对传输过来的数据,进行运算(加、减、乘、除……),也就是数据的处理过程
就好比污水经过处理厂变成了净水
污水处理
亦或者是一桶水倒入另外一桶水中,这样的模型都是合理的,能够帮助你理解这一过程
在这里插入图片描述

3 三个过程

对于越界截断现象,一般会发生在三个过程中。

3.1 初始量:设初值

包含数据类型、标识符的设定,以及赋初值的过程

3.1.1 Verilog

在Verilog语言中,初始化的方式如下

reg a = 1'b1;
reg b = 123;
reg c;
c = 1'b0;
  • 对于a和c来说,一个二进制位存储一个二进制数,这是标准的
  • 对于b来说,显然数据越界了,Verilog会执行越界丢失操作,留下没越界的数字
    • 123用二进制表示是:0111_1011
    • 因此留下最后一位1,其余高位全部丢失

3.1.2 汇编语言

以8086CPU中16位寄存器AX为例,说明数据的初始化问题

mov AX,11H		 // ①
mov AX,1000001H  // ②
  • 对于①,将它显然正确
  • 对于②,明显越界,这是错误的指令,注意,是错误,可能不会被容错直接报错

3.1.3 C/C++等高级语言

int a = 1000100010000;
int b = 100;
  • 很明显,a越界了,b是正确的
    a越界
    越界是错误的

问题:为什么会显示右侧这一串数字?C++是怎么运行出来的?
在回答这个问题之前,先来学习一下延展知识。

3.1.3.1 延展阅读1:VS C++ 的内存查看方法

【VS C++ 2010】查看内存的方法详解

学习完之后,再继续往下进行

以下面的代码为示例:

int main()
{int a = 100;int b = 100010001000;cout << "a = " << a << "  " << &a << endl;cout << "b = " << b << "  " << &b << endl;system("pause");return 0;
}

以下,我们都需要使用刚刚学到的知识,查看内存的情况

(1)对于正数

①不越界的正数

对于int a = 100;,显然是不越界的,其内存情况为
不越界的a
这一点没什么好说的

  • a的类型为int
  • 数值为100(十进制),被解释为数字100
  • 存储为二进制位串
  • 显示为0x64(十六进制的64)

a的信息详情

②越界的正数

对于十进制数据 1000_1000_1000,其十六进制为:17 49 0F 82 68

17490F8268

越界截断可得,被保留下来的为:49 0F 82 68

被截断490F8268

我们查看内存来验证一下
验证
内存上的存储的确是这样,将其换算为十进制,就是我们的输出结果了
结果

(2)对于负数的越界

3.1.3.2 延展阅读2:补码的使用

补码转换人工求法【非常没必要,计算机要做的事情为什么要人来做?不过做考试题还是有必要的……】:

  1. 求负数绝对值的原码后减一【这个减一就很蠢,补码的使用就是为了避免减法,你居然用减法来避免减法……,但是做考试题确实比用反码的方法更快】
  2. 对上述结果全部取反
对于负数,计算机以补码形式来存储的本质

对于负数:

  1. 计算机先将其转换为补码形式
  2. 再进行存储,如果越界,则会发送越界截断
①不越界的负数

直接以补码形式存储

②越界的负数

先存储为补码,然后越界截断,然后再存储起来


3.1.4 小结

我通过三种语言的描述,来为你传到这样的信号:

  • 不同语言对于越界问题的处理方式是不同的,这是显而易见的,他们所处的计算机系统层次不一样,抽象程度也不一样
  • 毫无疑问,在赋初值的时候就造成越界,这是设计的失败,这是不可容忍的错误

总之,不要越界(后面的小节会讲解它也是双刃剑,可以**“变废为宝”**)

3.1.4.1 延展阅读3:在边界内做事情

待完善部分,敬请期待

3.1.4.2 优化模型——水桶的水不能溢出

对于水桶储水模型,请回看2.1节的内容,这里通过几张图来展示几种可能的情况
几种情况

3.1.4.3 一句话总结:做事不能越界

3.2 过程量:做运算

对于运算之后造成的越界问题,参考3.1.3节中的问题部分的解答即可

3.2.1 数学运算(加减乘除……)

不管是高级语言,还是汇编语言,在进行数学运算的时候都可能产生越界的问题——两个数字都没有越界,但是相加之后越界了

设计者一定要考虑并且避免这些问题的发生,否则可能会引发错误。

3.2.2 数据类型的强制转换

3.2.2.1 手动强制转换

数据的强制转换也可能引发错误,比如:在java中,将int类型的数字转换为byte类型,由高向低转换,就可能引起数据的丢失。

例如下列Java代码

int a = 300;
byte b = (byte)a;
System.out.println(b);

输出为:
result
原因分析:
对于原数字,被保存为0x12C(十六进制前缀为“0x”),强制转换为byte类型,则会发生越界截断,将最高位的1截断,变成了0x2C,也就是十进制的44

3.2.2.2 自动强制转换

另外,在C/C++、Java中,有一类二元运算符,比如

  • +=
  • -=
  • *=
  • /=
    例如x += y,它的本质是x = x + y,由于y的数据类型并不确定,因此可能会产生错误,比如:
int x = 3;
x = x + 3.5;

这是不被允许的,x + 3.5是float类型,不能直接赋值给int类型,这时候需要进行强制转换x = (int)(x + 3.5),得到的结果是6

对于上述二元运算符来说,这个强制转换是自动进行的

int x = 20;
x += 3.5;

对于第二条语句,并不等价于x = x + 3.5而是等价于x = (int)(x + 3.5)

3.3 结束量:得结果

3.3.1 直接输出

对于得到的结果,直接输出,那么就是越界丢失之后的结果,没什么好说的。

如果直接在输出函数的参数内进行运算,那么越界与否取决于实际的环境,看情况而定,数据的结果一定要在范围内!

3.3.2 结果被保存到其他变量中

如果运算得到的结果被保存到了其他变量中,如果将大的数据,保存到小容器中,显然会越界

4 双刃剑——越界截断的利弊分析

4.1 避开弊端

从专业词语来说,越界丢失更适合称为越界截断,越界的部分将会被计算机截断,从而造成了丢失
几种情况
毫无疑问,数据的丢失是可怕的,因此,大多数情况下,尤其是程序员,要尽可能的避免发生越界截断

4.2 坏事变好:应用越界截断——补码的使用

从哲学的角度来说,任何事情都有两面性,如果我们利用好越界截断,也能让它发挥巨大的作用。

计算机有加法器,但是它不擅长减法,于是

  • 补码+越界截断

就完成了减法转换为加法这一壮举!

例如:45 + (-22) = 23
在计算机中,以补码形式存储,用补码进行加减
45的补码:

00101101

-22的补码:

11101010

补码相加:

100010111

发生越界截断:

被截断00010111

得到:

00010111

也就是23的补码

**但是,务必注意:**使用补码进行运算,运算结果也一定要在范围内,否则依然是错误。

5 注意事项:先确定正确的界限,才能分析越界截断

比如下面这个例子,如果你把它的界限弄错,那么你可能会得到错误的结果。

char a = 100;
char b = 28;
char c = a+b;
cout << dec << (int)c << endl;unsigned char d = a+b;
cout << dec << (int)d << endl;

会输出
输出
显然,a+b并不会越界

10000000

但是,同样是char类型,一个是有符号数,一个是无符号数,输出的结果却不一样。

这是因为

  • 对于有符号数来说,它的界限的7位,因为要除去符号位
  • 对于无符号数来说,它的界限是8位,不需要除去符号位

说到这里,你也就明白,数据的界限是讨论越界截断的前提

因此设计者要综合考虑很多问题,这也是计算机科学家的基本素养。

6 综合阐述

  • 任何计算机程序都是由各种数据构成的
  • 各种数据又拥有不同的数据类型

因此:数据只要在对应数据类型的范围内,就不会发生错误

最终结果就是,保证数据在数据类型的范围内运行即可,对于补码运算而言,中间过程发生越界是没有问题的,但是结果不能越界,上面一大堆分析完全可以不用看(不要打我……分析有助于你未来思考更深入的问题,光记住结论是走不远的)。

7 延展阅读汇总

待补充

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/384781.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【VS C++ 2010】查看内存的方法详解

1 示例代码 对于以下代码&#xff1a; int main() {int a 100010001000;int b 100;cout << "a " << a << " " << &a << endl;cout << "b " << b << " " << &b…

【汇编语言】上机实验 win7/8/10 64位系统 进入32位DOS模式 实现dubug/edit/masm/link功能

1 软件下载和安装 下载并安装DOSBox软件&#xff0c;注意&#xff0c;不要装在C盘上&#xff0c;装在其他盘上 【备注】软件直接百度搜索即可下载Debug.exe文件 【备注】百度搜索“Debug 64位 下载” 对于下载后得到的debug.exe文件 将这个文件拷贝到磁盘根目录下&#xff0c…

【数字逻辑 Verilog】全面剖析数据选择器——从基础到拓展,从理论到设计的实现,从表面到本质

0 前言 0.1 使用环境 EDA工具&#xff1a;Vivado 2017.4硬件描述语言&#xff1a;Verilog HDL 0.2 涉及知识 数字逻辑Verilog 1 基础模块&#xff1a;一位四选一数据选择器 1.1 设计部分&#xff1a;层次建模 1.1.1 需求分析 设计一个一位的四选一数据选择器&#xff0…

【计算机网络】手动配置hosts文件解决使用GitHub和Coursera网站加载慢/卡的问题

目录0 前言1 打开hosts1.1 以管理员身份运行记事本1.2 打开hosts2 找到实际地址2.1 打开cmd2.2 找到网址3 替换地址3.1 修改hosts文件3.2 刷新4 后续内容的完善0 前言 本文是针对纯小白读者&#xff0c;没有涉及到任何的专业知识&#xff0c;你只需要按照步骤操作即可。 同时…

【汇编语言】镜像迁移能力之一通百通——由代码段和CS:IP的原理,掌握一类寄存器的使用

0 前言 你应该知道8086CPU的物理地址形成方式及其原理&#xff0c;才能完成本文的学习。 1 内存的分段 对于内存&#xff0c;人们人为地将其划分为一段一段的&#xff0c;比如代码段和数据段等&#xff0c;特别注意&#xff0c;这是人为划分的结果&#xff0c;方面人类使用&…

【计算机组成原理 数字逻辑 Verilog】32位加法器的实现:支持整数的加减运算

目录0 前言0.1 使用环境0.2 知识点0.3 注意事项1 建模&#xff1a;1位加法器1.1 构建基础模型1.1.1 一位加法器1.1.1.1 科技黑箱&#xff1a;外部端口与功能1.1.1.2 揭秘黑箱&#xff1a;内部结构与模块1.1.2 从顶层模块提取低层模块&#xff1a;取反功能选择器1.1.2.1 科技黑箱…

【Verilog HDL】门级描述 / 数据流描述 / 行为级描述——通过四选一多路选择器,实现对于不同层级描述方式的整体性认知

目录0 前言1 输出端口的设计1.1 门级描述和数据流描述1.2 行为级描述2 三种描述方式的整体架构2.1 门级描述2.2 数据流描述2.3 行为级描述2.4 补充&#xff1a;独立的语句2.5 小结3 理解三种描述方式的本质3.1 门级描述3.2 数据流描述3.3 行为级描述4 理解不同抽象层级描述方式…

【汇编语言】汇编实验IDE(集成开发环境):RadASM的安装和使用说明

0 前言 本文适合8086CPU的指令集。 对于重要的专业基础课程&#xff0c;汇编语言&#xff0c;做实验是必不可少的&#xff0c;但是由于汇编语言本身的缺陷&#xff0c;现代计算机并不能直接运行汇编语言程序&#xff0c;因此&#xff0c;一般老师会要求我们 使用虚拟机&…

System V IPC之信号灯

信号灯也叫信号量 用于进程/线程同步或互斥的机制 信号灯的类型 1.Posix 无名信号灯 2.Posix 有名信号灯 3.System V 信号灯 信号灯的含义 计数信号灯&#xff08;1和2都是&#xff09; System V信号灯是一个或多个计数信号灯的集合&#xff08;可操作集合中的多个信号灯&…

【VS 2017 C语言 汇编语言】如何使用VS 2017,通过反汇编查看C语言代码对应的32位x86汇编语言 VS 2017单步调试的使用

0 前言 本文适用于VS的大多数版本&#xff0c;本文以VS 2017为例进行讲解。 1 编辑C语言代码 首先&#xff0c;在VS编译器中&#xff0c;创建项目&#xff0c;敲一段C语言代码&#xff0c;这个过程不解释了&#xff0c;如果不会请百度。 #include <stdio.h> #include…

System V IPC之共享内存

共享内存是一种最为高效的进程间通信方式&#xff0c;进程可以直接读写内存&#xff0c; 而不需要任何数据的拷贝 共享内存在内核空间创建&#xff0c; 可以被进程映射到用户空间访问 由于多个进程可同时访问共享内存 &#xff0c; 因此需要同步和互斥机制配合使用 共享内存的使…

【汇编语言】结合C语言,使用VS 2017调试模式下的反汇编工具学习32位x86汇编指令

0 前言 简要说明x86系列指令集的整体概况与变化。 我给到你补充学习内容&#xff1a;使用VS学习汇编语言的教程 1 8086CPU到现代CPU的变化 做一些了解即可&#xff0c;不是绝对的&#xff0c;取决于设计工艺以及用途&#xff0c;不同计算机不一样也正常。 1.1 CPU位数与地…

System V IPC之消息队列

消息队列由消息队列id来唯一标识 消息队列就是一个消息的列表 用户可以在消息队列中添加消息 读取消息 消息队列可以按照类型来发送和接收消息 消息队列使用步骤 打开/创建消息队列 msgget 向消息队列发送消息 msgsnd 从消息队列接收消息 msgrcv 控制消息队列 msgctl 创建/打开…

进程间通信————信号

信号 信号是在软件层次上对中断机制的一直模拟&#xff0c;是一种异步通信方式 linux内核通过信号通知用户进程&#xff0c; 不同的信号类型代表不同的事件 进程对信号有不同的响应方式 缺省方式 忽略信号 捕捉信号 SIGKILL和SIGSTOP这两个信号量 级别很高 只能执行默认操作…

【汇编语言】清华大学学堂在线《汇编语言程序设计》课程学习笔记

0 前言 全是基于x86系列处理器 1 寄存器与存储器的区别 2 汇编程序员眼中的系统结构 指令寄存器 PC&#xff08;Program Counter&#xff09; 指向下一条指令的地址 16位 CS:IP32位 EIP64位 RIP 寄存器与寄存器堆&#xff08;Registers&#xff09; 在处理器内部以名字方…

进程间通信————无名管道

无名管道 只能用于具有亲缘关系的进程之间的通信 单工的通信模式 具有固定的读端和写端 无名管道创建时会返回两个文件描述符 分别用于读写管道 只能用于亲属关系之间 创建无名管道 #include <unistd.h> int pipe(int pfd[2]) 成功返回0 失败返回EOF pfd包含两个元素的…

什么是计算机思维?2个简单表达式让你理解!

0 前言 本文以十进制整数为例&#xff0c;使用2个最简单的表达式char a -20;和char c a b;,为你深入浅出地讲解计算机思维&#xff0c;力求将抽象的计算机思维具象化讲解&#xff0c;同时&#xff0c;我将为你描述一个宏大的计算机世界的蓝图。 计算机思维与核心思想概要&a…

进程间通信————有名管道

有名管道 特点&#xff1a; 对应管道文件 可用于任意进程之间进行通信 打开管道时 可指定读写方式 通过文件I/O操作 内容存放在内存中 当读端和写端都不存在 管道内容自动释放 当读端和写端只存在一个 将会无法打开管道文件 管道文件大小永远为0 因为管道中的内容保存在内…

【汇编语言】8086汇编的loop循环与[bx]寻址(王爽第五章5.5节学习笔记)

计算FFFF:0 ~ FFFF:B单元中数据的和&#xff0c;结果存储到dx中 1 分析与解决 内存单元&#xff1a;字节型数据目标寄存器&#xff1a;dx&#xff0c;字型寄存器&#xff0c;不匹配数据范围&#xff1a;dx不会超&#xff0c;但是dl会超&#xff0c;因此必须用dx将字节型数据&a…

Linux下数据库(sqlite3)学习笔记

sqlite3 数据库安装 1. 本地安装 sudo dpkg -i *.deb 2.在线安装 sudo apt-get install sqlite3 3.使用压缩包解压 压缩包下载路径&#xff1a;链接&#xff1a;https://pan.baidu.com/s/1xHLZGObQODUGBReNEi3KKQ 提取码&#xff1a;zjqv SQLITE3 基本命令 两种命令 1.以…