【Linux】解析键盘组合键产生信号的完整过程:从硬件中断到信号发送

前言

每一个了解Linux的都知道这样一个知识,Ctrl+C组合键能够终止一个进程。
在这里插入图片描述

个人了解进程相关知识之后知道,一个进程被终止只会有有三种情况:

  • 代码运行完毕,结果正确
  • 代码运行完毕,结果不正确
  • 代码运行异常,进程收到了信号,被强制终止。

然后,就去了解信号,发现存在键盘产生信号这一种方式,Ctrl+C组合键可以送2号信号SIGINT给进程,所以,上面的图片中的死循环被终止了因为进程收到了2号信号。

个人对于其中的原理非常好奇,所以经过研究就有了这一篇文章。

正文

Ctrl+CCtrl键和C键的组合,第一个问题是,计算机怎么知道有按键被按下了?

键盘上的每一个按键下方都配备了一个开关。这些开关通过刻画在电路板上的硬件电路以矩阵形式相互连接。在正常情况下,这些开关处于断路状态,这意味着没有电信号通过。然而,当按键被按下时,开关所在的电路就会连通,从而产生电信号,产生了电信号就意味着有一个按键被按下了。

第二个问题是,键盘上按键这么多,计算机怎么知道那些按键被按下了?

为了检测按键的按下和弹起,键盘内部配备了一个叫做键盘编码器(如i8048)的芯片。该芯片通过轮询的方式不断监控按键的状态,并将按键被按下或弹起而产生的相关信息向键盘控制器报告。这些信息被称为键盘扫描码,它们代表了按键的具体位置和状态。

关于键盘扫描码,现有的编码方式一共有三种,相应的也就存在三套键盘扫描码,现今的键盘大多数默认使用第二套键盘扫描码,但也不排除使用第一套和第三套的,所以为了兼容,键盘控制器会统统地将来自键盘编码器的扫描码转换为第一套扫描码。

关于第一套键盘扫描码,每个按键都有两个状态:按下和弹起,因此每个按键都会对应两个扫描码。按键按下时的编码称为通码 (makecode),而弹起时的编码称为断码 (breakcode)。大部分键的通码和断码都是用1个字节来表示的,但也有一些特殊键,如控制键(ctrlalt)、附加键(Insert)、小键盘区键(/)以及方向键等,它们的扫描码可能是2个字节甚至更多来表示的。这些多字节的扫描码通常以0xE0开头,只有Pause Break键的扫描码是以0xE1开头。

断码与通码之间存在一个简单的关系:断码 = 通码 + 0x80。从二进制表示来看,0x801000 0000,这意味着在8个比特中,最高位(第7位)表示按键的状态,0表示按下,1表示弹起。

举个例子,假设一个按键的通码是 0x45,那么它的二进制表示是 0100 0101。如果我们将它的最高位设为1,就得到断码 0xC5,对应的二进制表示是 1100 0101。这样,按键按下时发送的通码和按键释放时发送的断码之间的关系就清楚了。

这里再来说一下另一个与键盘有关的芯片——键盘控制器(i8042),键盘控制器并不位于键盘内部,而是被集成在主板的南桥芯片上。它的主要任务是接收键盘编码器发来的扫描码(第二套),解码(转换为第一套)后保存到自己的寄存器中,并通过中断控制器向CPU发送中断请求。

分别来说说这里涉及到的三个东西:南桥、键盘控制器内的寄存器、中断控制器。

南桥芯片是主板芯片组的一部分,主要负责系统的输入输出功能。在早期的计算机架构中,晶体管的数量相对偏少,处理器集成度较低,必须要由主板芯片组来承担大量功能,芯片组分为南桥芯片组和北桥芯片组两部分,北桥芯片负责CPU与内存的数据交换、图形处理以及CPU与PCIE数据交换,而南桥则负责系统的输入输出功能。然而,随着CPU制造工艺的进步和集成度的提高,许多原本由北桥芯片负责的功能现在已经被集成到CPU内部,导致北桥芯片逐渐被淘汰。现在的Intel芯片组只保留了南桥芯片,而AMD也只有早期的主板还保留了北桥和南桥。

键盘控制器内部拥有 4 个大小为 8 bits 的寄存器,它们的名称及作用分别如下:

  1. Status Register(状态寄存器)
    一个8位只读寄存器,任何时刻均可被cpu读取,各比特位定义如下:
    Bit7:奇偶校验错误。如果从键盘接收到的数据出现奇偶校验错误,此位将被置1。
    Bit6:当键盘控制器在接收数据时发生超时,此位将被置1。
    Bit5:当键盘控制器在发送数据时发生超时,此位将被置1。
    Bit4:如果为1,表示键盘未被禁用;如果为0,表示键盘被禁用。
    Bit3:如果为1,表示输入缓冲器中的内容为命令;如果为0,表示输入缓冲器中的内容为数据。
    Bit2:在加电启动时为0,在自检通过后置1。
    Bit1:如果为1,表示输入缓冲器已满,等待被 i8042 取走数据后将被清零。
    BitO:如果为1,表示输出缓冲器已满,等待 CPU 读取数据后将被清零。

  2. Control Register(控制寄存器)
    也被称作 Controller Command Byte (控制器命令字节)。各比特位定义如下:
    Bit7: 保留。应该始终为0。
    Bit6: 如果为1,键盘控制器将会将第二套扫描码翻译为第一套。
    Bit5: 如果为1,将禁止鼠标。
    Bit4: 如果为1,将禁止键盘。
    Bit3: 如果为1,将忽略状态寄存器中的 Bit4。
    Bit2: 如果为1,将设置状态寄存器中的 Bit2。
    Bit1: 如果为1,将启用鼠标中断。
    BitO: 如果为1,将启用键盘中断。

  3. Output Buffer(输出缓冲器)
    一个8位只读寄存器。键盘驱动程序从这个寄存器中读取数据。数据包括【扫描码】、【发往 i8042 命令的响应】、【间接的发往 i8048 命令的响应】等。

  4. Input Buffer(输入缓冲器)
    一个8位只写寄存器。缓冲键盘驱动程序发来的内容。内容包括【发往 i8042 的命令】、【通过 i8042 间接发往 i8048 的命令】、【以及作为命令参数的数据】等。

大致了解了这四个寄存器的作用之后,键盘控制器的工作过程就清晰了,键盘控制器接收到来自键盘编码器发送的通码或者断码,它会先把收到的这个通码或者断码解码转化成第一套扫描码,再放到输出缓冲器(Output Buffer)中,同时状态寄存器的 bit0 会被设置为1,表示键盘数据输入就绪,等待读取。然后键盘控制器回向中断控制器发送一个中断请求信号。

所以就涉及到接下来要将的第三个硬件——中断控制器。

中断控制器是计算机系统中的另一个硬件组件,负责管理各种设备控制器(比如键盘控制器、鼠标控制器、网卡控制器)发送过来的中断请求。中断控制器中较为流行的是Intel 8259A芯片,下面以8259A工作原理的例研究一下中断控制器干了什么:

  1. 8259A向CPU发送中断请求

8259A收到来自键盘控制器的中断请求,它会先检测内部的一个叫做 IMR 的寄存器(英文名称:Interrupt Mask Register,中文翻译:中断屏蔽寄存器),查看一下收到的这个键盘中断信号是否被屏蔽,如果没有被屏蔽,8259A就会向CPU的某个核心发送中断请求。

  1. CPU保存线程上下文数据。

大多数情况下,CPU的这个核心正在执行某一个线程的某一条指令(调度线程代码),由于中断请求的优先级比调度当前线程的优先级要高,所以CPU会停下当前线程的调度工作,转而进行中断处理,但是中断处理完之后,如果该线程的时间片没有过期,CPU就又得继续调度这个被暂停的线程,这个需求就又产生另一个问题,CPU必须知道这个线程被暂停之前执行到那一条指令了,执行这条指令需要的数据是什么,存储在CPU哪个寄存器内;

要知道,CPU内部的寄存器只有一套,如果中断处理过程中恰好用到了某个寄存器,这个寄存器恰好保存了被暂停线程的数据,这就会导致数据因为覆盖而丢失,所以CPU暂停线程后,还要将其在寄存器产生的所有信息保存操作系统内核中,这个过程就叫做“保存线程上下文”。

  1. CPU响应中断,并向8259A获取中断向量号。

CPU保存线程上下文之后,向8259A发送一个中断回复信号,8259A收到回复信号后,会在内部做一些处理,表示该中断正在被CPU处理,然后,CPU再次向8259A发送一个信号,表示想要获取中断向量号,8259A通过数据总线向CPU发送中断向量号,至此8259A或者说中断控制器的工作大致就完了,CPU会将中断向量号存储在某个寄存器中。

以上就是键盘产生信号的硬件部分的工作,往下就是软件部分的工作了,主要包括中断向量号,中断向量表,键盘驱动程序,键盘文件缓冲区和 shell 程序的工作了。

首先是中断向量号与中断向量表:

在操作系统内核中存在这样一张表,英文名称,Interrupt Vector Table,翻译过来就叫做中断向量表,这张表里存储的是中断源所对应的中断处理程序的入口地址, CPU会根据中断向量号在中断向量表中索引到处理该中断的中断处理程序的入口地址,通过地址找到中断处理程序然后执行该程序,这就是中断处理的大致流程。

翻译成人话就是,所谓中断向量表其实就是一个函数指针数组,里面存储的地址各种硬件设备驱动程序所提供的能够操作自身硬件的函数(关于驱动后面会谈到),这就是中断向量表的真面目,至于中断向量号,中断向量表不是个数组吗,数组不是有下标吗,所以中断向量号这个看起来高大上的东西说白了就是数组的下标。

其次是键盘驱动程序:

讲到键盘驱动程序就又得重谈一下硬件的设备控制器。我们都知道硬件与硬件之间的运作原理和机制之间的差别是非常大的,像键盘,硬盘,网卡这些就不是能够混为一谈的东西,为了屏蔽设备之间的差异,每个设备都有一个叫设备控制器(Device Control) 的组件,比如硬盘有硬盘控制器、显示器有视频控制器,键盘有键盘控制器等。

但是只有设备控制器还是不够,虽然设备控制器屏蔽了设备的众多细节,但每种设备的控制器的寄存器、缓冲区等使用模式都是不同的,所以为了屏蔽「设备控制器」的差异,引入了设备驱动程序。

设备控制器不属于操作系统范畴,它是属于硬件,而设备驱动程序属于操作系统的一部分,操作系统的内核代码可以像本地调用代码一样使用设备驱动程序的接口,而设备驱动程序是面向设备控制器的代码,它发出操控设备控制器的指令后,才可以操作设备控制器,不同的设备控制器虽然功能不同,但是设备驱动程序会提供统一的接口给操作系统,这样不同的设备驱动程序,就可以以相同的方式接入操作系统。

至此,内核通过驱动控制设备控制器,最后达成对硬件设备的统一管理,然后这也就是解释了,在了解键盘控制器(i8042)时,读取输出缓冲器的对象是键盘驱动程序。

驱动程序处理扫描码

再来梳理一下,键盘控制器中的数据已经准备好了,差的是通过通知键盘驱动程序来读取,而通知的手段就是硬件中断机制,接下来就是要理解键盘驱动程序如何读取或者说,读取到扫描符之后要做什么:

键盘驱动程序从键盘控制器的输出缓冲器读取一个字节大小的扫描码时,它首先会检查这个扫描码是否表示一个按键的按下(通码)或释放(断码)。接着,驱动程序会进行一系列的转换和检测:

首先,为了确保按键的稳定性和准确性,驱动程序会检查是否是真正的按键事件,而不是由于电气噪声或按键抖动引起的误报。这通常涉及到检测按键的多次按下和释放,并在一定时间内稳定后才认为是一个有效的按键事件。

然后,驱动程序会根据扫描码来判断它是普通字符数据(如字母、数字、标点符号等)还是属于命令(如Ctrl+CCtrl+D、Shift、方向键等)。

如果驱动程序判断当前读取的是普通字符数据,它会做这样的一件事:
键盘驱动程序会根据当前键盘的布局和状态(如大写锁定、数字锁定等)来确定具体的字符,并将其转换为对应的ASCII码或Unicode码,然后把它写入键盘的内核级文件缓冲区中。问题来了,键盘是硬件,怎么跟文件扯上关系了?这就不得不谈到Linux系统“一切皆文件”的设计理念了。

虽然键盘是硬件,但是在系统眼里,它被当成一个文件来处理,读取键盘数据在操作系统的运作逻辑里被当成是读取键盘文件的内容,既然键盘是文件,操作系统就会在内核中为其创建相应的 struct file 结构体对象,同时还有一段用于存储文件数据的内核级文件缓冲区,这个缓冲区是内核空间的一部分,用于在用户和内核之间传递数据。

当用户空间程序(如shell、文本编辑器等)需要读取键盘输入时,它们会打开相应的设备文件,并通过调用操作系统提供的系统调用从内核级文件缓冲区中读取数据。这些数据可能是字符、按键事件或其他类型的信息,具体取决于用户空间程序的需求。

如果驱动程序判断当前读取的命令,它会做这样的一件事:
驱动程序可能会产生特定的系统事件或调用特定的系统服务,而不是直接生成字符。

举个例子,我们都知道Ctrl+C组合键通常用于发送中断信号(SIGINT),用于终止当前正在运行的进程。假设按下的是Ctrl+C组合键,键盘驱动程序不会直接进行任何操作,它会通知操作系统内核,“通知”只是说法,其实也是一种中断机制,不过这是软件层面的中断,所以,操作系统内核接收到这个通知后,会调用相应的中断处理程序来处理这个中断事件。在中断服务例程中,内核会将Ctrl+C事件转换为相应的信号,通常是中断信号(如SIGINT)。内核接着会将这个信号发送给前台进程组中的所有进程,在大多数情况下,前台进程组只包含一个进程,即你当前在shell中直接运行的进程。

进程收到了信号之后,就会如果处理信号的动作没有被修改过的话,就会执行默认动作,SIGINT 信号的默认动作就是终止。

至此,键盘组合键产生信号的从硬件层面到软件层面的完整过程解析完毕。

参考文章

  1. 在键盘上敲了一个字母之后,电脑内部发生了什么?
  2. 《键盘敲入 A 字母时,操作系统期间发生了什么…》
  3. 《Intel 8042键盘控制器详细介绍》
  4. 《键盘是如何工作的?》
  5. 《从按键到响应,键盘的底层原理是什么?》
  6. 《主板上的南桥和北桥是什么意思?》
  7. 《什么是中断向量表》
  8. 《一文讲透计算机的“中断”》

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/bicheng/12160.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

huggingface 笔记:pipeline

1 介绍 pipeline() 是使用预训练模型进行推理的最简单和最快速的方式。可以针对不同模态的许多任务直接使用 pipeline() 2 举例:情感分析 2.1 创建pipeline实例 from transformers import pipelineclassifier pipeline("sentiment-analysis") #首先创…

SystemC学习使用记录

一、概述 对于复杂的片上系统,在进行RTL编码前,需进行深入的系统级仿真,以确认设计的体系结构是否恰当、总线是否能满足吞吐量和实现性要求以及存储器是否浪费,所进行的这些仿真要求在芯片的仿真模型上运行大量的软件&#xff0c…

跨境必看|TikTok账号运营的八大秘籍

国内的传统生意都是可以在抖音上做,那么也可以在TikTok 上重新做一遍。那该如何才能把握住这片巨大的蓝海,TikTok 账号的运营就成为了主要的关键了,对于TikTok账号运营的八大秘籍,大家一起看看是如何做的? 一、固定节…

为什么需要使用SOCKS5代理?

SOCKS代表Socket Secure,是一种网络协议,能够在网络上进行数据传输。SOCKS5是SOCKS协议的第五个版本,它提供了更加安全和灵活的数据传输方式,因此在网络安全和隐私保护方面被广泛应用。在我们的日常生活中,为什么需要使…

VMware虚拟机安装详细教程

VMware下载安装好后,下载好我们要安装的操作系统的镜像文件后,此处安装的为centos7版本,就可以开始安装了。 1点击下一步 image 2、勾选【我接受条件款协议中的条款】,然后点击【下一步】。 image 3、取消勾选,然后点…

富在术数,不在劳身 财富的积累更多依赖于智慧和策略,而不是单纯的体力劳动 GPT-4o免费用

"富在术数,不在劳身"这句话的意思是财富的积累更多依赖于智慧和策略,而不是单纯的体力劳动。这句话强调了智慧和技巧在获取财富过程中的重要性,提示人们在追求财富时,应注重策略和方法的运用,而不仅仅依靠辛…

prompt工程策略(三:使用 LLM 防护围栏创建系统提示)

原文:我是如何赢得GPT-4提示工程大赛冠军的 原文的原文: How I Won Singapore’s GPT-4 Prompt Engineering Competition !!本内容仅适用于具有 System Prompt(系统提示)功能的 LLM。具有这一功能的最著名 …

工业无风扇计算机的优点

无风扇计算机往往采用紧凑且密封的外形,使其坚固耐用,使其能够在需要现场工程师进行维护之前承受恶劣的环境数年。机载移动部件较少或没有移动部件会降低组件无法按预期运行的可能性,或者更糟糕的是发生故障和损坏。采用工业组件和较低的散热…

您的文件和驱动器上的“密码保护”有多安全?

某些行业(例如医疗保健、法律和公司)的人们在通过电子邮件发送文件时通常依赖密码保护,认为它可以提供足够的安全性来防止窥探。然而,对 PDF 或 Excel 文件进行简单的密码保护并不像看起来那样万无一失。 使用密码保护文件而不加…

亿级流量系统架构设计与实战

💂 个人网站:【 摸鱼游戏】【神级代码资源网站】【工具大全】🤟 一站式轻松构建小程序、Web网站、移动应用:👉注册地址🤟 基于Web端打造的:👉轻量化工具创作平台💅 想寻找共同学习交…

Spring AI开发前期开发指导(maven依赖下载问题解决)

文章目录 说明开发条件网络环境准备本地环境准备开发工具准备 特殊说明maven配置项目jar一致下载错误解决可行的版本搭配 说明 动力节点视频教程地址,本文章学习该教程,同时说明的maven配置问题导致的项目依赖下载失败的问题和其他问题的记录。 开发条…

浅谈SiC MOSFET之双脉冲原理

1.双脉冲实验实验的必要性 在平常的使用中,我们基本通过芯片手册来了解功率器件的各种性能参数,但是手册中的参数的测量环境都是在理想状态下,与实际使用或多或少都会有差别。通过双脉冲实验可以获取器件在真实工况下的参数,对于产…

Runes 生态一周要览 ▣ 2024.5.06-5.12

1、香港「Runes Asia 2024」符文峰会之行圆满结束。 2、BEVM 宣布首次大规模 RUNES 空投现已结束!符文桥即将上线。 3、来自 Book of Blob 的交互式视听信息铭刻了第一个 Epic Sat 在 coinex 上市交易。 4、 Binance Research 发布了对 Runes 的报告。 5、HOPE•…

redis报错500

之前自己举一反三把value也给序列化了: 然后报错了: 原因是这里传入的是Integer类型,序列化的话就变为string类型了

Android Studio 查看打开Room数据库数据

关于作者: CSDN内容合伙人、技术专家, 从零开始做日活千万级APP,带领团队单日营收超千万。 专注于分享各领域原创系列文章 ,擅长java后端、移动开发、商业化变现、人工智能等,希望大家多多支持。 目录 一、导读二、概览…

漏桶算法:稳定处理大量突发流量的秘密武器!

漏桶算法的介绍 我们经常会遇到这样一种情况:数据包的发送速率不稳定,而网络的带宽有限。如果在短时间内有大量的数据包涌入,那么网络就会出现拥塞,数据包的丢失率就会增大。为了解决这个问题,人们提出了一种叫做“漏…

lerna实战(一)

前言 将大型代码仓库分割成多个独立版本化的 软件包(package)对于代码共享来说非常有用。但是,如果某些更改 跨越了多个代码仓库的话将变得很 麻烦 并且难以跟踪,并且, 跨越多个代码仓库的测试将迅速变得非常复杂。 …

Spring MVC 介绍及其使用(详细)

目录 一.什么是SpringMVC呢? 1.1MVC的介绍 1.2SpringMVC和MVC的关系 二.SpringMVC的学习 第一步:创建项目 第二步,SpringMVC的连接 第三步,Spring MVC获取参数 第四步 SpringMVC的输出 总结 特点和优势 核心组件 一.什…

发布一个属于自己的 npm工具包

我们可以发布一个属于自己的工具包到 npm 服务上,方便自己和其他开发者使用,参与社区贡献,操作步骤如下: 创建与发布 npm 初始化工具包,package.json 填写包的信息 (包的名字是唯一的)注册账号 https://www.npmjs.co…

Springboot打包jar如何后台启动和查看日志?

如何后台启动Spring Boot的fat jar 使用nohup命令启动: 在Linux或Unix系统中,你可以使用nohup命令来启动jar包,以确保即使你关闭了终端或断开了SSH连接,程序仍然可以在后台运行。命令格式如下:nohup java -jar yourapp…