MySQL中的字符集与字符序

这篇文章详细介绍一下MySQL中的字符集和字符序相关的问题,里里外外地了解一下字符集和字符序的方方面面,同时重点说明一下开发中需要注意的问题。
文章基于MySQL 8.0,也会涉及到5.7版本。主要参考MySQL手册:https://dev.mysql.com/doc/refman/8.0/en/

1. 太长不爱看版

  • 字符集(Character Set)是字符的编码规则,字符序(Collation)是字符的排序规则;
  • 每一个字符集都包含一定范围的字符;
  • 每一个字符集都有一个或多个字符序,其中一个字符序为默认字符序;
  • 每一个字符序都有一个相关联的字符集;
  • 两个不同的字符集没有相同的字符序;
  • 相同数据使用不同的字符序排序结果可能会不同;
  • MySQL支持服务(server)、数据库(database)、表(table)、字段(column)以及字符串字面量(string literal)等多个级别的字符集与字符序的设置;
  • 库表创建以及程序中尽可能使用utf8mb4字符集(可支持emoji);
  • MySQL中的utf8字符集是utf8mb3字符集的别名,避免使用;
  • MySQL 5.7的服务默认字符集是latin1,而8.0中是utf8mb4
  • 通过SHOW CHARACTER SET查看当前服务器所支持的字符集;
  • 通过SHOW COLLATION查看所有的字符序;
  • MySQL中有多个关于字符集和字符序的系统变量,可以针对全局以及当前session进行设置;
  • 通过SHOW VARIABLES LIKE "character_set%"查看当前服务以及数据库的字符集设置;
  • 使用client客户端连接数据库时,如果编码有问题,可以通过SET NAMES charset_name来设置和数据库一致的字符集;
  • 库表内容在不同字符集之前转换可能会发生数据丢失问题。

2. 什么是字符集与字符序

在大多数情况下,我们并不需要了解字符集与字符序,但是在涉及到不同字符集的转换时可能会出现问题,这时了解一下相关的知识还是有帮助的。

我们首先了解一下字符集的原理。

2.1 字符与字符集

字符是我们经常接触到的东西,比如a、中、ß,以及😀等都是字符。

我们知道计算机是通过bit来存储数据的,将人类可识别的字符转换成计算机可存储的形式,这个过程就是编码;字符编码的结果,就是内存编码。

一个字符需要用多少个bit来存储,那就需要知道一共有多少个字符。

所有的字符放在一起就是字符集。

显然,由于使用范围不同,就出现了不同的字符集。比如:

  • 汉语中的所有字符构成一个字符集(也包括不是汉字的字符,比如标点符号等);
  • 英语中的所有字符构成一个字符集;
  • 等等

对于字符集中的每个字符来说,都有两个属性:

  1. 一个是这个字符在所属字符集中的位置,可以叫做字符序号,或码点(code point);
  2. 第二个就是这个字符在计算机中的数据表示,即内存编码。

比如ASCII码,只需要8个bit就可以存储所有需要使用的字符了。

但对于汉语来说显然是不够的,因此汉语字符需要更多的bit,来将每个字符进行编码。

这样对于每个国家来说,都可能需要一个将自己使用的字符集编码成计算机内存编码的规则。

那么同一个内存编码,对于不同的字符集来说就可能代表不同的字符:

比如GB18030字符集中的“地球”两个字符的内存编码分别是0xB5D8和0xC7F2,但这两个内存编码在字符集BIG5中代表的字符却是“華⑩”。

这将对我们的程序有很大的影响。

2.2 Unicode字符集与UTF-8

为了解决不同语言编码之间不兼容的问题,Unicode出现了。

Unicode字符集致力于为全世界每一个语言的每一个字符都有统一且唯一的编码:

Unicode字符序号的范围是0x000000到0x10FFFF,可以容纳110多万个字符。

那么如何将Unicode中的字符映射到内存编码呢?主要有UTF-8、UTF-16和UTF-32等,其中最常用的就是UTF-8。

UTF-8使用1到4个不等的字节来表示所有的字符,其中前128个字符与ASCII一致。

关于Unicdoe的详细信息,可以参考https://home.unicode.org/

2.3 字符序

一个字符集中有多个字符,那么如何对其中的字符进行排序呢?这就是字符序。

简单来说,字符序就是字符排序的规则集合。比如一个字符集有下面几个字符(以及内存编码):

字符内存编码
A00
B01
a10
b11

当然我们可以直接按照A>B>a>b的规则来进行排序,这就是这个简单字符集的一个字符序。

如果想让小写字母放在前面,比如a>b>A>B,这又是一种字符序。

如果还想加上大小写无关或大小写相关,那么排序的规则集就会有相应的编码,这就产生了不同的字符序。

字符序主要对字符的排序有影响。

3. MySQL中的字符集与字符序

了解了字符集和字符序之后,来看看MySQL中的字符集与字符序。

3.1 MySQL中的字符集

通过下面的语句来查看MySQL中支持的字符集:

SHOW CHARACTER SET;

结果:

+----------+---------------------------------+---------------------+--------+
| Charset  | Description                     | Default collation   | Maxlen |
+----------+---------------------------------+---------------------+--------+
| armscii8 | ARMSCII-8 Armenian              | armscii8_general_ci |      1 |
| ascii    | US ASCII                        | ascii_general_ci    |      1 |
| big5     | Big5 Traditional Chinese        | big5_chinese_ci     |      2 |
| binary   | Binary pseudo charset           | binary              |      1 |
| cp1250   | Windows Central European        | cp1250_general_ci   |      1 |
| cp1251   | Windows Cyrillic                | cp1251_general_ci   |      1 |
| cp1256   | Windows Arabic                  | cp1256_general_ci   |      1 |
| cp1257   | Windows Baltic                  | cp1257_general_ci   |      1 |
| cp850    | DOS West European               | cp850_general_ci    |      1 |
| cp852    | DOS Central European            | cp852_general_ci    |      1 |
| cp866    | DOS Russian                     | cp866_general_ci    |      1 |
| cp932    | SJIS for Windows Japanese       | cp932_japanese_ci   |      2 |
| dec8     | DEC West European               | dec8_swedish_ci     |      1 |
| eucjpms  | UJIS for Windows Japanese       | eucjpms_japanese_ci |      3 |
| euckr    | EUC-KR Korean                   | euckr_korean_ci     |      2 |
| gb18030  | China National Standard GB18030 | gb18030_chinese_ci  |      4 |
| gb2312   | GB2312 Simplified Chinese       | gb2312_chinese_ci   |      2 |
| gbk      | GBK Simplified Chinese          | gbk_chinese_ci      |      2 |
| geostd8  | GEOSTD8 Georgian                | geostd8_general_ci  |      1 |
| greek    | ISO 8859-7 Greek                | greek_general_ci    |      1 |
| hebrew   | ISO 8859-8 Hebrew               | hebrew_general_ci   |      1 |
| hp8      | HP West European                | hp8_english_ci      |      1 |
| keybcs2  | DOS Kamenicky Czech-Slovak      | keybcs2_general_ci  |      1 |
| koi8r    | KOI8-R Relcom Russian           | koi8r_general_ci    |      1 |
| koi8u    | KOI8-U Ukrainian                | koi8u_general_ci    |      1 |
| latin1   | cp1252 West European            | latin1_swedish_ci   |      1 |
| latin2   | ISO 8859-2 Central European     | latin2_general_ci   |      1 |
| latin5   | ISO 8859-9 Turkish              | latin5_turkish_ci   |      1 |
| latin7   | ISO 8859-13 Baltic              | latin7_general_ci   |      1 |
| macce    | Mac Central European            | macce_general_ci    |      1 |
| macroman | Mac West European               | macroman_general_ci |      1 |
| sjis     | Shift-JIS Japanese              | sjis_japanese_ci    |      2 |
| swe7     | 7bit Swedish                    | swe7_swedish_ci     |      1 |
| tis620   | TIS620 Thai                     | tis620_thai_ci      |      1 |
| ucs2     | UCS-2 Unicode                   | ucs2_general_ci     |      2 |
| ujis     | EUC-JP Japanese                 | ujis_japanese_ci    |      3 |
| utf16    | UTF-16 Unicode                  | utf16_general_ci    |      4 |
| utf16le  | UTF-16LE Unicode                | utf16le_general_ci  |      4 |
| utf32    | UTF-32 Unicode                  | utf32_general_ci    |      4 |
| utf8     | UTF-8 Unicode                   | utf8_general_ci     |      3 |
| utf8mb4  | UTF-8 Unicode                   | utf8mb4_0900_ai_ci  |      4 |
+----------+---------------------------------+---------------------+--------+

字段含义:

  • Charset: 字符集的名称;
  • Description:字符集的简单描述;
  • Default collation:该字符集的默认字符序;
  • Maxlen:该字符集中字符最大存储长度。

通过加入条件查询一部分字符集:

SHOW CHARATER SET LIKE 'utf%';

结果展示所有Unicode字符集:

+---------+------------------+--------------------+--------+
| Charset | Description      | Default collation  | Maxlen |
+---------+------------------+--------------------+--------+
| utf16   | UTF-16 Unicode   | utf16_general_ci   |      4 |
| utf16le | UTF-16LE Unicode | utf16le_general_ci |      4 |
| utf32   | UTF-32 Unicode   | utf32_general_ci   |      4 |
| utf8    | UTF-8 Unicode    | utf8_general_ci    |      3 |
| utf8mb4 | UTF-8 Unicode    | utf8mb4_0900_ai_ci |      4 |
+---------+------------------+--------------------+--------+

后面会有关于Unicode的每种字符集的详细信息。

3.2 MySQL中的字符序

每个字符集都有一个或多个字符序,可以通过下面的语句查看所有的字符序:

SHOW COLLATION;

结果(只展示一部分):

+---------------------+----------+-----+---------+----------+---------+---------------+
| Collation           | Charset  | Id  | Default | Compiled | Sortlen | Pad_attribute |
+---------------------+----------+-----+---------+----------+---------+---------------+
| armscii8_bin        | armscii8 |  64 |         | Yes      |       1 | PAD SPACE     |
| armscii8_general_ci | armscii8 |  32 | Yes     | Yes      |       1 | PAD SPACE     |
| ascii_bin           | ascii    |  65 |         | Yes      |       1 | PAD SPACE     |
| ascii_general_ci    | ascii    |  11 | Yes     | Yes      |       1 | PAD SPACE     |
| big5_bin            | big5     |  84 |         | Yes      |       1 | PAD SPACE     |
| big5_chinese_ci     | big5     |   1 | Yes     | Yes      |       1 | PAD SPACE     |
| binary              | binary   |  63 | Yes     | Yes      |       1 | NO PAD        |
| cp1250_bin          | cp1250   |  66 |         | Yes      |       1 | PAD SPACE     |
| cp1250_croatian_ci  | cp1250   |  44 |         | Yes      |       1 | PAD SPACE     |
| cp1250_czech_cs     | cp1250   |  34 |         | Yes      |       2 | PAD SPACE     |
| cp1250_general_ci   | cp1250   |  26 | Yes     | Yes      |       1 | PAD SPACE     |
| cp1250_polish_ci    | cp1250   |  99 |         | Yes      |       1 | PAD SPACE     |
|      ......         | ......   |  ...|  ...    | ...      |   ...   |  ......       |
+---------------------+----------+-----+---------+----------+---------+---------------+

字段含义如下:

  • Collation:字符序名称;
  • Charset:该字符序关联的字符集;
  • Id:字符序ID;
  • Default:该字符序是否是所关联的字符集的默认字符序。比armscii8_general_ci就是armscii8的默认字符序,而armscii8_bin就不是;
  • Compiled:字符集是否已编译到服务器中;
  • Sortlen:这与对以字符集表示的字符串进行排序所需的内存量有关;
  • Pad_attribute:这表明了字符序在比较字符串时对末尾padding的处理。NO PAD表明在比较字符串时,末尾的padding也会考虑进去,否则不考虑。

也可以指定条件查询:

SHOW COLLATION WHERE Charset = 'utf8mb4';

这里查询的就是utf8mb4字符集的所有字符序。

每个字符序都是以该字符序所关联的字符集为前缀的,同时还有一些有规律的后缀。

这些后缀有:

  • bin:二进制;
  • ci:大小写不敏感;
  • cs:大小写敏感;
  • ai:口音(Accent)不敏感;
  • as:口音敏感;
  • ks:假名(Kanatype)敏感。

同时有的字符序是面向某种语言的,也会在字符序名字中有所体现,比如big5_chinese_ci

3.3 字符集与字符序的关系

字符集与字符序的关系可以用下面的图来表示:

即:
  • 每个字符集都有一个或多个字符序;
  • 每个字符集都有一个默认的字符序;
  • 每个字符序都关联一个且只有一个字符集;
  • 两个不同的字符集没有相同的字符序。

3.4 MySQL中的相关变量

MySQL中有一些变量用于字符集与字符序的设置。

3.4.1 字符集变量

通过下面的语句来查看与字符集相关的变量:

SHOW VARIABLES LIKE 'character_set\_%'; -- 当前会话
SHOW GLOBAL VARIABLES LIKE 'character_set\_%'; -- 全局

结果:

+--------------------------------+---------+
| Variable_name                  | Value   |
+--------------------------------+---------+
| character_set_client           | utf8mb4 |
| character_set_client_handshake | ON      |
| character_set_connection       | utf8mb4 |
| character_set_database         | utf8mb4 |
| character_set_filesystem       | binary  |
| character_set_results          | utf8mb4 |
| character_set_server           | utf8mb4 |
| character_set_system           | utf8    |
+--------------------------------+---------+

变量含义:

变量含义作用域默认值
character_set_client客户端发出SQL语句的字符集全局,会话utf8mb4
character_set_client_handshake不忽略客户端发出的字符集信息全局,会话ON(不忽略)
character_set_connection没有指定字符集的字符串字面值所使用的字符集全局,会话utf8mb4
character_set_database数据库默认使用的字符集全局,会话utf8mb4
character_set_filesystem文件系统默认的字符集全局,会话binary
character_set_results服务器返回给客户端的结果使用的字符集全局,会话utf8mb4
character_set_server服务器默认的字符集全局,会话utf8mb4
character_set_system服务器存储元数据使用的字符集全局utf8bm3

3.4.2 character_set_system

这个变量是MySQL数据库元数据使用的字符集。

所有描述数据库的数据都是元数据,比如表名、列名等等。

对元数据的存储有如下几个要求:

所有的元数据必须使用相同的字符集;

这个字符集必须包含所有语言的字符。

MySQL使用UTF-8,具体的就是utf8mb3字符集,在MySQL中utf8就是utf8mb3,不过后续的版本可能会有所改变。

3.4.3 字符序变量

通过下面的语句来查看与字符序相关的变量:

SHOW VARIABLES LIKE '%collation%'; -- 当前会话
SHOW GLOBAL VARIABLES LIKE '%collation%'; -- 全局

结果:

+----------------------+--------------------+
| Variable_name        | Value              |
+----------------------+--------------------+
| collation_connection | utf8_general_ci    |
| collation_database   | utf8mb4_general_ci |
| collation_server     | utf8mb4_general_ci |
+----------------------+--------------------+

变量含义:

变量含义作用域
collation_connection没有指定字符集的字符串字面值所使用的字符序全局,会话
collation_database数据库默认使用的字符序全局,会话
collation_server服务器默认使用的字符序全局,会话

3.4.3 重要变量

本文主要关注于下面几个变量:

  • character_set_server, collation_server
  • character_set_database, collation_database
  • character_set_client
  • character_set_connection, collation_connection
  • character_set_results

其中前前两组涉及库表设计时字符集与字符序的配置,后三组涉及到客户端与服务器连接时的字符集与字符序的配置。

4. 设置字符集与字符序

MySQL中支持多种字符集与字符序,对此,MySQL能够为我们做到:

  • 使用不同字符集存储字符串;
  • 使用不同的字符序对字符串进行排序;
  • 在同一个服务器中,或同一个数据库中,甚至同一张表中使用不同的字符集或字符序;
  • 对于多个级别的字符集与字符序进行设置。

4.1 服务器的设置

MySQL中,服务器有一个默认的字符集与字符序,其中:

  • 5.7以后版本默认字符集是utf8mb4
  • 5.7的默认字符序是utf8mb4_general_ci
  • 8.0的默认字符序是utf8mb4_0900_ai_ci

服务器的字符集与字符序可以通过多种方式设置:

  • 服务器启动时:
mysqld
mysqld --character-set-server=utf8mb4
mysqld --character-set-server=utf8mb4 --collation-server=utf8mb4_0900_ai_ci

这三种方式效果一样。

  • 服务运行时:设置character_set_servercollation_server变量;
  • 还可以编译MySQL服务时进行设置。

服务器字符集与字符序的影响:当创建数据库时没有指定字符集与字符序,就是用服务器的字符集与字符序。

除此之外没有别的影响。

4.2 库表设计中的设置

在创建库表时,需要指定数据库、表以及字段所使用的字符集与字符序。

如果没有指定,MySQL有一系列规则来使用字符集与字符序的默认值。

4.2.1 数据库的设置

在创建数据库的时候可以指定该数据库所使用的字符集与字符序:

CREATE DATABASE db_name CHARACTER SET latin1 COLLATE latin1_swedish_ci;

MySQL使用下面的规则来设置数据库的字符集与字符序:

  • 如果创建数据库的时候指定了字符集与字符序,就是用这个字符集与字符序:
CREATE DATABASE db_name CHARACTER SET latin1 COLLATE latin1_swedish_ci;

这里数据库的字符集就是latin1,字符序就是latin1_swedish_ci

  • 如果创建数据库时指定了字符集而没有指定字符序,那字符集就是这个值,而字符序就是字符集的默认字符序:
CREATE DATABASE db_name CHARACTER SET latin1;

字符集就是latin1,字符序就是latin1的默认字符序latin1_swedish_ci

  • 如果创建数据库时指定了字符序而没有指定字符集,那么字符集就是该字符序所对应的字符集:
CREATE DATABASE db_name CHARACTER COLLATE latin1_swedish_ci;

字符序就是latin1_swedish_ci,字符集就是这个字符序关联的字符集latin1

  • 如果字符集与字符序都没有指定,那么就是用服务器默认的字符集(character_set_server)与字符序(collation_server)。

对于当前数据库所使用的字符集与字符序,可以通过查看下面两个变量的值:

USE db_name;
SELECT @@character_set_database, @@collation_database;

这两个变量的值有如下的影响:

  1. 如果创建表时没有指定该表使用的字符集与字符序,就是用这两个变量所对应的字符集与字符序;
  2. LOAT DATA语句没有指定字符集时,服务器使用character_set_database来解析文件中的信息。

4.2.2 表的设置

创建表时也可以制定该表所使用的字符集与字符序:

CREATE TABLE t1 ( ... )
CHARACTER SET latin1 COLLATE latin1_danish_ci;

MySQL选择表的字符集与字符序的规则和数据库类似,不同在于如果创建表时没有指定字符集与字符序,就会使用变量character_set_databasecollation_database所指定的字符集与字符序。

4.2.3 字段的设置

表里的每个字段也可以拥有自己的字符集与字符序:

CREATE TABLE t1
(col1 VARCHAR(5)CHARACTER SET latin1COLLATE latin1_german1_ci
);ALTER TABLE t1 MODIFYcol1 VARCHAR(5)CHARACTER SET latin1COLLATE latin1_swedish_ci;

与数据库和表类似,MySQL也是按照层级来制定字符集与字符序的。

如果字段没有指定,那么就是用表所使用的字符集与字符序。

4.2.4 小结

上面的几个小节中关于库表设计的字符集与字符序设置,可以用下图来表示:

上一层级如果没有指定字符集与字符序,就是用下一层级的字符集与字符序。

4.3 客户端连接中的设置

当我们使用mysql这个客户端与MySQL服务器连接的时候,也会涉及到字符集与字符序的设置。

4.3.1 与连接有关的变量

每一个连接到服务器的客户端都有一个对应的字符集与字符序。

涉及到的变量有:

  • character_set_client
  • character_set_connection, collation_connection
  • character_set_results

这三个关于字符集的变量是这样使用的:

即:
  1. 客户端的语句从客户端出发时,使用的字符集是character_set_client
  2. 语句到达服务器时,服务器将语句转换成character_set_connection字符集;
  3. 服务器执行完,将结果返回给客户端时,使用的是character_set_results字符集。

4.3.2 客户端连接字符集设置

当服务器使用的字符集与客户端连接使用的字符集不同时,可能会有问题:

MySQL [test]> select title from article where id = 2;
+-------+
| title |
+-------+
| ????? |
+-------+

这时需要将客户端连接的字符集设置成与服务器保持一致。

SET NAMES utf8mb4;

这样就可以了:

MySQL [test]> select title from article where id = 2;
+-----------------+
| title           |
+-----------------+
| 未命名项目       |
+-----------------+

上面的语句等同于:

SET character_set_client = utf8mb4;
SET character_set_results = utf8mb4;
SET character_set_connection = utf8mb4;

4.3.3 一些限制

在设置character_set_client变量时,下面的字符集不可用:

  • ucs2
  • utf16
  • utf16le
  • utf32

否则就会报错:

MySQL [test]> set names utf16;
ERROR 1231 (42000): Variable 'character_set_client' can't be set to the value of 'utf16'

4.3.4 程序中连接的设置

使用数据库的程序也是一个客户端,在连接数据库的时候也需要指定字符集。

Python:

conn = mysql.connect(host='127.0.0.1',user='user',passwd='passwd',db='db',charset='utf8')

Golang:

dsn := `root:root@tcp(127.0.0.1 :3306)/DB_NAME?charset=utf8mb4`
dbConn, _:= sql.Open(`mysql`, dsn)

5. MySQL对Unicode的支持

前面提到过一种包含所有语言所有字符的字符集Unicode,它的码点分为两个部分:

BMP(Basic Multilingual Plane): 基本多文种平面,范围是0x0000到0xFFFF;

补充平面(Supplementary): 补充平面,范围是0x10000到0x10FFFF。

5.1 BMP

BMP有如下的特点:

范围是0x0000到0xFFFF,一共65535个字符;

可以编码成变长编码,使用1到3个字节;

也可以编码成定长编码,使用2个字节;

对于主要语言的大多数字符来说是足够了。

5.2 Supplementary

补充平面有如下的特点:

范围是0x10000到0x10FFFF;

编码所需的字节大于BMP,需要4个字节。

5.3 MySQL的支持

MySQL中有几个字符集支持了Unicode:

字符集支持的字符每个字符所需的存储大小备注
utf8mb3, utf8BMP1、2或3个字节MySQL 8.0中已弃用
ucs2BMP2个字节MySQL 8.0中已弃用
utf8mb4BMP和Supplementary1、2、3或3个字节推荐使用
utf16BMP和Supplementary2或4个字节
utf16leBMP和Supplementary2或4个字节little-endian,和utf16一样
utf32BMP和Supplementary4个字节

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/385482.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【C++ Primer | 15】虚函数表剖析(一)

一、虚函数 1. 概念 多态指当不同的对象收到相同的消息时,产生不同的动作 编译时多态(静态绑定),函数重载,运算符重载,模板。运行时多态(动态绑定),虚函数机制。为了实现…

Leetcode 118. 杨辉三角

给定一个非负整数 numRows&#xff0c;生成杨辉三角的前 numRows 行。 在杨辉三角中&#xff0c;每个数是它左上方和右上方的数的和。 示例: 输入: 5 输出: [[1],[1,1],[1,2,1],[1,3,3,1],[1,4,6,4,1] ] class Solution { public:vector<vector<int>> generate(…

Linux本地yum源配置以及使用yum源安装各种应用程序

将软件包传送到Linux中后&#xff0c;挂载&#xff0c;然后配置yum软件仓库&#xff0c;最后就可以使用yum来安装相应的应用程序了。假设挂载目录为/tmp/ruanjianbao&#xff0c;则下面说明配置本地yum仓库的过程&#xff1a; &#xff08;1&#xff09;cd /etc/yum.repos.d/…

【第15章】多重继承

1. 虚基类介绍 多继承时很容易产生命名冲突&#xff0c;即使我们很小心地将所有类中的成员变量和成员函数都命名为不同的名字&#xff0c;命名冲突依然有可能发生&#xff0c;比如非常经典的菱形继承层次。如下图所示&#xff1a; 类A派生出类B和类C&#xff0c;类D继承自类B和…

1. 排序算法

一、概述 假定在待排序的记录序列中&#xff0c;存在多个具有相同的关键字的记录&#xff0c;若经过排序&#xff0c;这些记录的相对次序保持不变&#xff0c;即在原序列中&#xff0c;r[i]r[j]&#xff0c;且r[i]在r[j]之前&#xff0c;而在排序后的序列中&#xff0c;r[i]仍…

【C++ Priemr | 15】构造函数与拷贝控制

继承的构造函数 1. 简介&#xff1a; 子类为完成基类初始化&#xff0c;在C11之前&#xff0c;需要在初始化列表调用基类的构造函数&#xff0c;从而完成构造函数的传递。如果基类拥有多个构造函数&#xff0c;那么子类也需要实现多个与基类构造函数对应的构造函数。 class …

【C++ Priemr | 15】面向对象程序设计

类型准换与继承 为了支持c的多态性&#xff0c;才用了动态绑定和静态绑定。 需要理解四个名词&#xff1a; 对象的静态类型&#xff1a;对象在声明时采用的类型&#xff0c;是在编译期确定的。对象的动态类型&#xff1a;目前所指对象的类型&#xff0c;是在运行期决定的。对…

【C++ Priemr | 15】虚函数表剖析(三)

一、虚拟菱形继承 #include <iostream> using namespace std;class B { public:int _b; };class C1 :virtual public B { public:int _c1; };class C2 :virtual public B { public:int _c2; };class D :public C1, public C2 { public:int _d; };int main() {cout <&…

程序的装入和链接

注&#xff1a;这是本人学习汤小丹等编写的计算机操作系统&#xff08;西安电子科技大学出版社&#xff09;的学习笔记&#xff0c;因此许多引用来源于此书&#xff0c;在正文中就不注明了&#xff01; 程序在运行前需要经过以下步骤&#xff1a;编译程序对源程序进行编译生成…

静态库的制作和使用

Linux下的静态库为lib*.a格式的二进制文件&#xff08;目标文件&#xff09;&#xff0c;对应于Windows下的.lib格式的文件。 &#xff08;1&#xff09;命名规则 lib库名字 .a libMytest.a &#xff0c;则库名字为mytest。下面以具体的代码为例介绍如何制作静态库。 //mai…

虚拟地址空间

对于每一个进程都会对应一个虚拟地址空间&#xff0c;对于32位的操作系统&#xff08;其指令的位数最大为32位&#xff0c;因此地址码最多32位&#xff09;&#xff0c;虚拟地址空间的大小为B即0~4GB的虚拟地址空间&#xff0c;其中内核空间为1GB&#xff0c;如下所示&#xff…

动态库(共享库)的制作和使用

Linux下的动态库为lib*.so格式的二进制文件&#xff08;目标文件&#xff09;&#xff0c;对应于Windows下的.dll格式的文件。 &#xff08;1&#xff09;命名规则 lib库名.so &#xff08;2&#xff09;动态库的制作 1&#xff09;生成与位置无关的代码&#xff08;.o&…

网络编程套接字API

uint32_t htonl(uint32_t hostlong); uint16_t htons(uint16_t hostshort); uint32_t ntohl(uint32_t netlong); uint16_t ntohs(uint16_t netshort);int inet_pton(int family, const char *strptr, void *addrptr); 分析&#xff1a; 第一个参数可以是AF_INET或AF_INET6&am…

gdb调试器(三)

File/file 装入想要调试的可执行文件 run(r) 执行当前被调试的程序 kill(k) 终止正在调试的程序 quit(q) 退出gdb shell 使用户不离开gdb就可以执行Linux的shell命令 backtrace(bt) 回溯跟踪&#xff08;当对代码进行调试时&#xff0c;run后…

makefile文件的书写规则(make和makefile)

对于makefile&#xff0c;掌握一个规则&#xff0c;两个变量和三个函数。下面介绍一个规则。 makefile的作用&#xff1a;一个项目代码的管理工具。当一个项目的代码文件数&#xff08;如.c文件&#xff09;太多&#xff0c;用gcc编译会太麻烦&#xff0c;如果全部文件一次性编…

makefile的两个变量(自动变量和普通变量)

(1)普通变量 如&#xff1a; objmain.o add.o sub.o mul.o div.o //将后面的值赋值给obj&#xff0c;obj就是一个普通变量 targetzsx //将zsx赋值给target makefile中已经定义的一些普通变量&#xff08;通常格式都是大写&#xff0c;类似环境变量&#xff0c;它们都是普通…

【C++ Priemr | 15】虚函数表剖析(二)

一、多重继承&#xff08;无虚函数覆盖&#xff09; 下面&#xff0c;再让我们来看看多重继承中的情况&#xff0c;假设有下面这样一个类的继承关系。注意&#xff1a;子类并没有覆盖父类的函数。 测试代码&#xff1a; class Base1 { public: virtual void f() { cout <…

makefile中的两个函数(wildcard和patsubst)

(1) wildcard函数 作用是查找指定目录下指定类型的文件&#xff0c;并最终返回一个环境变量&#xff0c;需要用$取值赋值给另一个环境变量&#xff01;该函数只有一个参数&#xff0c;如取出当前目录下的所有.c文件&#xff0c;并赋值给allc普通变量&#xff1a; allc$(wildc…

C库函数

Linux的系统I/O函数&#xff08;read、write、open、close和 lseek等&#xff09;与C语言的C库函数&#xff08;libc.so库文件中&#xff09;都是相对应的&#xff0c;它们都是动态库函数。如下图所示&#xff0c;C库函数有fopen、fclose、fwrite、fread和fseek等。这些C库函数…

C库函数与Linux系统函数之间的关系

由上小节知道&#xff0c;C库函数是借助FILE类型的结构体来对文件进行操作的&#xff0c;其本身只是在用户空间&#xff08;I/O缓冲区&#xff09;进行读写操作&#xff0c;而数据在内核与用户空间之间的传递、以及将内核与I/O设备之间的数据传递都是该C库函数进行一系列的系统…