🔭个人主页: 北 海
🛜所属专栏: 神奇的网络世界
💻操作环境: CentOS 7.6 阿里云远程服务器
文章目录
- 🌤️前言
- 🌦️正文
- 1.网络发展
- 1.1.背景
- 1.2.类型
- 2.网络协议
- 2.1.什么是协议
- 2.2.协议分层
- 2.3.OSI七层模型
- 2.3.TCP/IP五层模型
- 2.4.系统与网络的联系
- 3.网络传输
- 3.1.前置概念
- 3.2.同一个局域网内通信
- 3.3.数据包的封装与分用
- 3.4.局域网通信原理
- 3.5.跨路由器的远端通信
- 4.网络地址
- 4.1.IP地址
- 4.2.MAC地址
- 4.3.IP与MAC的关系
- 🌨️总结
🌤️前言
在网络世界的纷繁复杂中,理解基础才能驾驭未来。本文踏上网络之旅,解析其『发展 ‖ 协议 ‖ 传输 ‖ 地址』四大方面,探寻阿帕网到商用互联网的发展,深入 OSI七层模型、TCP/IP五层模型,揭示数据传输的奥妙。透过实际案例,走进网络的心脏,洞悉通信的精妙之处,为探险网络世界的每一位旅者打开智慧之门
🌦️正文
1.网络发展
1.1.背景
1945
年,二战结束,世界恢复和平,并出现了 美国、苏联 两个超级大国;1947
年,杜鲁门主义 出台,标志着以两个超级大国为代表的 冷战 正式开始;1957
年,苏联 发射了人类第一颗人造地球卫星,令 美国 大为震惊;1958
年,美国 组建高级研究计划局(ARPA
),简称 阿帕,负责研发用于军事用途的高新科技
在 阿帕 中,信息技术处 属于核心机构,主要研究方向是计算机,网络通讯等方面,1968
年,拉里·罗伯茨 提交了一份题为 《资源共享的电脑网络》 报告,报告中提出 让阿帕的计算机相互连接,以达到信息共享的目的,而这就是最早的网络:阿帕网
1969
年 10
月 29
日,进行第一次 阿帕网 的连接实验,起点为 加州大学洛杉矶分校,终点则是 500km
之外的 斯坦福研究所,第一次连接实验想传输单词 login
,最终因连接中断,只成功传输了字母 l
和 o
,但这次连接实验成功开启了网络世界的大门;最初 阿帕网 的节点只有四个,到了 1981
年,节点增加至 213
个
1974
年,温顿·瑟夫 和 罗伯特·卡恩 提出的 TCP/IP
协议 正式发表,TCP/IP
协议 突破了不同硬件间的限制,允许不同的计算机之间进行高效可靠的数据传输,经过数十年的完善,TCP/IP
协议 成为使用最广泛的网络协议,这也为网络快速发展奠定了基础;1986
年,美国国家科学基金会网络(NSFNET
) 成立,阿帕网 只能用于军事研究,而 NSFNET
则是鼓励大学和研究机构加入到自己的互联网中,服务于学术研究,NSFNET
快速发展,并逐渐替代了 阿帕网
随着互联网在 军事 和 学术 领域的不断发展,商业 领域对于网络的需求变得越来越迫切,因为这是一个全新的市场,具有不可估量的发展前景;世界上第一家商业互联网服务提供商 The World
很快就成立了,并于 1989
年开始提供互联网的接入服务,目前这家公司的官网仍可访问,随后越来越多的商业互联网服务商开始诞生;1995
年,NSFNET
将自己的经营权转给了美国的私有电信公司,至此互联网正式进入商业时代
尽管商业互联网早在 1989
年就已经开始,但想要通过互联网获取信息仍存在门槛,这对于普通人是很不友好的,导致互联网无法普及;同年,互联网中教父级的人物 蒂姆·伯纳斯-李 发明了 万维网 www
,并于第二年开发出了 第一个网页服务器 和 第一个网页浏览器,至此,普通人只需要打开浏览器,就能轻松查阅到互联网中的所有信息,信息变得触手可得,互联网也因此快速发展,进入了网页时代。互联网在 1990-2000
年这十年间的发展令所有人吃惊,这期间也诞生了很多互联网传奇
1993
年1
月,马克.安德森 开发了马赛克(Mosaic
)浏览器,支持显示图片,并于第二年成立 网景公司,推出了新一代 网景浏览器,1995
年 网景公司 在纽约上市,一夜之间公司市值就突破了20
亿美元
1995
年3
月,斯坦福大学的两名电气工程系的研究生共同创建了 雅虎公司
1995
年7
月,杰夫·贝索斯 创建 亚马逊,全新的电子商务模式使其创始人一跃成为世界首富
1995
年微软为了回应 网景浏览器,推出了经典浏览器Internet Explorer
1997
年,丁磊在广州创建了 网易公司,并推出了强大且免费的163
邮箱
1998
年2
月,从美国麻省理工学院毕业回国的 张朝阳 创建了 搜狐
1998
年11
月,马化腾 在深圳创建 腾讯公司,腾讯帝国正式拉开了帷幕
1998
年12
月,王志东 创建了 新浪网站,才有了后来的新浪微博
1998
年2
月,谷歌 成立,曾想将自己的网络爬虫项目出售给 雅虎,惨遭拒绝,多年之后,谷歌 成为全球最大的搜索引擎公司
1999
年9
月,马云 带着他的十八罗汉在杭州的公寓中创建了 阿里巴巴集团,如今的 淘宝、支付宝 等阿里系产品已经深刻改变了人们的生活方式
2000
年,李彦宏 带着他的 “超链分析” 技术专利创建了 百度,“百度一下,你就知道” 的观念深入人心…
上述内容摘录自知乎文章《可能谦虚的说,这是一篇最全的互联网发展史》
互联网 仍在快速发展,web2.0
和 移动互联网 时代同样诞生了无数传奇,即将到来的 web3.0
也同样令人期待。所有人共建的,就是 网络
1.2.类型
如果按照 网络区域 进行划分,可以分为 局域网 LAN
和 广域网 WAN
局域网 LAN
通常指在一个区域内将多台计算机通过双绞线、同轴电缆等连接介质互相连接
广域网 WAN
则是指将相隔千里的计算机进行连接
值得注意的是 局域网和广域网只是一个相对的概念,并没有明显的界限,比如一个看似很大的广域网,实际也就是个局域网
2.网络协议
2.1.什么是协议
协议 是一种约定,也是一种标准,比如著名的 IEEE 754
标准,就规定了浮点数如何在内存中存储;再比如投资者往往会与被投资者签订一份对赌协议,确保投资顺利进行
协议制定后,参与者都必须遵守该协议
不同行业中的 协议 往往由该行业中的翘楚制定,比如在通信标准领域,华为 就担任了重要角色,并作为 5G
标准的主导者之一
一流企业定标准,二流企业做品牌,三流企业做产品
在当前互联网时代,有众多计算机生产商、计算机操作系统和多样化的计算机网络硬件设备。那么,如何实现这些不同设备之间的互相连接呢?
答案是 制定出被大家都认可的协议,当 协议 被制定出来且拥有一定用户基础后,后续厂商推出的硬件设施也必须遵守该 协议,否则就会被市场抛弃,如此一来,可以倒逼众多配套设备共同遵守,网络连接环境也就逐渐完善了
2.2.协议分层
网络在传输过程中面临诸多问题:
- 数据如何组织,如何解析的问题
- 长距离传输,数据丢失的问题
- 如何在众多主机中定位目标主机的问题
- 如何进行数据转发、路径选择的问题
010101
硬件级别的协议问题
如何解决这些问题呢?
将问题分类,逐个击破 — 高内聚
这些问题之间是存在先后关系的,比如只有先把信息组织好了,才需要考虑数据传输过程中的丢失问题,丢失问题得到保障后,就要考虑把数据发送给谁、如何发送,最终通过硬件完成发送
基于 解耦、可维护性、可扩展性 这三点出发,采用 协议分层 的解决方案,将不同的问题解决策略归入不同模块中,模块之间互不影响 — 低耦合
此时网络的 层状结构 呼之欲出,不同分层中包含了各种协议,负责解决不同的问题
其实 分层 这个概念早在语言学习阶段就已经接触过了:在学习 继承 时,子类继承自父类,当前出现了 父类 和 子类 这两层结构,父类可以不必关心子类的具体实现,需要时可以直接通过父类指针对子类成员或函数进行访问
在进行 分层 后,上层无需关心下层的具体实现,只需要使用下层提供的功能即可,分层 思想很好的体现了计算机领域的设计哲学:任何计算机问题都可以通过添加一层软件层解决
拿日常生活举例,假设 A
想给 B
打电话,只需要拿起电话并拨通 B
的号码,待 B
接通电话后,双方可以通话,在通话过程中,A
与 B
都认为自己在直接与对方通话
这是因为 A
、B
同处 语言层,任务是 进行通话,而通话的具体实现属于 通信设备层,用于 实现通话;语言层 依赖 通信设备层 的功能,但并不关心它的具体实现,因为没必要
语言层和通信设备层之间通过 接口 进行连接,有点类似于操作系统中的系统调用
假设某天 通信设备层 中的电话机坏了,可以将其更换为无线电,继续向 语言层 提供通话的服务,即便设备更换了,A
、B
依旧可以正常通话
不仅 通信设备层 可以更换设备,语言层 也可以更换角色,比如现在变成 B
、C
两个外国人进行通话,通信设备层 依旧可以正常提供服务
上述例子中,很好的体现出 分层 的好处:分层之后,每一层都只关注自己层的功能,使用下层提供的接口,任何一层出问题,都不会直接影响其他层
分层 是解决大量问题的最优解(高内聚、低耦合)
能否不进行分层?
从技术层面来说是可以的,但这对于整个系统的设计都是非常不友好的,比如你可以把所有的代码都写到一个main
函数中,程序依旧可以运行,但如果程序运行出现了问题,或者说需要对某个功能进行改动,会变得十分麻烦
所以随着编程思想的深入,不同的功能由不同的函数实现,对功能(函数)进行聚合,也就形成了类;分层也是如此,分层之后,无论是进行功能维护,还是进行功能扩展,都可以在不影响其他层的情况下进行
2.3.OSI七层模型
基于 网络分层 的设计思想,诞生了著名的 OSI
七层网络模型
OSI
(Open System Interconnect
),即 开放式系统互连, 一般都叫 OSI
参考模型,是 ISO
组织 在 1985
年研究的 网络互连模型,该模型将 网络 从逻辑上分成了 七层,每一层都有对应的 协议 或 物理设备
OSI
参考模型 最大优点是将 服务、接口 和 协议 这三个概念明确地区分开来,通过七个层次化的结构模型使不同的系统不同的网络之间实现可靠的通讯
自底向上,OSI
参考模型 中不同层级实现功能如下所示
分层名称 | 功能 | 预览 |
---|---|---|
物理层 | 解决硬件相关的问题,比如 01 序列解析、数字/模拟信号处理、界定连接器和网线的规格 | |
数据链路层 | 解决两台主机在局域网中如何连通的问题 | |
网络层 | 解决主机跨网络,经过路径选择后如何到达目标主机的问题 | |
传输层 | 解决数据传输时可能发生的数据丢失问题,同时通过策略实现数据高效传输 | |
会话层 | 进行连接管理 | |
表示层 | 规定信息转换格式 | |
应用层 | 针对不同应用的协议 |
表格图片来源:《网络入门基础》
OSI
参考模型 是一种框架性的设计方法,基于该模型可以实现不同的具体模型,其中最出名的是 TCP/IP
五层模型,这也是我们主要学习的网络模型
2.3.TCP/IP五层模型
为什么会变成五层模型?
这是因为开发人员在使用 OSI
七层模型 的过程中,发现这个标准设计的过于麻烦了,应用层、表示层、会话层 可以合为一层:应用层,加上剩下的四层,也就是变成了五层模型
为什么叫做
TCP/IP
五层模型?
这是因为其中的 TCP
、IP
协议非常经典、非常重要,具有代表意义,于是就命名成了 TCP/IP
五层模型
注意: TCP/IP
是一组协议的代名词,其中包含了许多协议,共同组成了 TCP/IP
协议簇
TCP/IP
五层模型 也可以称为 TCP/IP
四层模型,这是因为 物理层 不是我们开发人员关注的重点
TCP/IP
五层模型 的不同分层功能如下(自底向上)
物理层
负责光电信号的传递方式,以太网 中采用 同轴电缆、双绞线、光纤、电磁波 等传递信号,不同材质决定了信号最大传输速率、传输距离、抗干扰性等,如果信号传递过程中出现衰减,还可以使用 集线器 进行信号增强
数据链路层
负责设备之间的数据帧的传送和识别,比如网卡设备的驱动、帧同步、冲突检测、差错校验等工作, 数据链路层 中有很多不同的实现标准:以太网、令牌环、无线 LAN
等,具体是什么标准,取决于网卡,用于连接多台设备,实现网络数据传输与交换的 交换机 就工作在 数据链路层
网络层
负责地址管理和路由选择,比如在 IP
协议 中,通过 IP
地址来标识主机,可以通过查询路由表的方式规划出源主机与目标主机之间的传输路线,这正是 路由器 的工作职责
传输层
负责两台主机之间的数据传输,通过诸如 TCP
协议 等传输协议,实现高效、可靠的数据传输,数据传输不一定成功,可以通过 重传 相关机制重新传输数据
应用层
负责应用程序间沟通,比如 简单电子邮件传输(SMTP
)、文件传输协议(FTP
)、网络远程访问协议(Telnet
) 等,在进行网络编程时,主要针对的就是 应用层
一般而言,硬件除了工作在某一层外,还需要具备自己下层的功能
- 对于一台主机,它的操作系统内核实现了从「传输层」到「物理层」的内容
- 对于一台路由器,它实现了从「网络层」到「物理层」
- 对于一台交换机,它实现了从「数据链路层」到「物理层」
- 对于集线器,它只实现了「物理层」
但这并不是绝对的,某些硬件也可以工作在上层,比如 路由器 可以实现传输层的部分功能,交换机 也可以实现网络层的转发
2.4.系统与网络的联系
系统、网络 不分家,看似设计复杂的网络标准模型其实和系统设计有着千丝万缕的联系,比如 物理层、数据链路层、网络层、传输层 这四层属于 操作系统层,剩下的 应用层 属于 用户层,因为我们最终是需要通过操作系统来进行网络通信,所以网络标准模型必然会被融入操作系统中
应用层中的 应用、表示、会话 不属于系统体系结构,也不能属于系统体系结构,因为他们由用户定义并实现,由于实现方式不固定,也就统称为 应用层,网络编程就是在 应用层 中进行的
网络标准模型融入操作系统后,为了让用户能使用网络,操作系统就为网络相关操作提供了一批 系统调用接口,也就是后面学习的 socket
套接字编程
操作系统具有四大管理模块:内存管理、进程管理、文件管理、驱动管理,压根就没有 网络管理,那么操作系统是如何网络进行管理的?
Linux
中一切皆文件,网络需要借助网卡通信,而网卡在操作系统看来,不过是一个提供了读方法与写方法的硬件设备而已,所以操作系统只需要通过 「文件管理」 那一套来对网络进行管理就行了
其实
socket
本质上就是一个文件描述符,一个专门对于 网络资源(文件) 进行操作的句柄而已,这也就意味着系统提供的网络相关系统调用接口,必然与文件相关接口操作类似
网络本质上是挂接至文件系统中的一个重要子功能
网络与系统也有一些区别:系统可以有很多种,但网络中的核心协议栈必须一致,无论是哪种系统,如果核心协议栈不一致,就无法进行网络通信
所有主流操作系统都必须实现基于
TPC
、IP
实现的核心协议栈(工作在操作系统层中)
3.网络传输
3.1.前置概念
一、处在同一个局域网中的主机,是可以直接通信的
比如部分游戏的本地连接对战功能(CS 1.6
、魔兽世界、求生之路等),这些游戏在进行本地多人对战时,只需要构建一个局域网,主机相连后即可直接进行通信
再比如 快牙、QQ
互传、快传 等传输文件的方式,也是通过局域网连接实现的,本质上就是通过热点构建一个子网(局域网),其他手机(主机)连接后,可以直接通信,传输文件
这些日常生活中接触过的操作都在证明 处于同一个局域网中的主机是可以直接通信的
二、TCP/IP
模型中的不同层都有自己的协议,而协议最直观的表现部分叫做 「协议报头」
每一层都有自己的 协议 很好理解,毕竟每层需要解决的问题都不同,用来解决问题的 协议 自然就不同
至于什么是 协议报头?协议报头 有什么用?
协议报头 在数据传输过程中,用于承载一些控制信息;协议报头 提供了关于数据包或帧的元信息,以便在网络中正确地路由、传递和处理数据
比如下面这个就是经典的 TCP
协议报头
可以通过生活中的例子辅助理解
前面提到过,马云 创办的 淘宝 深刻改变了现代人的生活,说白了就是网购,这种网上购物方式必须依赖强大的 物流 体系,面对成千上万的商品,以及全国大大小小的收货信息,该如何设计快递方式,才能确保 物流 过程中不会出差错?
答案是通过 快递单 标识物流信息,这里的快递单就好比 协议报头,因为有很多家快递公司,每家公司的 快递单 都不一样,不同协议的 协议报头 也不一样,协议报头 是协议最直观的表现部分
所以假设张三双十一在某东上买了一把青轴机械键盘,商家发货时,会先选择一家 快递公司(协议) 进行发货,将 键盘(有效载荷) 打包,并给包裹贴上一张 快递单(协议报头),准备物流
如果不发生意外,张三在数天后会收到一条取件信息,张三拿到快递后,首先做的是读取 快递单(协议报头) 信息, 确认是自己的包裹后,才会 把包裹拆开(解包),最终张三成功拿到了自己网购的 键盘(有效载荷)
在上面这个故事中,张三的整个购物过程可以分为三步:商家打包 -> 物流 -> 张三解包,快递单作为快递公司的代表,包含了很多重要信息,是包裹物流过程中的通关文牒
如果张三想要退货,则会在原先包裹的基础之上,再加一张 快递单2,将之前的 快递单1+包裹 整体看作一个 包裹(有效载荷),利用新的 快递单2 进行封装
- 此时的有效载荷从 键盘 变成了 包裹,证明有效载荷是一个相对的概念
网络中传输的 数据 可以看作商品,称为 有效载荷,传输过程中选择的 协议 可以看作快递公司,协议报头 自然就是快递单了,实际在进行网络传输时,也是遵循 打包 + 传输 + 解包 这三步走的,只不过在传输过程中还需要再 打包,在众多 协议报头 的保驾护航之下,可以确保数据在网络世界中成功递达
快递单1 + 商品 —> 协议报头 + 有效载荷
快递单2 + (快递单1+商品) —> 协议报头 + 有效载荷
所以现在可以理解为什么不同层中的协议可以共同完成数据传输工作了,因为对于同层来说,协议是用来解决问题的,问题解决后,会用自己的 协议报头 将数据打包,传给下层;或者把自己本层的协议报头与有效载荷分离后,把有效载荷传给上层
- 传给下层时:解决完问题后,将上层传过来的有效载荷,与自己层的协议打包后,继续传给下一层,这个过程称为 封装
- 传给上层时:上层得到的是一个自己能看懂的数据包,把自己本层的协议分离后,把有效载荷继续往上传就好了,这个过程称为 分用
封装 与 分用 是不同网络层中必须面对的重要问题,只有把这两个问题解决了,整个传输过程才会通畅,关于更多实现细节可以接着往下看
3.2.同一个局域网内通信
有了 局域网内直接通信 和 协议报头 的前置知识后,接下来演示 同一个局域网内两台主机如何通信
通信过程:应用层将自己的 协议报头 与用户想发送的 信息 封装成一个 数据包,传给下一层,传输层将自己的 协议报头 与 数据包 封装成一个新的 数据包,传给下一层,不断重复,直到 数据包 来到对端主机网络中;链路层从数据包中分离出 有效载荷,向上交付,网络层同样需要分离出 有效载荷,向上交付,最终 有效载荷 为 主机A 发送的 信息,成功交给了 主机B
解铃还须系铃人,XXX
层 封装 的协议报头,只有同层才能进行 解包
得益于 协议分层,看似 主机A 与 主机B 在直接通信,实际上数据至少经历了九次传输
3.3.数据包的封装与分用
从上面主机通信的例子中,可以产出以下结论:
- 每一层都有自己的协议报头
- 向下传输时,每一层都要有将自己的「协议报头」与「有效载荷」封装,传给下一层的能力
- 向上传输时,每一层都要有将自己的「协议报头」与「有效载荷」分离,识别并交付给上一层的能力
- 在逻辑上,同一层中使用的都是同一个协议,都认为自己在于对端直接通信
向上交付时,如何从数据包中将自己的 「协议报头」 与 「有效载荷」 分离呢?
a
.「协议报头」中一般都包含了当前报头的大小,用数据包总大小 - 协议报头大小,得到的就是「有效载荷」;除此之外有的「协议报头」与「有效载荷」之间存在特殊分隔符,可以轻松识别并分离
可是协议有很多,在向上交付时,如何知道 「有效载荷」 该传递给哪个 协议 呢?
b
.如果要交给上一层,「有效载荷」中必然包含上一层协议报头,而协议报头中包含了协议信息,自然能知道将「有效载荷」交付给谁了
几乎每层 协议 都要具备 a
、b
两个基本功能,否则就无法向上交付数据
补充概念
- 不同的协议层对数据包有不同的称谓,在传输层叫做段,在网络层叫做数据报,在链路层叫做帧
- 应用层数据通过协议栈发到网络上时,每层协议都要加上一个数据首部,称为封装
- 首部信息中包含了一些类似于首部有多长、载荷有多长、上层协议是什么等信息
- 数据封装成帧后发到传输介质上,到达目的主机后每层协议再剥掉相应的首部,,根据首部中的上层「协议报头」将数据交给对应的上层协议处理
3.4.局域网通信原理
局域网通信的一般原理:在局域网中进行通信时,无论任何时刻,只允许一台主机向局域网中发送信息
局域网中通信的具体实现方式这里不详谈,通过一个例子来辅助理解
某天,张三正在上课,王老师定了一个规矩:在我上课期间,其他人不允许讨论,如果想发言,需要举手示意
张三听着听着就走神了,突然王老师看着张三想起了一件事,并直接问到:“[张三] [你的作业为什么没交?]”,因为此时全班只有王老师的声音,其他同学听到后发现王老师叫的是 [张三],而不是自己,选择无视了王老师的发言,当张三听到王老师在叫自己名字后,打起精神并站了起来,开始分析王老师传达的信息:[为什么没交作业?],张三想了半天,想出一个理由:[王老师] [作业我写了,但在家里忘带了,下次带给你],其他同学听到张三的发言依旧选择无视,王老师收到张三的信息后表示:“[张三] [你能忘记作业,为什么不能忘记吃饭呢?]”,全班发出笑声,张三收到信息后尴尬坐下
故事结束,在上面的故事中,张三所处的环境正是一个 局域网,同学和老师们可以直接通信,但任何时刻,都只允许一人通信,其中每个人的名字可以看作自己的 标识符,王老师发出的信息中只包含了 [张三] 这个 标识符,因为在一个教室里,所以除张三外的其他同学也能收到王老师发出的信息,但他们选择无视,因为 [张三] 这个 标识符 与自己对不上,当张三与王老师在进行对话时,虽然全班人都能听到,但本质上只有张三与王老师在进行通信,而这就是 局域网 中 以太网 的通信原理
如何理解 “抓包” 行为?
当你收到不是发给你的数据包时,没有选择无视,而是将其收集了起来,这就是抓包;带入故事中,就是那种喜欢凑热闹的吃瓜群众
网卡默认会过滤掉不属于自己的数据包,可以手动设置成混杂模式,以关闭过滤
以太 是什么东西?为什么能跟网络扯上关系?
- 以太 这个名词源于物理学中的 以太假说:认为光在太空中通过 以太 传播,但物理实验证明其根本不存在,最终沦为物理学界的笑柄。而我们网络中正是通过 光电信号 传输数据的(光电信号中有光),因此就把该标准称为 以太网,用来 “致敬” 物理学
既然局域网中的数据包可以被所有人收到,也就意味着通信过程可能被干扰,就比如同时向湖面丢石头,产生的波纹之间会相互影响,导致自己的波纹 丢失/混乱
如果我们不断往局域网中发送大量无用的数据包,会导致 网络碰撞,影响局域网中的正常通信,发生 网络碰撞 后,未递达的数据会重新发送,此时再发送就会变得特别慢,因为此时局域网中都是垃圾数据包,大部分时间都用在甄别垃圾数据包上了
这就也解释了大部分学校的校园网在晚上打游戏的时候会很卡,因为大家处于同一个局域网中,大家都在打游戏,都在发送数据包,容易发生 数据碰撞,从而导致数据 延迟递达,也就是 网卡
在网络世界中需要使用 唯一标识符 来标识自己的主机,否则就无法做到信息传递与接收,网卡厂商在生成网卡时,会给每一个网卡都写入属于自己的 SN
号,也就是 MAC
地址,这是一个硬件地址,目前 全球唯一
对于
Windows
电脑用户,可以调起cmd
窗口,输入指令ipconfig /all
查询自己当前电脑网卡的MAC
信息
当我们在局域网中进行通信时,可以直接通过 MAC
地址比对,判断数据包是不是发给自己的
3.5.跨路由器的远端通信
在学习远端通信之前,需要先认识一下 路由器
路由器 主要工作在 网络层,但它也具备 数据链路层、物理层 的工作能力,并且 路由器 也可以可以看作一台 主机(节点),作为远端通信的桥梁,路由器 至少需要级联两个子网,至少要提供两个网络接口
主机A 与 主机B 不处在同一个局域网中,如果想要进行通信,需要让 路由器 与 主机A 处于同一个子网,同时让 路由器 与 主机B 也处在同一个子网,主机A 把数据交给 路由器,路由器 把数据转发给 主机B,主机A 与 主机B 完成了通信
假设 主机A 与 路由器 所在子网标准为 以太网,主机B 与 路由器 所在子网标准为 令牌环,同样可以演示两台主机如何进行跨路由器的远端通信
令牌环 是局域网中实现通信的另一种方法,存在一个 令牌,该局域网中的主机轮流持有,只有持有 令牌 的主机才能发出信息,令牌环 目的也是确保任何时刻都只有一台主机发送信息
主机A 正常将信息封装后,向下传递,当数据包来到 网络层 时,发现此时有很多主机,自己该如何将数据包正确传递给路由器呢?
在局域网中,主机可以通过甄别 唯一标识符 MAC
的方式无视不属于自己的信息,此时目标主机并不存在于当前局域网中,按照之前的逻辑,主机A 发送的信息会被所有人丢弃(包括路由器),所以光靠 唯一标识符 MAC
是无法完成跨路由器通信的,还需要一个重要概念:IP
地址
IP
地址 的功能是 标识公网环境下的所有主机,当前所谈及的 IP
地址 均为 IPv4
标准,该标准使用了一个 4
字节的无符号整数类型(unsigned int
)来表示一个 IP
地址
// IP地址的结构(通过位段实现)
struct ip
{int part1 : 8;int part2 : 8;int part3 : 8;int part4 : 8;
}
操作系统内核由
C
语言 编写,而网络中的 传输层 和 网络层 属于操作系统内核,自然也是通过C
语言 实现的
从代码结构中可以看出 IP
地址 由四部分组成,每一部分占 8
字节,表示范围为 [0, 255]
直接使用二进制表示比较抽象,IP
地址 一般表示为:xxx.xxx.xxx.xxx
这种表示方式称为 字符串风格的点分十进制方案,是方便给人看的,如何将二进制转换为 点分十进制?
// IP地址
unsigned int ipVal = 3332933889;// 分别获取IP地址中的四个部分
struct ip* pIP = (struct ip*)(&ipVal);pIP->part1;
pIP->part2;
pIP->part3;
pIP->part4;
将获取的四个部分转为十进制,然后拼接成字符串即可,关于转换工作不需要我们手动完成,使用系统提供的接口就行了
如何借助 IP
地址 把数据包正确交给路由器?
在路由器中存在一张 路由表,其中包含了当前子网中已有路径信息,以及之前通信过的路径信息,主机A 在进行数据包发送前,会先到 路由表 中查询目标路径是否存在,如果存在,就按照路径传递,如果不存在,就会把数据包交给路由器,由路由器完成数据包的转发
可以把 IP地址 看作学号,规定不同班级的学号前缀不一样,假设张三捡到了一张学生证(数据包),仔细查阅花名册(路由表)后发现不是自己的同班同学,于是将学生证交给了辅导员(路由器),由辅导员来完成学生证的归还工作
将数据包丢给路由器的行为称为 默认路由
现在 主机A 知道自己要把数据包交给路由器,同时也知道 主机B 的 IP
地址,接下来路由器就会收到一个数据包
路由器拿到数据包后会进行解包,将 以太网报头 拆掉,然后分析 IP
报头,规划该数据包的路径,得知需要将此数据包交给 主机B,加上 令牌环报头 后把数据包丢入令牌环网络中,等待 主机B 截取
不仅是主机需要解包,路由器等中间设备也需要具备解包能力,因为路径规划依赖于
IP
,而查看IP
协议报头,需要先将以太网等链路层协议报头去除
得益于 路由器 + IP
地址,在 网络层 及以上层次中,都认为数据包的内容始终没有改变,而在 网络层 之下,允许各种不同的实现标准进行通信(比如这里的以太网与令牌环),这种优秀的设计使网络在普及时可以畅通无阻
IP 是全球网络的基础
4.网络地址
4.1.IP地址
IP地址用来标识网络中不同主机的地址
目前的 IP
地址 有两种:IPv4
、IPv6
,凡是没有特殊说明的,IP
地址 都是指 IPv4
IPv4
由一个 4
字节的无符号整数 构成,占 32
比特位,可表示的最大地址数为 42
亿+
为了让 IP
地址 更便于阅读,可以将整数中的四部分转为十进制后通过符号连接,以 点分十进制 的形式展现,比如 192.168.0.1
IPv4
标准于 1981
年推出,在那个联网设备都还极度匮乏的年代,使用一个无符号整型(最大表示 42
亿+)就足够了,IPv4
在当时看来确实可以标识网络中的主机所有主机,然而谁也没有意料到网络发展如此之快,快到 42
亿个地址根本不够用,IPv4
标准中的所有地址于 2019
年全部分配完毕,这就导致 IPv4
标准现在并不能标识所有主机,只能标识公网环境下的所有主机
为了应对
IPv4
地址不够用的窘境,推出了IPv6
、NAT
等技术,IPv6
足足使用了16
字节,长度为128
位,是IPv4
的四倍,可以标识340
亿亿亿台设备,是一个天文数字,称可以为全世界的每一粒沙子编上一个地址,目前IPv6
标准尚未全面普及;而NAT
技术则是引入了 地址转换 的概念,简言之就是在公网与内网间建立映射关系,使得内网中允许地址重复,NAT
技术提供了一定的安全保护
我们普通人使用的网络一般都是内网,地址普遍都是192.168.xxx.xxx
,这种情况下即使你的IP
暴露,也无法直接定位至你的主机设备
4.2.MAC地址
MAC地址用来识别数据链路层中相连的节点
MAC
地址 用一个 6
字节的整数表示,占 48
比特位,可表示的最大地址数为 百万
亿+
MAC
地址 一般用十六进制数字加上冒号的形式来表示,例如: 08:00:27:03:fb:19
MAC
地址 在网卡出厂时就确定了,不能修改. MAC
地址 通常是唯一的(虚拟机中的 MAC
地址 不是真实的 MAC
地址,可能会冲突,也有些网卡支持用户配置 MAC
地址)
IP
地址很紧张,MAC
地址就不一样,作为数据包转发的节点,同一个局域网内,MAC
地址重复的可能性几乎为0,48
比特位显得有点浪费,这就好比你每个月要1000生活费,但你爸每个月都给你1000w,足够用,但过于夸张了
4.3.IP与MAC的关系
IP
地址 与 MAC
地址 最大的区别在于:传输过程中,IP
地址不会改变,MAC
地址会改变,随着传输距离的增加,MAC
地址改变的次数也会增加
如何理解 IP
地址 与 MAC
地址 的关系?
IP
地址 分为 源IP地址、目标IP地址,MAC
地址 也分为 源MAC地址、目标MAC地址
假设有一天,张三考上了大学,临近上学日,一向谨慎的张三选择规划好自己的报名路线
因为张三家住贵州,而他的学校在湖北,途径多个省份,张三需要坐高铁从贵州到重庆,再从重庆到湖北,分为两程:贵州->重庆,重庆->湖北,虽然中途涉及换乘,并且每一程的始发地和目的地也不一样,但张三的最终目的地始终没有改变
- 源IP地址:张三家
- 目标IP地址:张三考上的学校
- 源MAC地址:[贵州,重庆]
- 目标MAC地址:[重庆,湖北]
张三只需要带够钱,并且明确自己的目的地,就一定能抵达
张三的报名之路类似于数据包在网络中的传输之路,IP
地址始终没有改变,但 MAC
地址可能发生改变,当 主机A 将数据包交给路由器时,路由器分析 IP
地址得知需要将数据包转交给 主机B,于是数据包中的 目的 MAC
地址 会变成 MAC-主机B
,主机B 收到数据包后,经过不断解包分用,主机B 将会收到 主机A 发送的信息 lo
所以 IP
地址 用来表示始发地与目的地,MAC
地址 用来表示途中需要经过的中转区间,通常把 MAC
地址 的改变称为 下一跳,就是从一个 子网 跳转到另一个 子网 中
IP
地址 和 MAC
地址 共同协作,确保数据能够从源设备传输到目的设备。IP
地址 提供了端到端的逻辑标识,而 MAC
地址 则在局域网中提供了物理设备之间的唯一标识。这种分层的设计有助于网络的灵活性和可扩展性
如何在 Linux
中查看 IP
地址 与 MAC
地址?
ifconfig
ether
表示 以太,当前局域网中采用了以太网 的通信方式
🌨️总结
以上就是本次关于网络基础『发展 ‖ 协议 ‖ 传输 ‖ 地址』的全部内容了,通过追溯网络发展历史,深入介绍协议相关概念,引出 OSI
七层参考模型和 TCP/IP
五层模型,并配合实例生动解释不同层次的功能。通过深入剖析分层模型,特别是通过局域网内通信和跨路由器远程通信两个案例,用于理解网络传输的宏观流程,加深对数据包封装与分用过程的领悟,同时简要涉及了协议报头相关概念。最后,系统性地介绍了网络地址,使我们对 IP
地址与 MAC
地址的概念及差异有了清晰认识