nginx源码阅读(一).综述

前言

nginx作为一款开源的轻量级高性能web服务器,是非常值得立志从事服务端开发方向的人学习的。现今nginx的最新版本是nginx-1.13.6,代码量也日渐庞大,但是由于其核心思想并没改变,为了降低阅读难度,我选择的是nginx-1.0.15版本,并且由于时间和水平有限,重点关注的是nginx的启动以及进程模型、事件模块中的epoll模块、负载均衡以及整体的框架等方面。
这里先推荐两本有关nginx的书籍:《深入理解Nginx》、《深入剖析Nginx》,后者已经绝版了,可以去网上找pdf阅读。

不过建议主要还是以代码为主,书籍为辅。

下面简单的介绍一下后面会进行分析的各块。

nginx的启动

nginx整个启动流程围绕着ngx_cycle_t结构体进行操作。要知道nginx是高度模块化以及非常依赖配置文件,大部分功能都需要配置文件的配置才能进行。在启动工作中,需要做的主要工作就是读取配置文件,然后将各模块感兴趣的配置项保存到各结构体中,根据配置文件对所有的模块进行初始化,接着启动各进程,准备进行工作。

nginx的多进程模型

另一款比较常用的web服务器就是apache,它最大的特点就是稳定,所以相比于nginx复杂很多也臃肿很多。nginx最大的特点就是强调性能,在后面展示其源码时也可以看到它为了追求性能所做的一些工作。
nginx之所以高效的主要原因是它采用的异步非阻塞多进程模型,并且一般进程的个数与cpu核心数相同,一个master进程,多个worker进程,可能还会有cache loader以及cache manager进程,多个连接对应一个worker进程,master进程主要负责管理worker进程以及启动/停止服务、重新读取配置文件、平滑升级等功能,而cache进程则当开启了缓存功能才会出现。

apache则通常采用同步多进程模型,每个连接对应一个进程,apache采用的这种模型,当请求较多时,进程也随之变多,cpu资源耗费在进程间切换非常昂贵(毕竟要切换进程的上下文以及重载缓存等),而nginx因为进程数固定且很少,并且由于cpu是多核心的,可以同时运行多个不同的进程/线程,每个进程的资源都互相独立,因此切换时无需进行上下文的切换。那么为什么不采用多线程结构呢,不是说线程间的切换比进程间的切换更迅速吗,若cpu是单核的的确如此,但是当每个cpu核心运行一个线程的时候,由于线程间需要共享资源,所以这些资源必须从一个核心拷贝到另外一个核心,反观多进程就不需要。因此在cpu为多核的情况下,多线程在性能上反而可能不如多进程。

关于同步和异步的区别,可以简单的理解为,采用同步模型,cpu会阻塞等待请求的完成,而异步非阻塞时,cpu不会阻塞等待,内核处理完之后再进行通知。

nginx的事件模块

nginx采用的是事件驱动机制来处理事件,不同的模块有各自己负责处理的事件,当一个事件发生时,相应的模块就会对该事件进行处理。对于一个web服务器来说,用户的请求其实就对应了一个tcp连接,也对应了读/写事件,nginx内部使用了连接池、内存池等机制提高效率,而nginx的事件模块中针对不同的I/O多路机制select、epoll、kqueue、eventport也编写了不同的模块,这是为了能让nginx在更多的操作系统上运行。在linux下,我们重点关注的就是epoll对应的模块,nginx对epoll提供的接口进行了封装,并且将定时事件也集成到了其中。

负载均衡

nginx有两处地方进行了负载均衡。一处是当大量的请求到来时,各个worker进程该如何分配这些请求,而不会造成其中某个worker进程超载,而另外的worker进程则空闲,nginx采用的是负载均衡锁,当一个worker进程处理的连接数大于某个值时,就不再接受新的连接。

还有一处是当nginx作为反向代理服务器运行时,会将客户端的请求转发给上游服务器,若上游服务器有多个,则需要选择将请求转发给哪个上游服务器,一直转给一个造成其中某个服务器过载,但是其余空闲肯定是不对。nginx官方提供了加权轮询、IP哈希这两种负载均衡的方法。加权轮询简单的来说就是计算各个上游服务器的权值,然后选择权值最高的服务器处理请求;IP哈希负载均衡策略则会使用客户端的ip地址作为哈希的key来决定选择服务器群中某台服务器来处理客户端的请求,这种方式可以确保来自同一台客户端的请求会分发到同一台服务器上,除非这台服务器处于不可用状态。

除了这两种方法之外,还有一致哈希、fair等方法,不过都是第三方模块。

整体架构

nginx即可以处理静态请求也可以处理动态请求,并且还可以作为反向代理服务器。但是它处理动态请求的效果并不如apache好,因此一般作为静态web服务器和反向代理服务器。整体的架构引用《深入剖析Nginx》书中的图:
这里写图片描述

小结

本小节简单的介绍了一下后面要展开分析的各块,接下来正式开始分析nginx的启动流程。

--------------------- 作者:Move_now 来源:CSDN 原文:https://blog.csdn.net/Move_now/article/details/78373017?utm_source=copy 版权声明:本文为博主原创文章,转载请附上博文链接!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/384961.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

系统级性能分析工具perf的介绍与使用

系统级性能优化通常包括两个阶段:性能剖析(performance profiling)和代码优化。 性能剖析的目标是寻找性能瓶颈,查找引发性能问题的原因及热点代码。 代码优化的目标是针对具体性能问题而优化代码或编译选项,以改善软…

C/C++内存问题检查利器——Purify

C/C内存问题检查利器——Purify 一、 引言 我们都知道软件的测试(在以产品为主的软件公司中叫做QA—Quality Assessment)占了整个软件工程的30% -50%,但有这么一种说法,即使是最优秀测试专家设计出来的测试…

浅析三种特殊进程:孤儿进程,僵尸进程和守护进程

其实有时想想linux内核的设计也蕴含着很多人生哲学,在linux中有这么几个特殊进程中,我们一开始见到它们的名字可能还会觉得很诧异,但在了解完了原理后,我们仔细想想,这样的命名也不无道理!下面我就给大家分别介绍一下这三种特殊的进程! 1.孤儿进程 如果父进程先退出,子进程还没…

差生文具多之(二): perf

栈回溯和符号解析是使用 perf 的两大阻力,本文以应用程序 fio 的观测为例子,提供一些处理它们的经验法则,希望帮助大家无痛使用 perf。 前言 系统级性能优化通常包括两个阶段:性能剖析和代码优化: 性能剖析的目标是寻…

Linux下的I/O复用与epoll详解(ET与LT)

前言 I/O多路复用有很多种实现。在linux上,2.4内核前主要是select和poll,自Linux 2.6内核正式引入epoll以来,epoll已经成为了目前实现高性能网络服务器的必备技术。尽管他们的使用方法不尽相同,但是本质上却没有什么区别。本文将重…

彻底学会使用epoll(一)——ET模式实现分析

注:之前写过两篇关于epoll实现的文章,但是感觉懂得了实现原理并不一定会使用,所以又决定写这一系列文章,希望能够对epoll有比较清楚的认识。是请大家转载务必注明出处,算是对我劳动成果的一点点尊重吧。另外&#xff0…

sys/queue.h分析(图片复制不过来,查看原文)

这两天有兴趣学习使用了下系统头文件sys/queue.h中的链表/队列的实现,感觉实现的很是优美,关键是以后再也不需要自己实现这些基本的数据结构了,哈哈! 我的系统环境是 正好需要使用队列,那么本篇就以其中的尾队列&…

线程池原理及C语言实现线程池

备注:该线程池源码参考自传直播客培训视频配套资料; 源码:https://pan.baidu.com/s/1zWuoE3q0KT5TUjmPKTb1lw 密码:pp42 引言:线程池是一种多线程处理形式,大多用于高并发服务器上,它能合理有效…

iptables 的mangle表

mangle表的主要功能是根据规则修改数据包的一些标志位,以便其他规则或程序可以利用这种标志对数据包进行过滤或策略路由。 内网的客户机通过Linux主机连入Internet,而Linux主机与Internet连接时有两条线路,它们的网关如图所示。现要求对内网进…

Linux之静态库

命名规则: lib 库的名字 .a 制作步骤 生成对应.o文件 .c .o 将生成的.o文件打包 ar rcs 静态库的名字(libMytest.a) 生成的所有的.o 发布和使用静态库: 1) 发布静态 2) 头文件 文件如下图所示&…

Linux之动态库

命令规则 lib 名字 .so 制作步骤 1)生成与位置无关的代码(生成与位置无关的代码) 2)将.o打包成共享库(动态库) 发布和使用共享库 动态库运行原理: 生成动态库: gcc -fPIC -c *.c -…

linux下源码安装vsftpd-3.0.2

1)在http://vsftpd.beasts.org/网站中查找并下载 vsftpd-3.0.2.tar.gz源码包 2)如果自己的机器上安装有yum可以用yum grouplist | less指令查看以下开发环境,当然这一步不做也行 3)拆解源码包 4)查看源码包 5)编辑…

Gdb 调试core文件详解

一,什么是coredump 我们经常听到大家说到程序core掉了,需要定位解决,这里说的大部分是指对应程序由于各种异常或者bug导致在运行过程中异常退出或者中止,并且在满足一定条件下(这里为什么说需要满足一定的条件呢&#…

Windows下编译openssl库

1、概述 OpenSSL是一个开放源代码的软件库包,它实现了 SSL(Secure SocketLayer)和 TLS(Transport Layer Security)协议,所以应用程序可以使用这个包来进行安全通信,避免窃听,同时确…

windows环境下C语言socket编程

最近由于实验需要,要求写一个c程序与java程序通信的软件,为了测试首先写了一个windows环境下c语言的socket(tcp)通信程序。 首先socket通信的步骤: 图一 socket通信步骤(转载) 图二 三次握手协议&…

Makefile(三)

在平时使用中&#xff0c;可以使用以下的makefile来编译单独的代码 src $(wildcard *.c) obj $(patsubst %.c, %.o, $(src))CC gcc CFLAGS -Wall -gall:$(target)$(target):%:%.c$(CC) $< -o $ $(CFLAGS).PHONY: clean all clean:-rm -rf $(target) 使用方法就是make 后…

数据类型(C++)

不同系统会有不同差异&#xff1a; 类型 位(byte) 范围 char 1 -128—127 or 0 – 255 unsigned char 1 0 – 255 signed int 1 -128—127 int 4 -2^31 – 2^32-1 unsigned int 4 0 – 2^32 signed int 4 -2^31 – 2^32-1 short int 2 2^15 – 2^15-1 …

dup2函数

将当前系统中的进程信息打印到文件中 命令行&#xff1a;ps aux > out 将ps得到的信息重定向到out文件中 使用dup2文件在程序中完成。 int dup2(int oldfd,int newfd); /*** dup2.c ***/ #include<stdio.h> #include<fcntl.h> #include<unistd.h> #includ…

内核实现信号捕捉原理

信号捕捉特性 进程正常运行时&#xff0c;默认PCB中有一个信号屏蔽字&#xff0c;假定为☆&#xff0c;它决定了进程自动屏蔽哪些信号。当注册了某个信号捕捉函数&#xff0c;捕捉到该信号以后&#xff0c;要调用该函数。而该函数有可能执行很长时间&#xff0c;在这期间所屏蔽…

C++预处理器

预处理器是一些指令&#xff0c;指示表一起在实际编译之前所需要完成的预处理。 所有的预处理器指令都是以井号(#)开头&#xff0c;只有空格字符可以出现在预指令处理之前。预处理指令不是C语句&#xff0c;所以他们不会以分号(;)结尾。 #define预处理 #define预处理指令用于创…