nginx源码阅读(一).综述

前言

nginx作为一款开源的轻量级高性能web服务器,是非常值得立志从事服务端开发方向的人学习的。现今nginx的最新版本是nginx-1.13.6,代码量也日渐庞大,但是由于其核心思想并没改变,为了降低阅读难度,我选择的是nginx-1.0.15版本,并且由于时间和水平有限,重点关注的是nginx的启动以及进程模型、事件模块中的epoll模块、负载均衡以及整体的框架等方面。
这里先推荐两本有关nginx的书籍:《深入理解Nginx》、《深入剖析Nginx》,后者已经绝版了,可以去网上找pdf阅读。

不过建议主要还是以代码为主,书籍为辅。

下面简单的介绍一下后面会进行分析的各块。

nginx的启动

nginx整个启动流程围绕着ngx_cycle_t结构体进行操作。要知道nginx是高度模块化以及非常依赖配置文件,大部分功能都需要配置文件的配置才能进行。在启动工作中,需要做的主要工作就是读取配置文件,然后将各模块感兴趣的配置项保存到各结构体中,根据配置文件对所有的模块进行初始化,接着启动各进程,准备进行工作。

nginx的多进程模型

另一款比较常用的web服务器就是apache,它最大的特点就是稳定,所以相比于nginx复杂很多也臃肿很多。nginx最大的特点就是强调性能,在后面展示其源码时也可以看到它为了追求性能所做的一些工作。
nginx之所以高效的主要原因是它采用的异步非阻塞多进程模型,并且一般进程的个数与cpu核心数相同,一个master进程,多个worker进程,可能还会有cache loader以及cache manager进程,多个连接对应一个worker进程,master进程主要负责管理worker进程以及启动/停止服务、重新读取配置文件、平滑升级等功能,而cache进程则当开启了缓存功能才会出现。

apache则通常采用同步多进程模型,每个连接对应一个进程,apache采用的这种模型,当请求较多时,进程也随之变多,cpu资源耗费在进程间切换非常昂贵(毕竟要切换进程的上下文以及重载缓存等),而nginx因为进程数固定且很少,并且由于cpu是多核心的,可以同时运行多个不同的进程/线程,每个进程的资源都互相独立,因此切换时无需进行上下文的切换。那么为什么不采用多线程结构呢,不是说线程间的切换比进程间的切换更迅速吗,若cpu是单核的的确如此,但是当每个cpu核心运行一个线程的时候,由于线程间需要共享资源,所以这些资源必须从一个核心拷贝到另外一个核心,反观多进程就不需要。因此在cpu为多核的情况下,多线程在性能上反而可能不如多进程。

关于同步和异步的区别,可以简单的理解为,采用同步模型,cpu会阻塞等待请求的完成,而异步非阻塞时,cpu不会阻塞等待,内核处理完之后再进行通知。

nginx的事件模块

nginx采用的是事件驱动机制来处理事件,不同的模块有各自己负责处理的事件,当一个事件发生时,相应的模块就会对该事件进行处理。对于一个web服务器来说,用户的请求其实就对应了一个tcp连接,也对应了读/写事件,nginx内部使用了连接池、内存池等机制提高效率,而nginx的事件模块中针对不同的I/O多路机制select、epoll、kqueue、eventport也编写了不同的模块,这是为了能让nginx在更多的操作系统上运行。在linux下,我们重点关注的就是epoll对应的模块,nginx对epoll提供的接口进行了封装,并且将定时事件也集成到了其中。

负载均衡

nginx有两处地方进行了负载均衡。一处是当大量的请求到来时,各个worker进程该如何分配这些请求,而不会造成其中某个worker进程超载,而另外的worker进程则空闲,nginx采用的是负载均衡锁,当一个worker进程处理的连接数大于某个值时,就不再接受新的连接。

还有一处是当nginx作为反向代理服务器运行时,会将客户端的请求转发给上游服务器,若上游服务器有多个,则需要选择将请求转发给哪个上游服务器,一直转给一个造成其中某个服务器过载,但是其余空闲肯定是不对。nginx官方提供了加权轮询、IP哈希这两种负载均衡的方法。加权轮询简单的来说就是计算各个上游服务器的权值,然后选择权值最高的服务器处理请求;IP哈希负载均衡策略则会使用客户端的ip地址作为哈希的key来决定选择服务器群中某台服务器来处理客户端的请求,这种方式可以确保来自同一台客户端的请求会分发到同一台服务器上,除非这台服务器处于不可用状态。

除了这两种方法之外,还有一致哈希、fair等方法,不过都是第三方模块。

整体架构

nginx即可以处理静态请求也可以处理动态请求,并且还可以作为反向代理服务器。但是它处理动态请求的效果并不如apache好,因此一般作为静态web服务器和反向代理服务器。整体的架构引用《深入剖析Nginx》书中的图:
这里写图片描述

小结

本小节简单的介绍了一下后面要展开分析的各块,接下来正式开始分析nginx的启动流程。

--------------------- 作者:Move_now 来源:CSDN 原文:https://blog.csdn.net/Move_now/article/details/78373017?utm_source=copy 版权声明:本文为博主原创文章,转载请附上博文链接!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/384961.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

文件操作(stat函数)

stat函数可以获取文件信息 /*** stat.c ***/ #include<stdio.h> #include<string.h> #include<sys/stat.h> #include<stdlib.h>int main() {struct stat st {0}; //定义一个结构体&#xff0c;名字叫ststat("./a.txt",&st); …

文件操作(结构体)

将结构体内容写入到文件中 #include<stdio.h> #include<string.h>struct student {char name[100];int age; };int main() {struct student st {"wangqinghe",30};FILE * p fopen("./c.txt","wb");fwrite(&st,sizeof(st),1,p…

nginx源码阅读(二).初始化:main函数及ngx_init_cycle函数

前言 在分析源码时,我们可以先把握主干,然后其他部分再挨个分析就行了。接下来我们先看看nginx的main函数干了些什么。 main函数 这里先介绍一些下面会遇到的变量类型: ngx_int_t: typedef intptr_t ngx_int_t; 64位机器上,intptr_t为long int, 即typedef long int intptr_…

EAGAIN、EWOULDBLOCK、EINTR与非阻塞

EWOULDBLOCK&#xff1a;用于非阻塞模式&#xff0c;不需要重新读或者写 EINTR&#xff1a;指操作被中断唤醒&#xff0c;需要重新读/写   在Linux环境下开发经常会碰到很多错误(设置errno)&#xff0c;其中EAGAIN是其中比较常见的一个错误(比如用在非阻塞操作中)。 从字面上…

文件操作(排序)

文本文件&#xff0c;每行代表一个整数&#xff0c;范围在0~512之间&#xff1b; 要求&#xff1a;对文件排序&#xff0c;不使用堆空间&#xff0c;只使用栈空间。 用srand()和rand()函数生成一定量的随机数 /*** file.c ***/ #include<stdio.h> #include<string.h&g…

Linux下send错误代码32

问题描述&#xff1a;今天写程序&#xff0c;socket后send出现这个问题&#xff0c;send的返回值为-1&#xff0c;而errno为32&#xff0c;这个错误代码为broken pipe&#xff0c;即管道破裂。 问题形成原因&#xff1a;后来通过排查研究&#xff0c;发现出现该种问题出现的可能…

系统级性能分析工具perf的介绍与使用

系统级性能优化通常包括两个阶段&#xff1a;性能剖析&#xff08;performance profiling&#xff09;和代码优化。 性能剖析的目标是寻找性能瓶颈&#xff0c;查找引发性能问题的原因及热点代码。 代码优化的目标是针对具体性能问题而优化代码或编译选项&#xff0c;以改善软…

linux C线程

一个应用程序可以启动若干个线程&#xff1b;线程&#xff0c;是程序执行的最小单位&#xff1b;一般一个最简单的程序最少有一个线程&#xff0c;就是程序本身&#xff0c;也是主函数&#xff1b;一个线程阻塞不会影响另一个线程&#xff1b;多线程的进程可以尽可能多的利用系…

fseek函数

fseek函数&#xff1a; int fseek(FILE *_FILE, long _Offset, int _Origin); 函数设置文件指针stream的位置&#xff0c;如果执行成功&#xff0c;stream将指向以fromwhere为基准&#xff0c;偏移量offset&#xff08;指针偏移量&#xff09;个字节的位置&#xff0c;函数返回…

linux ethtool 查看网卡状态

ethtool 工具关于网络协商功能介绍&#xff1b; ethtool - Display or change ethernet card settings&#xff08;ethtool 是用来显示和更改网卡设置的工具&#xff09;&#xff1b;这个工具比较复杂&#xff0c;功能也特别多。由于洋文比较难懂。所以我们还是把网络设备协商…

ftell函数

ftell函数用于得到文件位置指针当前位置相对于文件首的偏移字节数&#xff0c;在随机方式存储文件时&#xff0c;由于文件位置频繁的前后移动&#xff0c;程序不容易确定文件的当前位置。 /*** a.txt ***/ asd gsdert dfhjtew /*** ftell.c ***/ #include<stdio.h>int ma…

muduo网络库源码阅读Step by Step

Posted on: Nov 26 2015 Categories: muduo C Tags: muduo 一般写服务端程序都需要有一个称手的网络库来帮我们处理琐碎的网络通信细节&#xff0c;比如连接的建立、关闭&#xff0c;读取数据&#xff0c;发送数据&#xff0c;接收、发送缓冲区的管理等&#xff0c;常用的C/C网…

C/C++内存问题检查利器——Purify

C&#xff0f;C内存问题检查利器——Purify 一、 引言 我们都知道软件的测试&#xff08;在以产品为主的软件公司中叫做QA—Quality Assessment&#xff09;占了整个软件工程的30% -50%&#xff0c;但有这么一种说法&#xff0c;即使是最优秀测试专家设计出来的测试…

rename、remove

/*** remove.c ***/ #include<stdio.h>int main() {remove("./b.txt"); } 运行结果&#xff1a; ubuntu1604ubuntu:~/wangqinghe/C/20190728$ gedit remove.c b.txt ^C ubuntu1604ubuntu:~/wangqinghe/C/20190728$ gcc remove.c -o remove ubuntu1604ubuntu:~/…

浅析三种特殊进程:孤儿进程,僵尸进程和守护进程

其实有时想想linux内核的设计也蕴含着很多人生哲学,在linux中有这么几个特殊进程中,我们一开始见到它们的名字可能还会觉得很诧异,但在了解完了原理后,我们仔细想想,这样的命名也不无道理!下面我就给大家分别介绍一下这三种特殊的进程! 1.孤儿进程 如果父进程先退出,子进程还没…

linux下查看系统socket读写缓冲区

一&#xff1a;linux下查看系统socket读写缓冲区大小配置&#xff1a; http://blog.csdn.net/herecles/article/details/8146017 1. tcp 收发缓冲区默认值 [root www.linuxidc.com]# cat /proc/sys/net/ipv4/tcp_rmem 4096 87380 4161536 87380 &#xff1a;tcp接收缓…

差生文具多之(二): perf

栈回溯和符号解析是使用 perf 的两大阻力&#xff0c;本文以应用程序 fio 的观测为例子&#xff0c;提供一些处理它们的经验法则&#xff0c;希望帮助大家无痛使用 perf。 前言 系统级性能优化通常包括两个阶段&#xff1a;性能剖析和代码优化&#xff1a; 性能剖析的目标是寻…

线程挂起

有时候在一个线程中创建了另外一个线程&#xff0c;主线程要等到创建的线程返回了&#xff0c;获取该线程的返回值后才退出&#xff0c;这个时候就需要把线程挂起。 int pthread_join(pthread_t th,void ** thr_return); pthread_join函数用去挂起当前线程&#xff0c;直至th指…

TCP send 阻塞与非阻塞

http://blog.chinaunix.net/uid-8489474-id-2031025.html tcp协议本身是可靠的,并不等于应用程序用tcp发送数据就一定是可靠的.不管是否阻塞,send发送的大小,并不代表对端recv到多少的数据. 在阻塞模式下, send函数的过程是将应用程序请求发送的数据拷贝到发送缓存中发送就返回…

线程终止

进程终止时exit()函数&#xff0c;那么线程终止的是什么呢&#xff1f; 线程终止的三种情况&#xff1a; 线程只是从启动函数中返回&#xff0c;返回的是线程的退出码&#xff1b;线程可以被同一进程中的其他线程取消&#xff1b;线程调用pthread_exit。/*** exit.c ***/ #incl…