百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

Nginx是什么?看我如何一步步给你讲透这个神奇的架构

off999 2025-04-09 18:57 9 浏览 0 评论

nginx是什么架构?是怎么样的?你是一个程序员,你在电脑上编辑了一段文本,将它保存为t x t文件,将它拖到浏览器打开就能看到文件里的内容。但这看起来太过单调,为了让画面更丰富,我们定个规则,在文本边上加两个h e符号,文本就以标题形式展示。加入u l和l i就能变成列表,加入i m g还能让u r l文本直接变成对应的图片。这些带尖括号的特殊符号,我们叫它标签,只要浏览器识别到这些标签就展示对应的样式。

为了将这个自带标签的文本跟t x t纯文本区分开来,我们给了他新的后缀名html。浏览器只要识别到文件是html就会解析里面的标签,这样我们就有了标题、输入框等各种丰富的内容了。这其实就是我们平时在浏览器中看到的网页。但不同的是,这个h t m l文件是浏览器从我们本地电脑文件中打开的,而我们平时访问的网页则是从某个远端服务器将文件传到我们电脑的浏览器后打开的。

那么问题就来了。我们是怎么获得这个远端服务器上的h t m l文件的?没有什么是加一层中间层不能解决的,如果有那就再加一层。这次我们要加的中间层是n g x,假设我们完全不了解n g x,来看一下它是怎么设计出来的。之前你点赞了吗?关注了吗?谢谢。

h t t p服务器是什么?想要让本地的浏览器获取到放在远端服务器上的h t m l文件,那很简单,我们可以在远端服务器启动一个进程,这个进程对外提供h t t p服务,说白了就是提供了一个u r l。用户在浏览器中输入这个u r l回车,浏览器就会向这个进程发起http请求。进程收到浏览器的请求后,就将h t m l文件发给浏览器,浏览器完成解析和展示完美。而像这种根据浏览器请求返回html文件的服务进程,其实就叫http服务器。

有了它,前端开发老哥写的各种h t m l文件就能部署到远端服务器上,对外提供网页服务了。反向代理是什么?但一个完整产品往往不只有前端页面,还有后端服务。比如某宝前端商城页面,需要从后端服务那获取最新的商品数据。假设现在前端页面已经被加载到浏览器中,浏览器会按页面里写好的代码逻辑向后端商品服务发起请求获取数据。

流量小的时候没什么问题,流量变大后,后端服务器扛不住的话,就需要增加商品服务的个数。服务变多后,每个都有对应的ip和端口,浏览器就不知道该访问哪个服务了。所以我们还需要在这几个后端服务前面加一个进程,对外提供一个u r l域名请求来了,由这个进程均匀转发给背后的几个服务,让每个服务都能处理上请求,也就实现了所谓的负载均衡。像这种屏蔽掉背后具体有哪些服务器的代理方式,就是我们常说的反向代理。

有了反向代理,我们对外就可以只提供一个u i l域名,背后根据需要随时扩缩容服务。这个反向代理的功能正好可以加到前面放h t m l文件的进程上。那现在这个过程就很灵性了。既可以为前端h t m l文件提供h t t p服务器的功能。

当h t m l文件被加载到浏览器并向后端发起请求的时候,这个进程还能为后端服务器提供反向代理的功能。模块化网关能力。既然是中间层,所有网络流量都要经过进程,那它高低也算个网关了。于是我们就可以顺理成章的在它上面加入一些通用网关能力。

比如加个日志记录每次调用的结果,方便后续排查问题。又比如加个对输入输出的内容进行压缩的功能,减少网络带宽消耗。又或者是对某个i p进行限流或封禁,甚至还可以修改输入输出的内容。能实现的功能实在太多,想象空间很大。

于是将这部分功能设计为开放接口,让用户通过自定义模块来实现特定功能。这还不够,现在这个网关只支持h t t p,我们其实还能扩展下,让它支持t c p、u d p、h t t p二和web socket。你能想到的我都要支持,我本来不支持的,就会有人通过自定义模块帮我支持。配置能力。

前面提到那么多种能力,用户肯定不会全用上。所以需要有个地方让人选择用哪些能力。于是我们可以加个配置文件,也就是n g x点com fig,用户想用什么能力就在配置文件上说明清楚就行,非常方便。单线程现在这个网关进程的主要任务就是跟上下游建立网络连接,顺便内部做下处理。

多个客户端请求通过网络进入到一个进程。如果用多线程并发处理,那就需要考虑并发问题影响性能,怎么办呢?很简单,外部不管有多少个网络连接,网关进程,收到客户端请求后,都统一塞到一个线程上。在一个线程上处理客户端请求,什么并发问题和线程切换开销完全不存在。多worker进程,但单个进程要单线程处理,那么多流量哪怕再快压力也不小。

万一这里面有美羊羊发的流量,你看见人那么久,怎么忍心让他久等?沸羊羊你说话你干嘛?怎么办呢?既然多线程不行,那我们就上多进程。于是可以将单个进程改为多个进程,我们管它们叫worker进程。进程之间互相独立,一个worker贵了并不影响另外一个worker进程。让多个worker进程同时监听一个ip地址,加端口一有流量进来,操作系统就会随机给到其中一个进程处理。

将进程数量设置为跟操作系统c p u核数一致,那每个进程都能得到一个核。开足马力猛猛干。听到这里问题就来啊,看到这里看到这里问题就来了,为什么多个进程同时监听一个端口,不会出现端口冲突?评论区告诉我答案。内存共享。

但多worker进程的情况下,同一个客户端的多个请求会随机打到某个worker。对于限流这种需要技术的场景,就会被分散到多个worker上单独计数。那还怎么限流?所以还需要给这些worker进程分配一个共享内存区域,方便多个进程之间共用同一份数据做逻辑,确保系统数据一致性。proxy cache作为网关,它在收到前端网页请求后会转发给后端,并将后端处理结果中转给前端。

如果它能将响应结果缓存起来,这样下次收到同样的请求,直接将缓存里的数据返回给前端,从而减少响应时间和网络负载。那这个数据是放在共享内存里面,内存贵不合适。我们可以维护一些磁盘文件,用于在前端请求后端的过程中暂存。后端响应的结果后面再有相同请求就可以将磁盘里的数据返回。

这就是经典的空间换时间,用廉价的磁盘空间换取网络传输和cpu计算耗时。对于后端响应较慢或重复请求较多的场景,读写磁盘总归。可以直接将请求打到后端来得快。这些用于缓存响应数据的磁盘文件就是所谓的proxy cache加入master进程。

但这还不够,现在每个worker会分走一部分流量。如果功能更新,所有worker同时一起重启,上面的网络连接就会全部断掉。更好的方式是创建worker和关闭worker挨个陆续执行。这样前端网页连接断开后,还能去连另外一个worker,保证任意时间一直有worker在工作,也就是所谓的滚动升级。

因此还需要一个新的进程,协调各个worker谁先谁后。这个协调进程就是所谓的master进程,让master读取前面提到的n g x点config配置,统一管理多个worker。n g x是什么?到这里,当初那个简陋的单进程网关服务就变成了一个支持动态配置多种通用网关能力和多种网络协议,单master多worker架构,多个worker进程之间共享内存和proxy cache,对外提供一个埃批加端口,支持h t t p服务器和反向代理的高性能网关服务。它就是所谓的n g x,它不仅支持日志限流等各种通用能力,还支持自定义网关能力。

只要你写好配置,就能让它给你当牛做马。性能上五万q p s非常轻松,应付你那只有几十q p s的服务更是绰绰有余了。现在大家通了吗?好了,如果你觉得这个视频对你有帮助,记得点赞并转发给你那不成器的兄弟。文字版的笔记见评论区。

最后遗留一个问题,想必大家也发现了,聊到现在它其实也只是某台服务器上的多个进程,一旦服务器贵了,n g x也就贵了,存在单点问题,那怎么解决n g x的单点问题呢?n g x有集群模式吗?评论区告诉我答案。

相关推荐

Python 数据分析——利用Pandas进行分组统计

话说天下大势,分久必合,合久必分。数据分析也是如此,我们经常要对数据进行分组与聚合,以对不同组的数据进行深入解读。本章将介绍如何利用Pandas中的GroupBy操作函数来完成数据的分组、聚合以及统计...

python数据分析:介绍pandas库的数据类型Series和DataFrame

安装pandaspipinstallpandas-ihttps://mirrors.aliyun.com/pypi/simple/使用pandas直接导入即可importpandasas...

使用DataFrame计算两列的总和和最大值_[python]

【如果对您有用,请关注并转发,谢谢~~】最近在处理气象类相关数据的空间计算,在做综合性计算的时候,DataFrame针对每列的统计求和、最大值等较为方便,对某行的两列或多列数据进行求和与最大值等的简便...

8-Python内置函数

Python提供了丰富的内置函数,这些函数可以直接使用而无需导入任何模块。以下是一些常用的内置函数及其示例:1-print()1-1-说明输出指定的信息到控制台。1-2-例子2-len()2-1-说...

Python中函数式编程函数: reduce()函数

Python中的reduce()函数是一个强大的工具,它通过连续地将指定的函数应用于序列(如列表)来对序列(如列表)执行累积操作。它是functools模块的一部分,这意味着您需要在使用它之...

万万没想到,除了香农计划,Python3.11竟还有这么多性能提升

众所周知,Python3.11版本带来了较大的性能提升,但是,它具体在哪些方面上得到了优化呢?除了著名的“香农计划”外,它还包含哪些与性能相关的优化呢?本文将带你一探究竟!作者:BeshrKay...

最全python3.11版12类75个内置函数大全

获取全部内置函数:importbuiltins#导入模块yc=[]#异常属性nc=[]#不可调用fn=[]#内置函数defll(ty=builtins):...

软件测试笔试题

测试工程师岗位,3-5年,10-14k1.我司有一款产品,类似TeamViewer,向日葵,mstsc,QQ远程控制产品,一个PC客户端产品,请设想一下测试要点。并写出2.写出常用的SQL语句8条,l...

备战各大互联网巨头公司招聘会,最全Python面试大全,共300题

前言众所周知,越是顶尖的互联网公司在面试这一part的要求就越高,需要你有很好的技术功底、项目经验、一份漂亮的简历,当然还有避免不了的笔试过关。对于Python的工程师来说,全面掌握好有关Python...

经典 SQL 数据库笔试题及答案整理

马上又是金三银四啦,有蛮多小伙伴在跳槽找工作,但对于年限稍短的软件测试工程师,难免会需要进行笔试,而在笔试中,基本都会碰到一道关于数据库的大题,今天这篇文章呢,就收录了下最近学员反馈上来的一些数据库笔...

用Python开发日常小软件,让生活与工作更高效!附实例代码

引言:Python如何让生活更轻松?在数字化时代,编程早已不是程序员的专属技能。Python凭借其简洁易学的特点,成为普通人提升效率、解决日常问题的得力工具。无论是自动化重复任务、处理数据,还是开发个...

太牛了!102个Python实战项目被我扒到了!建议收藏!

挖到宝了!整整102个Python实战项目合集,从基础语法到高阶应用全覆盖,附完整源码+数据集,手把手带你从代码小白变身实战大神!这波羊毛不薅真的亏到哭!超全项目库,学练一站式搞定这份资...

Python中的并发编程

1.Python对并发编程的支持多线程:threading,利用CPU和IO可以同时执行的原理,让CPU不会干巴巴等待IO完成。多进程:multiprocessing,利用多核CPU...

Python 也有内存泄漏?

1.背景前段时间接手了一个边缘视觉识别的项目,大功能已经开发的差不多了,主要是需要是优化一些性能问题。其中比较突出的内存泄漏的问题,而且不止一处,有些比较有代表性,可以总结一下。为了更好地可视化内存...

python爬虫之多线程threading、多进程、协程aiohttp批量下载图片

一、单线程常规下载常规单线程执行脚本爬取壁纸图片,只爬取一页的图片。importdatetimeimportreimportrequestsfrombs4importBeautifu...

取消回复欢迎 发表评论: