介绍¶
更新于2018.06.08
以下来源:《淘宝Tengine–易运维的高性能Nginx服务器》(《程序员》杂志, 2012年9月刊登)
Tengine的由来¶
Nginx是近几年脱颖而出的一个非常优秀的Web服务器,它以资源消耗低、并发能力强著称, 现在是世界上第三大Web服务器。在淘宝,我们用它来服务静态文件、PHP动态页面,做反向代理和负载均衡等。根据淘宝的实际需求,我们开发了数十个不同用途的模块。但随着使用的增多,它的一些不足和有待改进的地方也逐渐凸显。例如,Nginx不支持动态模块加载, 不同的应用往往需要编译不同的RPM包,从而导致运维比较麻烦;Nginx欠缺输入请求体过滤器机制,从而使得开发安全模块比较困难;不支持Syslog的方式发送日志,导致日志管理烦琐等。Nginx缺少的这些功能都不能通过开发第三方模块来实现,因此我们开始对它的核心进行深度定制和开发。另外,我们在Web服务器领域也积累了一些经验和创新性的想法,希望在Nginx优秀的基础上,继续加强它的性能、安全和可运维性。这就是Tengine项目的由来。
Tengine是Nginx的一个超集,它基于Nginx的最新稳定版本,对其核心进行扩展和增强,同时保持对Nginx的100%向后兼容性。使用Nginx为Web服务器的业务可以无缝迁移到Tengine。因为Tengine继承了Nginx的优点,所以相对于Apache这样传统的Web服务器,它性能更高,而资源占用(CPU、内存等)更省。在处理大量并发的请求时,它的表现更出色、稳定。同时, Tengine经受住了淘宝生产线的长时间考验,对于访问繁忙和服务器数目众多的大型网站尤为适合。
基于生产环境的实际需求,我们跟淘宝的运维工程师紧密合作,对Tengine进行开发,因此我们设计出来的模块也更着眼于实用性、可用性和运维性。例如我们开发的动态模块加载功能, 就可以免去打包和编译的烦琐工作,让Nginx使用第三方模块像使用Apache一样方便。Tengine的命令行,可以显示编译进去的模块和全部支持的指令。Tengine的Syslog功能,可以支持Syslog、Pipe、File等多种记录方式,相当灵活。结合tsar开发的统计模块,甚至可以统计QPS、响应时间等数据。Tengine的主动式健康检查模块,可以在不改动配置的情况下,感知后端服务器的健康状况,主动屏蔽有问题的服务器。
2011年12月初,Tengine正式开源。项目主页在http://tengine.taobao.org。淘宝之所以开源Tengine,是因为淘宝是开源软件的受惠者,公司一直很支持技术项目的开源以回馈开源社区——通过Tengine的开源,我们希望能帮助和淘宝一样对高性能Web服务器有迫切需要的人或互联网公司,大家一起享受开源带来的技术进步。同时,开源对于Tengine本身的发展也更有利,例如我们可以获得更多用户的意见和建议、Bug反馈甚至是Patch等。现在Tengine在国内和国外有很多用户,各项功能有众多线上系统在使用,因此他们的反馈也让Tengine更加稳定和注重实效。自开源以来,我们每隔一个月左右发布一个新版本,添加和修改一些功能及修复Bug。当Nginx本身升级时,Tengine也会定时合并Nginx的更新。同时我们也在和Nginx公司合作,将Tengine对于Nginx的改进提交给他们。最近我们翻译了部分Nginx的英文文档,被Nginx官方收录。他们对Tengine的一些功能也表示了浓厚的兴趣,因此Tengine中的部分功能有望在不久的将来出现在标准Nginx中。
Tengine的改进¶
Tengine目前的一些性能改进如下表所示。
项 | 改进内容 |
---|---|
应用模块 | concat, user_agent, footer, slice |
upstream模块 | upstream_check |
框架模块和Web开发 | Lua |
管理模块 | backtrace, sysguard, traffic status |
核心补丁或模块 | dso, input body filter, syslog, CPU affinity, proc |
数据结构 | 4-heap, trie |
计时器优化¶
Timers(计时器)是网络服务器中一个很重要的基础设置,用来管理读写超时和应用逻辑的超时等。其常见操作有添加超时、删除超时以及查找最小的超时值。Nginx使用Red-black tree(红黑树)作为其计时器的数据结构。红黑树对应于添加、删除和查找最小值的算法复杂度都是O(logn)。在Tengine中,我们将Nginx的计时器数据结构改为了4-heap(四叉最小堆)。四叉堆是二叉堆的变种,比二叉堆有更浅的深度和更好的CPU Cache命中率。最小堆的添加、删除的复杂度和红黑树一样都是O(log n),但在查找最小值时,它的算法复杂度是O(1),即只要取出堆顶的第一个元素即可,因此比Nginx的红黑树更适合频繁获取最小值的场景,特别是在处理大量连接时,用最小堆性能提升比较明显。
浏览器和爬虫的判断优化¶
判断浏览器的类型是Web服务器的一个常见需求。Nginx中判断浏览器的方法是对关注的浏览器种类在User-Agent头中做暴力查找(strstr)。strstr本身的算法复杂度是O(n^2), Nginx查找的是多个串,因此其最终算法复杂度是O(n^3)。随着现在移动端的浏览器增多, 原有模块的复杂度成指数增长,性能不高。在Tengine中,我们开发了一个全新的user_agent模块,使用了trie(前缀树)来搜索多个可能的浏览器匹配串。它将所有的匹配字符串构造出一个自动机,每次匹配,它的算法复杂度只需要O(n)。因此复杂度不会随着匹配串数量的增加而增加。
自动绑定CPU亲缘性¶
原有的Nginx CPU绑定需要手工操作,在Tengine中我们将Worker进程和CPU进行自动绑定, 可以减少因CPU的Cache失效带来的性能损失,从而提高性能。另外,这样也减少了运维配置的工作量。Tengine对Nginx机制的增强则包含以下几个方面。
Lua模块¶
基于降低Nginx模块开发难度的初衷,Lua模块(ngx_lua)将Lua嵌入进Nginx核心中,借助于Lua的协程和Nginx的事件模型实现同步、非阻塞的I /O操作,开发者在Nginx配置文件中可串行同步编写Lua脚本来处理业务逻辑,既可以用它来黏合各种上游(Proxy、Drizzle、 Redis、Memcached等)的输出,也可以使用它的Cosocket接口来编写访问上游的客户端。 得益于Lua解释器极低的开销和JIT技术(LuaJIT),用户不用编写复杂的C模块就能获得极高的吞吐性能。也可以动态更改逻辑,不用再重新编译Nginx代码,从而带来了极大的灵活性。
Lua模块在初始化时为每个Nginx工作进程创建一个Lua/LuaJIT实例(Lua VM),同一进程处理的所有请求将共享该实例,并且Lua模块将用户Lua代码包装为协程工厂缓存在Nginx内, 一个请求到来时协程工厂为它分配一个独立协程来运行业务逻辑。在需要进行阻塞的I/O操作时,Lua模块自动将I/O操作委托给Nginx的事件处理模型,并保存正在运行的协程上下文, 返回到Nginx工作进程中处理其他请求,等到I/O操作完成时,又会恢复该协程继续运行。
动态模块支持¶
Tengine中加入了动态模块功能,对模块实现了动态编译,加入模块不再需要静态编译整个Tengine代码。使用方法类似Apache,在使用时可以当场动态编译想加入的模块,非常方便。
- 我们提供类似apxs的编译工具,将模块编译成动态链接库。
- 在Tengine启动时通过动态链接库读入模块的模块结构体,这个结构体包含了模块处理的所有信息。
- Tengine有内置的模块加载顺序表,也可在配置文件中显式的指定模块的加载顺序,保证模块加载顺序正常。
- Tengine内部通过两个版本号(Major和Minor)来控制动态链接库(.so文件)的前后兼容性。 当Major版本号相同时,较新版本的Tengine兼容较旧版本的.so文件(Tengine的Minor大于.so文件)。只有当Tengine的API发生重大变化时,Major的版本号才发生变化。增加新的API只会增加Minor版本号。
输入体过滤器支持¶
Nginx没有对请求主体内容的过滤机制,而且在处理较大请求时,可能会缓存到磁盘的临时文件上,因此对输入体的分析和过滤很不方便。Tengine中增加了对于读取用户请求输入体的回调函数,该函数优先于缓存磁盘执行。在收到请求体时会调用这个回调函数,可以方便地对上传的内容进行过滤。而且所有输入体过滤器以链式流程处理。
开启额外进程的机制¶
Tengine中可以方便地启动进程,这些进程可以独立于原有Nginx工作进程,用来执行某些特殊逻辑(例如非HTTP的应用场景)。该机制在Tengine中增加了一种全新的模块类型, 可以开发多个不同用途的进程模块。
对Syslog和管道日志的支持¶
Syslog功能对于集中式的日志管理非常有用,因此现有大部分的服务器软件都支持Syslog功能。 Tengine可以将错误日志和访问日志发送到本地或远程的Syslog服务器。我们完全实现了底层Syslog的协议(使用UDP),解决了Syslog接口阻塞的问题。Tengine也支持通过管道方式将日志写到另一个程序,如Cronolog。此外,在Tengine中,还可以对日志进行抽样,例如只记录1%的日志,从而降低对磁盘I/O的压力,对繁忙的业务颇有用处。
API的增强¶
Tengine对Nginx的API进行了扩充,如内存操作、HTTP头处理等,以简化模块开发的难度。
目前Tengine比Nginx增加功能模块主要有下面一些。
Concat模块
可以组合多个JavaScript和CSS请求变成一个,从而降低下载时间,提高用户体验。该模块对于提高前端的响应时间非常有用。
Sysguard模块
在系统的Load或者内存(Swap)使用超过一定阈值或比例时返回等待页面,从而保护服务器。
User_agent模块
利用trie结构,扫描浏览器和爬虫的种类,定义$browser和$os变量,比Nginx的Browser模块更加灵活且性能更高。
Footer模块
在响应内容后添加一段内容。可用来添加Host信息,对定位大量服务器中出问题的个别机器很有用。
Slice模块
用来访问一个文件中的一个片段,可以指定开始和结束的偏移值也可以增加头和尾。
Backtrace模块
在遇到异常如崩溃时将调用栈输出到日志以便于问题定位。
主动式Upstream健康检查模块
可以对后端的HTTP、HTTPS、MySQL等类型的服务器定期发起心跳包,维护后端的健康情况, 当服务器不可用时,就不再向其发送实际请求。实现了Tengine与后端服务器的高可用。
针对易运维性,我们在几个方面对Tengine进行增强,下表是Nginx与Tengine的对比。
功能 | Nginx | Tengine |
---|---|---|
日志 | File | Syslog, Pipe, File,可抽样 |
编译方式 | 每次静态编译 | 核心模块静态编译,功能模块各自编译,动态加载 |
健康检查方式 | 被动式检查 | 主动式心跳检查 |
状态统计 | 只显示并发连接数和请求数 | 可针对域名、端口进行统计,也可对流量进行统计 |
后端连接数限制 | 无 | 可以针对后端服务器进行连接数限制 |
命令行 | 可显示版本号和编译 | 选项还可以显示 - 所有编译进去的模块(-m)、 - 所有支持的指令(-l)、 - 输出所有include 的文件(-d) |
CPU亲缘性 | 手工绑定 | 自动绑定 |
过载保护 | 无 | Sysguard 模块 |
崩溃输出堆栈 | Coredump | Coredump、backtrace模块 |
Tengine目前正在做的改进还包括以下方面。
- 负载均衡的增强如更多负载均衡算法和云的支持等,一致性Hash模块、Session保持模块、 后端连接数限制模块、随机负载均衡模块等。
- Cache功能增强,主要是内存Cache的支持,降低高并发对磁盘I/O带来的影响。
- 更强的统计模块,可以根据端口或者域名统计流量、连接数等有用的信息。