鍍金池/ 教程/ Java/ 什么是 JIT?
定時(shí)任務(wù)
函數(shù)的參數(shù)
超時(shí)
一個(gè) openresty 內(nèi)存“泄漏”問(wèn)題
獲取 uri 參數(shù)
局部變量
sleep
灰度發(fā)布
TIME_WAIT
代碼覆蓋率
連接池
CentOS 平臺(tái)安裝
稀疏數(shù)組
如何只啟動(dòng)一個(gè) timer 工作?
變量的共享范圍
break,return 關(guān)鍵字
Nginx
SQL 注入
如何引用第三方 resty 庫(kù)
不同階段共享變量
獲取請(qǐng)求 body
動(dòng)態(tài)生成的 lua-resty-redis 模塊方法
動(dòng)態(tài)加載證書和 OCSP stapling
repeat 控制結(jié)構(gòu)
編碼為 array 還是 object
Nginx 靜態(tài)文件服務(wù)
執(zhí)行階段概念
Lua 函數(shù)
日期時(shí)間函數(shù)
健康監(jiān)測(cè)
與其他 location 配合
for 控制結(jié)構(gòu)
函數(shù)定義
HTTPS 時(shí)代
點(diǎn)號(hào)與冒號(hào)操作符的區(qū)別
String 庫(kù)
文件操作
OpenResty 最佳實(shí)踐
<code>ngx.shared.DICT</code> 非隊(duì)列性質(zhì)
使用動(dòng)態(tài) DNS 來(lái)完成 HTTP 請(qǐng)求
代碼規(guī)范
什么是 JIT?
Windows 平臺(tái)安裝
正確的記錄日志
LuaNginxModule
不用標(biāo)準(zhǔn)庫(kù)
C10K 編程
控制結(jié)構(gòu)
請(qǐng)求中斷后的處理
Lua 環(huán)境搭建
Test::Nginx 能指定現(xiàn)成的 nginx.conf,而不是自動(dòng)生成一個(gè)嗎
Lua 基礎(chǔ)數(shù)據(jù)類型
動(dòng)態(tài)限速
PostgresNginxModule
簡(jiǎn)單API Server框架
API 測(cè)試
location 匹配規(guī)則
虛變量
單元測(cè)試
防止 SQL 注入
select + set_keepalive 組合操作引起的數(shù)據(jù)讀寫錯(cuò)誤
阻塞操作
全動(dòng)態(tài)函數(shù)調(diào)用
Web 服務(wù)
典型應(yīng)用場(chǎng)景
Nginx 新手起步
TLS session resumption
輸出響應(yīng)體
調(diào)用代碼前先定義函數(shù)
module 是邪惡的
怎樣理解 cosocket
模塊
Socket 編程發(fā)展
如何對(duì) Nginx Lua module 添加新 api
如何在后臺(tái)開啟輕量級(jí)線程完成定時(shí)任務(wù)?
如何定位問(wèn)題
table 庫(kù)
json 解析的異常捕獲
如何安裝火焰圖生成工具
lua 中如何 continue
if 是邪惡的
為什么我們的域名不能被解析
抵制使用 module() 定義模塊
測(cè)試
body 在 location 中的傳遞
Lua 入門
子查詢
pipeline 壓縮請(qǐng)求數(shù)量
如何發(fā)起新 HTTP 請(qǐng)求
Lua 簡(jiǎn)介
緩存失效風(fēng)暴
Ubuntu 平臺(tái)安裝
日志輸出
緩存
Lua 面向?qū)ο缶幊?/span>
Nginx 陷阱和常見錯(cuò)誤
Redis 接口的二次封裝(發(fā)布訂閱)
日志
訪問(wèn)有授權(quán)驗(yàn)證的 Redis
正則表達(dá)式
lock
熱裝載代碼
調(diào)用 FFI 出現(xiàn) &quot;table overflow&quot;
數(shù)據(jù)合法性檢測(cè)
禁止某些終端訪問(wèn)
控制結(jié)構(gòu) if-else
調(diào)試
與 Docker 使用的網(wǎng)絡(luò)瓶頸
PostgresNginxModule 模塊的調(diào)用方式
用 do-end 整理你的代碼
FFI
什么時(shí)候使用
簡(jiǎn)介
環(huán)境搭建
Mac OS X 平臺(tái)安裝
火焰圖
負(fù)載均衡
while 型控制結(jié)構(gòu)
如何定位 openresty 崩潰 bug
使用 Nginx 內(nèi)置綁定變量
判斷數(shù)組大小
請(qǐng)求返回后繼續(xù)執(zhí)行
Redis 接口的二次封裝
KeepAlive
反向代理
協(xié)議無(wú)痛升級(jí)
數(shù)學(xué)庫(kù)
元表
Vanilla 介紹
HelloWorld
LuaCjsonLibrary
持續(xù)集成
代碼靜態(tài)分析
網(wǎng)上有大量對(duì) Lua 調(diào)優(yōu)的推薦,我們應(yīng)該如何看待?
script 壓縮復(fù)雜請(qǐng)求
非空判斷
性能測(cè)試
函數(shù)返回值
API 的設(shè)計(jì)
kong 介紹
表達(dá)式
不支持事務(wù)
LuaRestyDNSLibrary 簡(jiǎn)介

什么是 JIT?

自從 OpenResty 1.5.8.1 版本之后,默認(rèn)捆綁的 Lua 解釋器就被替換成了 LuaJIT,而不再是標(biāo)準(zhǔn) Lua。單從名字上,我們就可以直接看到這個(gè)新的解釋器多了一個(gè) JIT,接下來(lái)我們就一起來(lái)聊聊 JIT。

先看一下 LuaJIT 官方的解釋:LuaJIT is a Just-In-Time Compilerfor the Lua programming language。

LuaJIT 的運(yùn)行時(shí)環(huán)境包括一個(gè)用手寫匯編實(shí)現(xiàn)的 Lua 解釋器和一個(gè)可以直接生成機(jī)器代碼的 JIT 編譯器。

Lua 代碼在被執(zhí)行之前總是會(huì)先被 lfn 成 LuaJIT 自己定義的字節(jié)碼(Byte Code)。關(guān)于 LuaJIT 字節(jié)碼的文檔,可以參見:http://wiki.luajit.org/Bytecode-2.0(這個(gè)文檔描述的是 LuaJIT 2.0 的字節(jié)碼,不過(guò) 2.1 里面的變化并不算太大)。

一開始的時(shí)候,Lua 字節(jié)碼總是被 LuaJIT 的解釋器解釋執(zhí)行。LuaJIT 的解釋器會(huì)在執(zhí)行字節(jié)碼時(shí)同時(shí)記錄一些運(yùn)行時(shí)的統(tǒng)計(jì)信息,比如每個(gè) Lua 函數(shù)調(diào)用入口的實(shí)際運(yùn)行次數(shù),還有每個(gè) Lua 循環(huán)的實(shí)際執(zhí)行次數(shù)。當(dāng)這些次數(shù)超過(guò)某個(gè)預(yù)設(shè)的閾值時(shí),便認(rèn)為對(duì)應(yīng)的 Lua 函數(shù)入口或者對(duì)應(yīng)的 Lua 循環(huán)足夠的“熱”,這時(shí)便會(huì)觸發(fā) JIT 編譯器開始工作。

JIT 編譯器會(huì)從熱函數(shù)的入口或者熱循環(huán)的某個(gè)位置開始嘗試編譯對(duì)應(yīng)的 Lua 代碼路徑。編譯的過(guò)程是把 LuaJIT 字節(jié)碼先轉(zhuǎn)換成 LuaJIT 自己定義的中間碼(IR),然后再生成針對(duì)目標(biāo)體系結(jié)構(gòu)的機(jī)器碼(比如 x86_64 指令組成的機(jī)器碼)。

如果當(dāng)前 Lua 代碼路徑上的所有的操作都可以被 JIT 編譯器順利編譯,則這條編譯過(guò)的代碼路徑便被稱為一個(gè)“trace”,在物理上對(duì)應(yīng)一個(gè) trace 類型的 GC 對(duì)象(即參與 Lua GC 的對(duì)象)。

你可以通過(guò) ngx-lj-gc-objs 工具看到指定的 Nginx worker 進(jìn)程里所有 trace 對(duì)象的一些基本的統(tǒng)計(jì)信息,見 https://github.com/openresty/stapxx#ngx-lj-gc-objs

比如下面這一行 ngx-lj-gc-objs 工具的輸出

102 trace objects: max=928, avg=337, min=160, sum=34468 (in bytes)

則表明當(dāng)前進(jìn)程內(nèi)的 LuaJIT VM 里一共有 102 個(gè) trace 類型的 GC 對(duì) 象,其中最小的 trace 占用 160 個(gè)字節(jié),最大的占用 928 個(gè)字節(jié),平均大小是 337 字節(jié),而所有 trace 的總大小是 34468 個(gè)字節(jié)。

LuaJIT 的 JIT 編譯器的實(shí)現(xiàn)目前還不完整,有一些基本原語(yǔ)它還無(wú)法編譯,比如 pairs() 函數(shù)、unpack() 函數(shù)、string.match() 函數(shù)、基于 lua_CFunction 實(shí)現(xiàn)的 Lua C 模塊、FNEW 字節(jié)碼,等等。所以當(dāng) JIT 編譯器在當(dāng)前代碼路徑上遇到了它不支持的操作,便會(huì)立即終止當(dāng)前的 trace 編譯過(guò)程(這被稱為 trace abort),而重新退回到解釋器模式。

JIT 編譯器不支持的原語(yǔ)被稱為 NYI(Not Yet Implemented)原語(yǔ)。比較完整的 NYI 列表在這篇文檔里面:

http://wiki.luajit.org/NYI

所謂“讓更多的 Lua 代碼被 JIT 編譯”,其實(shí)就是幫助更多的 Lua 代碼路徑能為 JIT 編譯器所接受。這一般通過(guò)兩種途徑來(lái)實(shí)現(xiàn):

  1. 調(diào)整對(duì)應(yīng)的 Lua 代碼,避免使用 NYI 原語(yǔ)。
  2. 增強(qiáng) JIT 編譯器,讓越來(lái)越多的 NYI 原語(yǔ)能夠被編譯。

對(duì)于第 2 種方式,春哥一直在推動(dòng)公司(CloudFlare)贊助 Mike Pall 的開發(fā)工作。不過(guò)有些原語(yǔ)因?yàn)楸旧淼拇鷥r(jià)過(guò)高,而永遠(yuǎn)不會(huì)被編譯,比如基于經(jīng)典的 lua_CFunction 方式實(shí)現(xiàn)的 Lua C 模塊(所以需要盡量通過(guò) LuaJIT 的 FFI 來(lái)調(diào)用 C)。

而對(duì)于第 1 種方法,我們?nèi)绾尾拍苤谰唧w是哪一行 Lua 代碼上的哪一個(gè) NYI 原語(yǔ)終止了 trace 編譯呢?答案很簡(jiǎn)單。就是使用 LuaJIT 安裝自帶的 jit.v 和 jit.dump 這兩個(gè) Lua 模塊。這兩個(gè) Lua 模塊會(huì)打印出 JIT 編譯器工作的細(xì)節(jié)過(guò)程。

在 Nginx 的上下文中,我們可以在 nginx.conf 文件中的 http {} 配置塊中添加下面這一段:

init_by_lua_block {
    local verbose = false
    if verbose then
        local dump = require "jit.dump"
        dump.on(nil, "/tmp/jit.log")
    else
        local v = require "jit.v"
        v.on("/tmp/jit.log")
    end

    require "resty.core"
}

那一行 require "resty.core" 倒并不是必需的,放在那里的主要目的是為了盡量避免使用 ngx_lua 模塊自己的基于 lua_CFunction 的 Lua API,減少 NYI 原語(yǔ)。

在上面這段 Lua 代碼中,當(dāng) verbose 變量為 false 時(shí)(默認(rèn)就為 false 哈),我們使用 jit.v 模塊打印出比較簡(jiǎn)略的流水信息到 /tmp/jit.log 文件中;而當(dāng) verbose 變量為 true 時(shí),我們則使用 jit.dump 模塊打印所有的細(xì)節(jié)信息,包括每個(gè) trace 內(nèi)部的字節(jié)碼、IR 碼和最終生成的機(jī)器指令。

這里我們主要以 jit.v 模塊為例。在啟動(dòng) Nginx 之后,應(yīng)當(dāng)使用 ab 和 weighttp 這樣的工具對(duì)相應(yīng)的服務(wù)接口進(jìn)行預(yù)熱,以觸發(fā) LuaJIT 的 JIT 編譯器開始工作(還記得剛才我們說(shuō)的“熱函數(shù)”和“熱循環(huán)”嗎?)。預(yù)熱過(guò)程一般不用太久,跑個(gè)二三百個(gè)請(qǐng)求足矣。當(dāng)然,壓更多的請(qǐng)求也沒(méi)關(guān)系。完事后,我們就可以檢查 /tmp/jit.log 文件里面的輸出了。

jit.v 模塊的輸出里如果有類似下面這種帶編號(hào)的 TRACE 行,則指示成功編譯了的 trace 對(duì)象,例如

[TRACE 6 shdict.lua:126 return]

這個(gè) trace 對(duì)象編號(hào)為 6,對(duì)應(yīng)的 Lua 代碼路徑是從 shdict.lua 文件的第 126 行開始的。

下面這樣的也是成功編譯了的 trace:

[TRACE  16 (15/1) waf-core.lua:419 -> 15]

這個(gè) trace 編號(hào)為 16,是從 waf-core.lua 文件的第 419 行開始的,同時(shí)它和編號(hào)為 15 的 trace 聯(lián)接了起來(lái)。

而下面這個(gè)例子則是被中斷的 trace:

[TRACE --- waf-core.lua:455 -- NYI: FastFunc pairs at waf-core.lua:458]

上面這一行是說(shuō),這個(gè) trace 是從 waf-core.lua 文件的第 455 行開始編譯的,但當(dāng)編譯到 waf-core.lua 文件的第 458 行時(shí),遇到了一個(gè) NYI 原語(yǔ)編譯不了,即 pairs() 這個(gè)內(nèi)建函數(shù),于是當(dāng)前的 trace 編譯過(guò)程被迫終止了。

類似的例子還有下面這些:

[TRACE --- exit.lua:27 -- NYI: FastFunc coroutine.yield at waf-core.lua:439]
[TRACE --- waf.lua:321 -- NYI: bytecode 51 at raven.lua:107]

上面第二行是因?yàn)椴僮鞔a 51 的 LuaJIT 字節(jié)碼也是 NYI 原語(yǔ),編譯不了。

那么我們?nèi)绾沃?51 字節(jié)碼究竟是啥呢?我們可以用 nginx-devel-utils 項(xiàng)目中的 ljbc.lua 腳本來(lái)取得 51 號(hào)字節(jié)碼的名字:

$ /usr/local/openresty/luajit/bin/luajit-2.1.0-alpha ljbc.lua 51
opcode 51:
FNEW

我們看到原來(lái)是用來(lái)(動(dòng)態(tài))創(chuàng)建 Lua 函數(shù)的 FNEW 字節(jié)碼。ljbc.lua 腳本的位置是

https://github.com/agentzh/nginx-devel-utils/blob/master/ljbc.lua

非常簡(jiǎn)單的一個(gè)腳本,就幾行 Lua 代碼。

這里需要提醒的是,不同版本的 LuaJIT 的字節(jié)碼可能是不相同的,所以一定要使用和你的 Nginx 鏈接的同一個(gè) LuaJIT 來(lái)運(yùn)行這個(gè) ljbc.lua 工具,否則有可能會(huì)得到錯(cuò)誤的結(jié)果。

我們實(shí)際做個(gè)對(duì)比實(shí)驗(yàn),看看 JIT 帶來(lái)的好處:

? cat test.lua
local s = [[aaaaaabbbbbbbcccccccccccddddddddddddeeeeeeeeeeeee
fffffffffffffffffggggggggggggggaaaaaaaaaaabbbbbbbbbbbbbb
ccccccccccclllll]]

for i=1,10000 do
    for j=1,10000 do
        string.find(s, "ll", 1, true)
    end
end

? time luajit test.lua
5.19s user
0.03s system
96% cpu
5.392 total

?  time lua test.lua
9.20s user
0.02s system
99% cpu
9.270 total

本例子可以看到效率相差大約 9.2/5.19 ≈ 1.77 倍,換句話說(shuō)標(biāo)準(zhǔn) Lua 需要 177% 的時(shí)間才能完成同樣的工作。估計(jì)大家覺得這個(gè)還不過(guò)癮,再看下面示例代碼:

文件 test.lua:


local loop_count = tonumber(arg[1])
local fun_pair = "ipairs" == arg[2] and ipairs or pairs

local t = {}
for i=1,100 do
    t[i] = i
end

for i=1,loop_count do
    for j=1,1000 do
        for k,v in fun_pair(t) do
            --
        end
    end
end
執(zhí)行參數(shù) 執(zhí)行結(jié)果
time lua test.lua 1000 ipairs 3.96s user 0.02s system 98% cpu 4.039 total
time lua test.lua 1000 pairs 3.97s user 0.01s system 99% cpu 3.992 total
time luajit test.lua 1000 ipairs 0.10s user 0.00s system 95% cpu 0.113 total
time luajit test.lua 10000 ipairs 0.98s user 0.00s system 99% cpu 0.991 total
time luajit test.lua 1000 pairs 1.54s user 0.01s system 99% cpu 1.559 total

從這個(gè)執(zhí)行結(jié)果中,大致可以總結(jié)出下面幾個(gè)觀點(diǎn):

  • 在標(biāo)準(zhǔn) Lua 解釋器中,使用 ipairs 或 pairs 沒(méi)有區(qū)別;
  • 對(duì)于 pairs 方式,LuaJIT 的性能大約是標(biāo)準(zhǔn) Lua 的 4 倍;
  • 對(duì)于 ipairs 方式,LuaJIT 的性能大約是標(biāo)準(zhǔn) Lua 的 40 倍。

可以被 JIT 編譯的元操作

下面給大家列一下截止到目前已經(jīng)可以被 JIT 編譯的元操作。 其他還有 IO、Bit、FFI、Coroutine、OS、Package、Debug、JIT 等分類,使用頻率相對(duì)較低,這里就不羅列了,可以參考官網(wǎng):http://wiki.luajit.org/NYI。

基礎(chǔ)庫(kù)的支持情況

函數(shù) 編譯? 備注
assert yes
collectgarbage no
dofile never
error never
getfenv 2.1 partial 只有 getfenv(0) 能編譯
getmetatable yes
ipairs yes
load never
loadfile never
loadstring never
next no
pairs no
pcall yes
print no
rawequal yes
rawget yes
rawlen (5.2) yes
rawset yes
select partial 第一個(gè)參數(shù)是靜態(tài)變量的時(shí)候可以編譯
setfenv no
setmetatable yes
tonumber partial 不能編譯非10進(jìn)制,非預(yù)期的異常輸入
tostring partial 只能編譯:字符串、數(shù)字、布爾、nil 以及支持 __tostring元方法的類型
type yes
unpack no
xpcall yes

字符串庫(kù)

函數(shù) 編譯? 備注
string.byte yes
string.char 2.1
string.dump never
string.find 2.1 partial 只有字符串樣式查找(沒(méi)有樣式)
string.format 2.1 partial 不支持 %p 或 非字符串參數(shù)的 %s
string.gmatch no
string.gsub no
string.len yes
string.lower 2.1
string.match no
string.rep 2.1
string.reverse 2.1
string.sub yes
string.upper 2.1

函數(shù) 編譯? 備注
table.concat 2.1
table.foreach no 2.1: 內(nèi)部編譯,但還沒(méi)有外放
table.foreachi 2.1
table.getn yes
table.insert partial 只有 push 操作
table.maxn no
table.pack (5.2) no
table.remove 2.1 部分,只有 pop 操作
table.sort no
table.unpack (5.2) no

math 庫(kù)

函數(shù) 編譯? 備注
math.abs yes
math.acos yes
math.asin yes
math.atan yes
math.atan2 yes
math.ceil yes
math.cos yes
math.cosh yes
math.deg yes
math.exp yes
math.floor yes
math.fmod no
math.frexp no
math.ldexp yes
math.log yes
math.log10 yes
math.max yes
math.min yes
math.modf yes
math.pow yes
math.rad yes
math.random yes
math.randomseed no
math.sin yes
math.sinh yes
math.sqrt yes
math.tan yes
math.tanh yes