鍍金池/ 教程/ GO/ 13.10 性能調(diào)試:分析并優(yōu)化 Go 程序
4.7 strings 和 strconv 包
13.6 啟動(dòng)外部命令和程序
?# 11.4 類型判斷:type-switch
12.1 讀取用戶的輸入
10.6 方法
12.2 文件讀寫
13 錯(cuò)誤處理與測(cè)試
9.3 鎖和 sync 包
12.3 文件拷貝
?# 11.7 第一個(gè)例子:使用 Sorter 接口排序
?# 11.5 測(cè)試一個(gè)值是否實(shí)現(xiàn)了某個(gè)接口
6.4 defer 和追蹤
12.10 XML 數(shù)據(jù)格式
13.10 性能調(diào)試:分析并優(yōu)化 Go 程序
?# 11.1 接口是什么
2.2 Go 環(huán)境變量
2.6 安裝目錄清單
2.5 在 Windows 上安裝 Go
11.11 Printf 和反射
1.2 語言的主要特性與發(fā)展的環(huán)境和影響因素
9.0 包(package)
7.4 切片重組(reslice)
13.2 運(yùn)行時(shí)異常和 panic
10.2 使用工廠方法創(chuàng)建結(jié)構(gòu)體實(shí)例
12.8 使用接口的實(shí)際例子:fmt.Fprintf
2.4 在 Mac OS X 上安裝 Go
3.8 Go 性能說明
7.2 切片
8.0 Map
3.1 Go 開發(fā)環(huán)境的基本要求
5.6 標(biāo)簽與 goto
6.10 使用閉包調(diào)試
9.5 自定義包和可見性
4.3 常量
?# 11.2 接口嵌套接口
6.5 內(nèi)置函數(shù)
前言
10.8 垃圾回收和 SetFinalizer
2.8 Go 解釋器
13.7 Go 中的單元測(cè)試和基準(zhǔn)測(cè)試
6.8 閉包
4.9 指針
13.1 錯(cuò)誤處理
10.1 結(jié)構(gòu)體定義
5.1 if-else 結(jié)構(gòu)
6.6 遞歸函數(shù)
9.9 通過 Git 打包和安裝
2.7 Go 運(yùn)行時(shí)(runtime)
10.7 類型的 String() 方法和格式化描述符
3.7 其它工具
9.6 為自定義包使用 godoc
11.12 接口與動(dòng)態(tài)類型
13.3 從 panic 中恢復(fù)(Recover)
10.3 使用自定義包中的結(jié)構(gòu)體
11.14 結(jié)構(gòu)體、集合和高階函數(shù)
3.6 生成代碼文檔
9.2 regexp 包
4.1 文件名、關(guān)鍵字與標(biāo)識(shí)符
?# 11.6 使用方法集與接口
7.0 數(shù)組與切片
7.1 聲明和初始化
12.11 用 Gob 傳輸數(shù)據(jù)
5.5 Break 與 continue
1.1 起源與發(fā)展
?# 11 接口(Interfaces)與反射(reflection)
6.9 應(yīng)用閉包:將函數(shù)作為返回值
4.2 Go 程序的基本結(jié)構(gòu)和要素
8.6 將 map 的鍵值對(duì)調(diào)
6.11 計(jì)算函數(shù)執(zhí)行時(shí)間
5.0 控制結(jié)構(gòu)
10.5 匿名字段和內(nèi)嵌結(jié)構(gòu)體
4.6 字符串
3.0 編輯器、集成開發(fā)環(huán)境與其它工具
13.8 測(cè)試的具體例子
7.6 字符串、數(shù)組和切片的應(yīng)用
8.4 map 類型的切片
3.9 與其它語言進(jìn)行交互
7.3 For-range 結(jié)構(gòu)
9.7 使用 go install 安裝自定義包
6.0 函數(shù)
9.8 自定義包的目錄結(jié)構(gòu)、go install 和 go test
6.3 傳遞變長參數(shù)
13.9 用(測(cè)試數(shù)據(jù))表驅(qū)動(dòng)測(cè)試
11.9 空接口
8.1 聲明、初始化和 make
6.2 函數(shù)參數(shù)與返回值
9.11 在 Go 程序中使用外部庫
3.3 調(diào)試器
4.5 基本類型和運(yùn)算符
?# 11.8 第二個(gè)例子:讀和寫
12.5 用 buffer 讀取文件
總結(jié):Go 中的面向?qū)ο?/span>
11.10 反射包
12.7 用 defer 關(guān)閉文件
9.4 精密計(jì)算和 big 包
4.4 變量
6.1 介紹
13.4 自定義包中的錯(cuò)誤處理和 panicking
12.4 從命令行讀取參數(shù)
9.10 Go 的外部包和項(xiàng)目
8.3 for-range 的配套用法
3.5 格式化代碼
10.4 帶標(biāo)簽的結(jié)構(gòu)體
7.5 切片的復(fù)制與追加
?# 11.3 類型斷言:如何檢測(cè)和轉(zhuǎn)換接口變量的類型
5.4 for 結(jié)構(gòu)
4.8 時(shí)間和日期
2.3 在 Linux 上安裝 Go
12 讀寫數(shù)據(jù)
6.12 通過內(nèi)存緩存來提升性能
9.1 標(biāo)準(zhǔn)庫概述
12.6 用切片讀寫文件
10 結(jié)構(gòu)(struct)與方法(method)
8.5 map 的排序
12.9 JSON 數(shù)據(jù)格式
13.5 一種用閉包處理錯(cuò)誤的模式
3.2 編輯器和集成開發(fā)環(huán)境
12.12 Go 中的密碼學(xué)
5.2 測(cè)試多返回值函數(shù)的錯(cuò)誤
6.7 將函數(shù)作為參數(shù)
8.2 測(cè)試鍵值對(duì)是否存在及刪除元素
3.4 構(gòu)建并運(yùn)行 Go 程序
2.1 平臺(tái)與架構(gòu)
5.3 switch 結(jié)構(gòu)

13.10 性能調(diào)試:分析并優(yōu)化 Go 程序

13.10.1 時(shí)間和內(nèi)存消耗

可以用這個(gè)便捷腳本 xtime 來測(cè)量:

#!/bin/sh
/usr/bin/time -f '%Uu %Ss %er %MkB %C' "$@"

在 Unix 命令行中像這樣使用 xtime goprogexec,這里的 progexec 是一個(gè) Go 可執(zhí)行程序,這句命令行輸出類似:56.63u 0.26s 56.92r 1642640kB progexec,分別對(duì)應(yīng)用戶時(shí)間,系統(tǒng)時(shí)間,實(shí)際時(shí)間和最大內(nèi)存占用。

13.10.2 用 go test 調(diào)試

如果代碼使用了 Go 中 testing 包的基準(zhǔn)測(cè)試功能,我們可以用 gotest 標(biāo)準(zhǔn)的 -cpuprofile-memprofile 標(biāo)志向指定文件寫入 CPU 或 內(nèi)存使用情況報(bào)告。

使用方式:go test -x -v -cpuprofile=prof.out -file x_test.go

編譯執(zhí)行 x_test.go 中的測(cè)試,并向 prof.out 文件中寫入 cpu 性能分析信息。

13.10.3 用 pprof 調(diào)試

你可以在單機(jī)程序 progexec 中引入 runtime/pprof 包;這個(gè)包以 pprof 可視化工具需要的格式寫入運(yùn)行時(shí)報(bào)告數(shù)據(jù)。對(duì)于 CPU 性能分析來說你需要添加一些代碼:

var cpuprofile = flag.String("cpuprofile", "", "write cpu profile to file")

func main() {
    flag.Parse()
    if *cpuprofile != "" {
        f, err := os.Create(*cpuprofile)
        if err != nil {
            log.Fatal(err)
        }
        pprof.StartCPUProfile(f)
        defer pprof.StopCPUProfile()
    }
...

代碼定義了一個(gè)名為 cpuprofile 的 flag,調(diào)用 Go flag 庫來解析命令行 flag,如果命令行設(shè)置了 cpuprofile flag,則開始 CPU 性能分析并把結(jié)果重定向到那個(gè)文件。(os.Create 用拿到的名字創(chuàng)建了用來寫入分析數(shù)據(jù)的文件)。這個(gè)分析程序最后需要在程序退出之前調(diào)用 StopCPUProfile 來刷新掛起的寫操作到文件中;我們用 defer 來保證這一切會(huì)在 main 返回時(shí)觸發(fā)。

現(xiàn)在用這個(gè) flag 運(yùn)行程序:progexec -cpuprofile=progexec.prof

然后可以像這樣用 gopprof 工具:gopprof progexec progexec.prof

gopprof 程序是 Google pprofC++ 分析器的一個(gè)輕微變種;關(guān)于此工具更多的信息,參見https://github.com/gperftools/gperftools

如果開啟了 CPU 性能分析,Go 程序會(huì)以大約每秒 100 次的頻率阻塞,并記錄當(dāng)前執(zhí)行的 goroutine 棧上的程序計(jì)數(shù)器樣本。

此工具一些有趣的命令:

1)topN

用來展示分析結(jié)果中最開頭的 N 份樣本,例如:top5 它會(huì)展示在程序運(yùn)行期間調(diào)用最頻繁的 5 個(gè)函數(shù),輸出如下:

Total: 3099 samples
626 20.2% 20.2% 626 20.2% scanblock
309 10.0% 30.2% 2839 91.6% main.FindLoops
...

第 5 列表示函數(shù)的調(diào)用頻度。

2)webweb 函數(shù)名

該命令生成一份 SVG 格式的分析數(shù)據(jù)圖表,并在網(wǎng)絡(luò)瀏覽器中打開它(還有一個(gè) gv 命令可以生成 PostScript 格式的數(shù)據(jù),并在 GhostView 中打開,這個(gè)命令需要安裝 graphviz)。函數(shù)被表示成不同的矩形(被調(diào)用越多,矩形越大),箭頭指示函數(shù)調(diào)用鏈。

3)list 函數(shù)名weblist 函數(shù)名

展示對(duì)應(yīng)函數(shù)名的代碼行列表,第 2 列表示當(dāng)前行執(zhí)行消耗的時(shí)間,這樣就很好地指出了運(yùn)行過程中消耗最大的代碼。

如果發(fā)現(xiàn)函數(shù) runtime.mallocgc(分配內(nèi)存并執(zhí)行周期性的垃圾回收)調(diào)用頻繁,那么是應(yīng)該進(jìn)行內(nèi)存分析的時(shí)候了。找出垃圾回收頻繁執(zhí)行的原因,和內(nèi)存大量分配的根源。

為了做到這一點(diǎn)必須在合適的地方添加下面的代碼:

var memprofile = flag.String("memprofile", "", "write memory profile to this file")
...

CallToFunctionWhichAllocatesLotsOfMemory()
if *memprofile != "" {
    f, err := os.Create(*memprofile)
    if err != nil {
        log.Fatal(err)
    }
    pprof.WriteHeapProfile(f)
    f.Close()
    return
}

用 -memprofile flag 運(yùn)行這個(gè)程序:progexec -memprofile=progexec.mprof

然后你可以像這樣再次使用 gopprof 工具:gopprof progexec progexec.mprof

top5,list 函數(shù)名 等命令同樣適用,只不過現(xiàn)在是以 Mb 為單位測(cè)量內(nèi)存分配情況,這是 top 命令輸出的例子:

Total: 118.3 MB
    66.1 55.8% 55.8% 103.7 87.7% main.FindLoops
    30.5 25.8% 81.6% 30.5 25.8% main.*LSG·NewLoop
    ...

從第 1 列可以看出,最上面的函數(shù)占用了最多的內(nèi)存。

同樣有一個(gè)報(bào)告內(nèi)存分配計(jì)數(shù)的有趣工具:

gopprof --inuse_objects progexec progexec.mprof

對(duì)于 web 應(yīng)用來說,有標(biāo)準(zhǔn)的 HTTP 接口可以分析數(shù)據(jù)。在 HTTP 服務(wù)中添加

import _ "http/pprof"

會(huì)為 /debug/pprof/ 下的一些 URL 安裝處理器。然后你可以用一個(gè)唯一的參數(shù)——你服務(wù)中的分析數(shù)據(jù)的 URL 來執(zhí)行 gopprof 命令——它會(huì)下載并執(zhí)行在線分析。

gopprof http://localhost:6060/debug/pprof/profile # 30-second CPU profile
gopprof http://localhost:6060/debug/pprof/heap # heap profile

在 Go-blog(引用 15)中有一篇很好的文章用具體的例子進(jìn)行了分析:分析 Go 程序(2011年6月)。

鏈接