鍍金池/ 教程/ Linux/ iostat 監(jiān)視I/O子系統(tǒng)
進(jìn)程管理工具
objdump 二進(jìn)制文件分析
scp 跨機(jī)遠(yuǎn)程拷貝
crontab 定時任務(wù)
readelf elf文件格式分析
pstack 跟蹤進(jìn)程棧
系統(tǒng)管理及IPC資源管理
vmstat 監(jiān)視內(nèi)存使用情況
strace 跟蹤進(jìn)程中的系統(tǒng)調(diào)用
sar 找出系統(tǒng)瓶頸的利器
ipcs 查詢進(jìn)程間通信狀態(tài)
ps 進(jìn)程查看器
性能優(yōu)化
wget 文件下載
top linux下的任務(wù)管理器
磁盤管理
size 查看程序內(nèi)存映像大小
free 查詢可用內(nèi)存
文件及目錄管理
iostat 監(jiān)視I/O子系統(tǒng)
性能監(jiān)控
程序構(gòu)建
學(xué)會使用命令幫助
gdb 調(diào)試?yán)?/span>
網(wǎng)絡(luò)工具
nm 目標(biāo)文件格式分析
lsof 一切皆文件
用戶管理工具
程序調(diào)試
ldd 查看程序依賴庫
文本處理

iostat 監(jiān)視I/O子系統(tǒng)

iostat是I/O statistics(輸入/輸出統(tǒng)計(jì))的縮寫,用來動態(tài)監(jiān)視系統(tǒng)的磁盤操作活動。

命令格式

iostat[參數(shù)][時間][次數(shù)]

命令功能

通過iostat方便查看CPU、網(wǎng)卡、tty設(shè)備、磁盤、CD-ROM 等等設(shè)備的活動情況, 負(fù)載信息。

命令參數(shù)

  • -C 顯示CPU使用情況
  • -d 顯示磁盤使用情況
  • -k 以 KB 為單位顯示
  • -m 以 M 為單位顯示
  • -N 顯示磁盤陣列(LVM) 信息
  • -n 顯示NFS 使用情況
  • -p[磁盤] 顯示磁盤和分區(qū)的情況
  • -t 顯示終端和CPU的信息
  • -x 顯示詳細(xì)信息
  • -V 顯示版本信息

工具實(shí)例

實(shí)例1:顯示所有設(shè)備負(fù)載情況

/root$iostat
Linux 2.6.32-279.el6.x86_64 (colin)   07/16/2014      _x86_64_        (4 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
10.81    0.00   14.11    0.18    0.00   74.90

Device:            tps   Blk_read/s   Blk_wrtn/s   Blk_read   Blk_wrtn
sda               1.95         1.48        70.88    9145160  437100644
dm-0              3.08         0.55        24.34    3392770  150087080
dm-1              5.83         0.93        46.49    5714522  286724168
dm-2              0.01         0.00         0.05      23930     289288

cpu屬性值說明:

  • %user:CPU處在用戶模式下的時間百分比。
  • %nice:CPU處在帶NICE值的用戶模式下的時間百分比。
  • %system:CPU處在系統(tǒng)模式下的時間百分比。
  • %iowait:CPU等待輸入輸出完成時間的百分比。
  • %steal:管理程序維護(hù)另一個虛擬處理器時,虛擬CPU的無意識等待時間百分比。
  • %idle:CPU空閑時間百分比。

注:如果%iowait的值過高,表示硬盤存在I/O瓶頸,%idle值高,表示CPU較空閑,如果%idle值高但系統(tǒng)響應(yīng)慢時,有可能是CPU等待分配內(nèi)存,此時應(yīng)加大內(nèi)存容量。%idle值如果持續(xù)低于10,那么系統(tǒng)的CPU處理能力相對較低,表明系統(tǒng)中最需要解決的資源是CPU。

disk屬性值說明:

  • rrqm/s: 每秒進(jìn)行 merge 的讀操作數(shù)目。即 rmerge/s
  • wrqm/s: 每秒進(jìn)行 merge 的寫操作數(shù)目。即 wmerge/s
  • r/s: 每秒完成的讀 I/O 設(shè)備次數(shù)。即 rio/s
  • w/s: 每秒完成的寫 I/O 設(shè)備次數(shù)。即 wio/s
  • rsec/s: 每秒讀扇區(qū)數(shù)。即 rsect/s
  • wsec/s: 每秒寫扇區(qū)數(shù)。即 wsect/s
  • rkB/s: 每秒讀K字節(jié)數(shù)。是 rsect/s 的一半,因?yàn)槊可葏^(qū)大小為512字節(jié)。
  • wkB/s: 每秒寫K字節(jié)數(shù)。是 wsect/s 的一半。
  • avgrq-sz: 平均每次設(shè)備I/O操作的數(shù)據(jù)大小 (扇區(qū))。
  • avgqu-sz: 平均I/O隊(duì)列長度。
  • await: 平均每次設(shè)備I/O操作的等待時間 (毫秒)。
  • svctm: 平均每次設(shè)備I/O操作的服務(wù)時間 (毫秒)。
  • %util: 一秒中有百分之多少的時間用于 I/O 操作,即被io消耗的cpu百分比

備注:如果 %util 接近 100%,說明產(chǎn)生的I/O請求太多,I/O系統(tǒng)已經(jīng)滿負(fù)荷,該磁盤可能存在瓶頸。如果 svctm 比較接近 await,說明 I/O 幾乎沒有等待時間;如果 await 遠(yuǎn)大于 svctm,說明I/O 隊(duì)列太長,io響應(yīng)太慢,則需要進(jìn)行必要優(yōu)化。如果avgqu-sz比較大,也表示有當(dāng)量io在等待。

實(shí)例2:定時顯示所有信息

/root$iostat 2 3
Linux 2.6.32-279.el6.x86_64 (colin)   07/16/2014      _x86_64_        (4 CPU)

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
10.81    0.00   14.11    0.18    0.00   74.90

Device:            tps   Blk_read/s   Blk_wrtn/s   Blk_read   Blk_wrtn
sda               1.95         1.48        70.88    9145160  437106156
dm-0              3.08         0.55        24.34    3392770  150088376
dm-1              5.83         0.93        46.49    5714522  286728384
dm-2              0.01         0.00         0.05      23930     289288

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
22.62    0.00   19.67    0.26    0.00   57.46

Device:            tps   Blk_read/s   Blk_wrtn/s   Blk_read   Blk_wrtn
sda               2.50         0.00        28.00          0         56
dm-0              0.00         0.00         0.00          0          0
dm-1              3.50         0.00        28.00          0         56
dm-2              0.00         0.00         0.00          0          0

avg-cpu:  %user   %nice %system %iowait  %steal   %idle
22.69    0.00   19.62    0.00    0.00   57.69

Device:            tps   Blk_read/s   Blk_wrtn/s   Blk_read   Blk_wrtn
sda               0.00         0.00         0.00          0          0
dm-0              0.00         0.00         0.00          0          0
dm-1              0.00         0.00         0.00          0          0
dm-2              0.00         0.00         0.00          0          0

說明:每隔 2秒刷新顯示,且顯示3次

實(shí)例3:查看TPS和吞吐量

/root$iostat -d -k 1 1
Linux 2.6.32-279.el6.x86_64 (colin)   07/16/2014      _x86_64_        (4 CPU)

Device:            tps    kB_read/s    kB_wrtn/s    kB_read    kB_wrtn
sda               1.95         0.74        35.44    4572712  218559410
dm-0              3.08         0.28        12.17    1696513   75045968
dm-1              5.83         0.46        23.25    2857265  143368744
dm-2              0.01         0.00         0.02      11965     144644
  • tps:該設(shè)備每秒的傳輸次數(shù)(Indicate the number of transfers per second that were issued to the device.)?!耙淮蝹鬏敗币馑际恰耙淮蜪/O請求”。多個邏輯請求可能會被合并為“一次I/O請求”?!耙淮蝹鬏敗闭埱蟮拇笮∈俏粗?。
  • kB_read/s:每秒從設(shè)備(drive expressed)讀取的數(shù)據(jù)量;
  • kB_wrtn/s:每秒向設(shè)備(drive expressed)寫入的數(shù)據(jù)量;
  • kB_read:讀取的總數(shù)據(jù)量;kB_wrtn:寫入的總數(shù)量數(shù)據(jù)量;

這些單位都為Kilobytes。

上面的例子中,我們可以看到磁盤sda以及它的各個分區(qū)的統(tǒng)計(jì)數(shù)據(jù),當(dāng)時統(tǒng)計(jì)的磁盤總TPS是1.95,下面是各個分區(qū)的TPS。(因?yàn)槭撬查g值,所以總TPS并不嚴(yán)格等于各個分區(qū)TPS的總和)

實(shí)例4:查看設(shè)備使用率(%util)和響應(yīng)時間(await)

/root$iostat -d -x -k 1 1
Linux 2.6.32-279.el6.x86_64 (colin)   07/16/2014      _x86_64_        (4 CPU)

Device:         rrqm/s   wrqm/s     r/s     w/s    rkB/s    wkB/s avgrq-sz avgqu-sz   await  svctm  %util
sda               0.02     7.25    0.04    1.90     0.74    35.47    37.15     0.04   19.13   5.58   1.09
dm-0              0.00     0.00    0.04    3.05     0.28    12.18     8.07     0.65  209.01   1.11   0.34
dm-1              0.00     0.00    0.02    5.82     0.46    23.26     8.13     0.43   74.33   1.30   0.76
dm-2              0.00     0.00    0.00    0.01     0.00     0.02     8.00     0.00    5.41   3.28   0.00
  • rrqm/s: 每秒進(jìn)行 merge 的讀操作數(shù)目.即 delta(rmerge)/s
  • wrqm/s: 每秒進(jìn)行 merge 的寫操作數(shù)目.即 delta(wmerge)/s
  • r/s: 每秒完成的讀 I/O 設(shè)備次數(shù).即 delta(rio)/s
  • w/s: 每秒完成的寫 I/O 設(shè)備次數(shù).即 delta(wio)/s
  • rsec/s: 每秒讀扇區(qū)數(shù).即 delta(rsect)/s
  • wsec/s: 每秒寫扇區(qū)數(shù).即 delta(wsect)/s
  • rkB/s: 每秒讀K字節(jié)數(shù).是 rsect/s 的一半,因?yàn)槊可葏^(qū)大小為512字節(jié).(需要計(jì)算)
  • wkB/s: 每秒寫K字節(jié)數(shù).是 wsect/s 的一半.(需要計(jì)算)
  • avgrq-sz:平均每次設(shè)備I/O操作的數(shù)據(jù)大小 (扇區(qū)).delta(rsect+wsect)/delta(rio+wio)
  • avgqu-sz:平均I/O隊(duì)列長度.即 delta(aveq)/s/1000 (因?yàn)閍veq的單位為毫秒).
  • await: 平均每次設(shè)備I/O操作的等待時間 (毫秒).即 delta(ruse+wuse)/delta(rio+wio)
  • svctm: 平均每次設(shè)備I/O操作的服務(wù)時間 (毫秒).即 delta(use)/delta(rio+wio)
  • %util: 一秒中有百分之多少的時間用于 I/O 操作,或者說一秒中有多少時間 I/O 隊(duì)列是非空的,即 delta(use)/s/1000 (因?yàn)閡se的單位為毫秒)

如果 %util 接近 100%,說明產(chǎn)生的I/O請求太多,I/O系統(tǒng)已經(jīng)滿負(fù)荷,該磁盤可能存在瓶頸。 idle小于70% IO壓力就較大了,一般讀取速度有較多的wait。 同時可以結(jié)合vmstat 查看查看b參數(shù)(等待資源的進(jìn)程數(shù))和wa參數(shù)(IO等待所占用的CPU時間的百分比,高過30%時IO壓力高)。

另外 await 的參數(shù)也要多和 svctm 來參考。差的過高就一定有 IO 的問題。

avgqu-sz 也是個做 IO 調(diào)優(yōu)時需要注意的地方,這個就是直接每次操作的數(shù)據(jù)的大小,如果次數(shù)多,但數(shù)據(jù)拿的小的話,其實(shí) IO 也會很小。如果數(shù)據(jù)拿的大,才IO 的數(shù)據(jù)會高。也可以通過 avgqu-sz × ( r/s or w/s ) = rsec/s or wsec/s。也就是講,讀定速度是這個來決定的。

svctm 一般要小于 await (因?yàn)橥瑫r等待的請求的等待時間被重復(fù)計(jì)算了),svctm 的大小一般和磁盤性能有關(guān),CPU/內(nèi)存的負(fù)荷也會對其有影響,請求過多也會間接導(dǎo)致 svctm 的增加。await 的大小一般取決于服務(wù)時間(svctm) 以及 I/O 隊(duì)列的長度和 I/O 請求的發(fā)出模式。如果 svctm 比較接近 await,說明 I/O 幾乎沒有等待時間;如果 await 遠(yuǎn)大于 svctm,說明 I/O 隊(duì)列太長,應(yīng)用得到的響應(yīng)時間變慢,如果響應(yīng)時間超過了用戶可以容許的范圍,這時可以考慮更換更快的磁盤,調(diào)整內(nèi)核 elevator 算法,優(yōu)化應(yīng)用,或者升級 CPU。

隊(duì)列長度(avgqu-sz)也可作為衡量系統(tǒng) I/O 負(fù)荷的指標(biāo),但由于 avgqu-sz 是按照單位時間的平均值,所以不能反映瞬間的 I/O 洪水。

形象的比喻:

  • r/s+w/s 類似于交款人的總數(shù)
  • 平均隊(duì)列長度(avgqu-sz)類似于單位時間里平均排隊(duì)人的個數(shù)
  • 平均服務(wù)時間(svctm)類似于收銀員的收款速度
  • 平均等待時間(await)類似于平均每人的等待時間
  • 平均I/O數(shù)據(jù)(avgrq-sz)類似于平均每人所買的東西多少
  • I/O 操作率 (%util)類似于收款臺前有人排隊(duì)的時間比例

設(shè)備IO操作:總IO(io)/s = r/s(讀) +w/s(寫)

平均等待時間=單個I/O服務(wù)器時間*(1+2+...+請求總數(shù)-1)/請求總數(shù)

每秒發(fā)出的I/0請求很多,但是平均隊(duì)列就4,表示這些請求比較均勻,大部分處理還是比較及時。