Loading AI tools
来自维基百科,自由的百科全书
在软件工程中,性能分析(performance analysis,也称为profiling),是以收集程序运行时信息为手段研究程序行为的分析方法,是一種動態程式分析的方法。
性能分析量測像是程式的空間或時間複雜度、特定指令的使用情形、函式呼叫的頻率及執行時間等。性能分析的目的在于决定程序的哪个部分应该被优化,从而提高程序的速度或者内存使用效率。
性能分析可以由程式的源代碼或是可執行檔進行。一般會使用稱為性能分析工具(profiler)的工具進行。性能分析工具會使用許多不同的技術,可能是以事件為基礎(Event-based)的、統計的、指令導向的、仿真的方法。性能分析工具常用在性能工程的过程中。
"若要了解程式行為,程式分析工具非常重要。電腦架構分析師需要這類工具來評估程式在新的系统结构中運作的情形。軟體撰寫者需要這類工具來分析程式,並分析出其中關鍵的區塊。編譯器撰寫者需要這類工具來評估其指令排程或分支預測演算法運作的情形" -- (ATOM, PLDI, '94)
性能分析工具使用广泛的技术手段收集数据,包括硬件中断、代码指令、作業系统hooking、CPU内置的性能计数寄存器,等等。
性能分析输出會是:
/* ------------ 源代碼------------------------- 發行次數 */
0001 IF X = "A" 0055
0002 THEN DO
0003 ADD 1 to XCOUNT 0032
0004 ELSE
0005 IF X = "B" 0055
早在1970年代,IBM System/360及IBM System/370的平台就有性能分析工具,一般是用計時器中斷在固定的時間紀錄程式狀態字(PSW)來偵測程式執行時的「過熱點」(hot spots)[来源请求]。這是早期使用抽樣方式進行性能分析的範例之一。在1974年時,指令集仿真器就允許完整的事件踪迹,以及其他性能監控的機能。
以性能分析工具為主的UNIX程式分析至少可以回溯到1979年,當時Unix系統有一個基礎工具prof,可以列出每一個函式,也列出此函式總共花了多少時間。1982年時gprof工具延伸此概念,可以列出完整的函式調用圖[1]。
1994年時,迪吉多的Amitabh Srivastava和Alan Eustace提出了描述ATOM的論文[2]。ATOM是一個平台,可以將程式配合其性能分析工具調整,在編譯期間,ATOM會在要分析的程式中加入程式碼,而加入的程式碼會輸出分析資料,這種修改程式,輸出自身分析資料的技術,稱為邏輯注入。
2004年時,gprof和ATOM論文都出現在前50個最具影響力的程式語言設計和實現會議(PLDI)論文中[3]。
一般性能分析器(flat profiler)根據函式呼叫計算平均的函式呼叫次數,而且不會根據被呼叫函數或是執行脈絡(context)細分函式呼叫次數。
函式調用圖性能分析器(call graph profiler)[4]會顯示函數被呼叫的次數及頻率,也會列出函式調用鏈(call-chains),有些軟體會列完整的調用鏈,有些不會。
输入敏感性能分析器(input-sensitive profiler)[5][6][7]将性能度量与输入工作负载特征(例如输入大小或输入值)相关联,相比于一般性能分析器或调用图分析器增加了一个维度。它会生成图表描述应用程序性能随其输入的变化情况。
性能分析器本身也是程式,可以在被分析程式執行時收集相關資訊,來分析該程式。根據收集到資訊的細微度,以及收集資訊的方式,可以分為事件為基礎的性能分析器,或是統計式的性能分析器。有些性能分析器為了收集資訊,會中斷程式的執行,因此在時間量測上有一定的解析度限制。
以下列出的程式語言有事件為基礎的性能分析器:
有些性能分析器是用取样的方式運作。取様式的性能分析器利用作業系統的中斷,在固定時間取様目的程式的调用栈。取様式的性能分析器在數值上較不精準,但對目的程式執行時間的影響最小,允許目的程式可以在接近全速的速度下運作。
所得到的資料不是精準值,只是統計上的近似值而已。「實際誤差的量一般會大於一個取樣時間。若某一數值是取様時間的n倍,其誤差約為n倍取样時間的平方根。」[8]
在實務上統計式的性能分析器會比其他的分析方式更能知道目的程式各部份占的比例,而且相較之下有較少的邊際效應(例如記憶體快取或是指令解碼的管道線等),由於統計式的性能分析器對程式執行速度的影響較小。因此可以偵測到一些其他方式偵測不到的問題。這種方式可以看出使用者模式及可中斷系統模式(例如系統呼叫)分別佔的時間。
不過由於系統程式需處理中斷,仍然會花一些CPU的執行周期,分散快取的讀取,而且無法分辨在不可中斷核心模式下的行為。
有些特製的硬體可以克服這類的問題:有些最近MIPS微理器中,JTAG介面有一個PCSAMPLE暫存器,可以用一種無法偵測到的方式來取様程式計數器。
最常用的統計式的性能分析器包括AMD的CodeAnalyst、蘋果公司的Shark(OSX)、oprofile(Linux)[來源請求]、Intel的VTune及Parallel Amplifier(Intel Parallel Studio的一部份)。
有些性能分析可以用插裝(也稱為邏輯注入)的方式處理目的程式,也就是在目的程式中加入額外指令來收集需要的資訊。
程式的插裝會影響程式的效能,可能會出現不精確的結果及 heisenbug(捉摸不定,不易重現的bug)。插裝一定會對程式執行有些影響,常見的情形是使程式變慢。不過插裝可以特定只針對部份程式,而且可以小心控制以使影響降到最低。其對於特定程式的影響是看插裝放置的位置,以及捕捉蹤跡(trace)的機制。有些處理器有硬體支持可以捕捉蹤跡,插裝可以只佔一個机器语言週期的時間。一般可以從結果中移除插裝的影響。
gprof是一個同時用插裝及取様的性能分析器的例子。插裝用來取得被呼叫函式的資訊,而實際花的時間則是由取様方式來獲得。
插裝是決定性能分析器可控制程度及時間解析度的關鍵。以下是一些方式的分類。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.