異常檢測

在數據探勘中，異常檢測（英語：Anomaly detection）對不符合預期模式或數據集中其他專案的專案、事件或觀測值的辨識。^[1]通常異常專案會轉變成銀行欺詐（英語：bank fraud）、結構缺陷、醫療問題、文字錯誤等類型的問題。異常也被稱為離群值、新奇、噪聲、偏差和例外。^[2]

特別是在檢測濫用與網絡入侵時，有趣性對象往往不是罕見對象，但卻是超出預料的突發活動。這種模式不遵循通常統計定義中把異常點看作是罕見對象，於是許多異常檢測方法（特別是無監督的方法）將對此類數據失效，除非進行了合適的聚集。相反，聚類分析演算法可能可以檢測出這些模式形成的微聚類。^[3]

有三大類異常檢測方法。^[1] 在假設數據集中大多數實例都是正常的前提下，無監督異常檢測方法能通過尋找與其他數據最不匹配的實例來檢測出未標記測試數據的異常。監督式異常檢測方法需要一個已經被標記「正常」與「異常」的數據集，並涉及到訓練分類器（與許多其他的統計分類問題的關鍵區別是異常檢測的內在不均衡性）。半監督式異常檢測方法根據一個給定的正常訓練數據集建立一個表示正常行為的模型，然後檢測由學習模型生成的測試實例的可能性。

[1]

[2]

[3]

異常檢測

應用

熱門方法

數據安全方面的應用

軟件

參見

參考文獻

Wikiwand - on