關聯規則學習
維基百科,自由的 encyclopedia
關聯規則學習(英語:Association rule learning)是一種在大型資料庫中發現變數之間的有趣性關係的方法。它的目的是利用一些有趣性的量度來辨識資料庫中發現的強規則。[1] 基於強規則的概念,Rakesh Agrawal等人[2]引入了關聯規則以發現由超市的POS系統記錄的大批交易數據中產品之間的規律性。例如,從銷售數據中發現的規則 {洋蔥, 土豆}→{漢堡} 會表明如果顧客一起買洋蔥和土豆,他們也有可能買漢堡的肉。此類資訊可以作為做出促銷定價或產品置入等行銷活動決定的根據。除了上面購物籃分析(英語:market basket analysis)中的例子以外, 關聯規則如今還被用在許多應用領域中,包括網絡用法挖掘(英語:Web usage mining)、入侵檢測、連續生產(英語:Continuous production)及生物資訊科學中。與序列挖掘(英語:sequence mining)相比,關聯規則學習通常不考慮在事務中、或事務間的專案的順序。