安德森鳶尾花卉資料集
維基百科,自由的 encyclopedia
安德森鳶尾花卉資料集(英文:Anderson's Iris data set),也稱鳶尾花卉資料集(英文:Iris flower data set)或費雪鳶尾花卉資料集(英文:Fisher's Iris data set),是一種多重變數分析的資料集。它最初是埃德加·安德森從加拿大加斯帕半島的鳶尾屬花朵中提取的形態學變異資料[1],後由羅納德·費雪作為判別分析的一個例子[2],運用到統計學中。
其資料集包含了150個樣本,都屬於鳶尾屬下的3個亞屬,分別是山鳶尾、變色鳶尾和維吉尼亞鳶尾(英語:Virginia Iris)。每個樣本都包含4項特徵,即花萼和花瓣的長度和寬度,它們可用於樣本的定量分析。基於這些特徵,費雪發展了能夠確定其屬種的線性判別分析。