
安德森鳶尾花卉資料集
維基百科,自由的 百科全書
安德森鳶尾花卉數據集(英文:Anderson's Iris data set),也稱鳶尾花卉數據集(英文:Iris flower data set)或費雪鳶尾花卉數據集(英文:Fisher's Iris data set),是一種多重變量分析的數據集。它最初是埃德加·安德森從加拿大加斯帕半島的鳶尾屬花朵中提取的形態學變異數據[1],後由羅納德·費雪作為判別分析的一個例子[2],運用到統計學中。

其數據集包含了150個樣本,都屬於鳶尾屬下的3個亞屬,分別是山鳶尾、變色鳶尾和維吉尼亞鳶尾(英語:Virginia Iris)。每個樣本都包含4項特征,即花萼和花瓣的長度和寬度,它們可用於樣本的定量分析。基於這些特征,費雪發展了能夠確定其屬種的線性判別分析。