度数分布

度数分布（どすうぶんぷ、英: Frequency Distribution）は、統計において標本として得たある変量の値のリストである。量の大小の順で並べ、各数値が現れた個数を表示する表（度数分布表）で示す^[1]。日本産業規格では、「特性値と、その度数または相対度数との関係を観測したもの」と定義している^[2]。

この記事は英語版の対応するページを翻訳することにより充実させることができます。（2024年5月）

翻訳前に重要な指示を読むには右にある[表示]をクリックしてください。

英語版記事を日本語へ機械翻訳したバージョン（Google翻訳）。
万が一翻訳の手がかりとして機械翻訳を用いた場合、翻訳者は必ず翻訳元原文を参照して機械翻訳の誤りを訂正し、正確な翻訳にしなければなりません。これが成されていない場合、記事は削除の方針G-3に基づき、削除される可能性があります。
信頼性が低いまたは低品質な文章を翻訳しないでください。もし可能ならば、文章を他言語版記事に示された文献で正しいかどうかを確認してください。
履歴継承を行うため、要約欄に翻訳元となった記事のページ名・版について記述する必要があります。記述方法については、Wikipedia:翻訳のガイドライン#要約欄への記入を参照ください。
翻訳後、{{翻訳告知|en|Frequency (statistics)|…}}をノートに追加することもできます。
Wikipedia:翻訳のガイドラインに、より詳細な翻訳の手順・指針についての説明があります。

例

例えば、100人がある文章に同意するかを5段階のリッカート尺度で回答したとする。このとき、1 は強く同意することを示し、5は全く同意しないことを示す。その回答群を度数分布で表すと次のようになる。

さらに見る 階級, 同意の度合 ...

階級	同意の度合	回答数
1	強く同意する	25
2	ある程度同意する	35
3	どちらとも言えない	20
4	ある程度同意できない	15
5	全く同意できない	5

この単純な表には2つの弱点がある。変量が連続的な値をとりうる場合や、変量が取りうる値の範囲が非常に広い場合、度数分布表の作成は難しくなり、分析に適さなくなる。そこで、これを若干修正した表の形態として、変量の値をある範囲で等間隔に区切る方法が取られる。例えば、生徒の身長の統計をとる場合、度数分布表は以下のようになる。

さらに見る 身長の範囲, 生徒数 ...

身長の範囲	生徒数	累積
135 - 150 cm	25	25
150 - 165 cm	35	60
165 - 180 cm	20	80
180 - 195 cm	20	100

Remove ads

応用

この節は検証可能な参考文献や出典が全く示されていないか、不十分です。 (2023年3月)

度数分布化されたデータは元のデータよりも扱いが容易である。度数分布から中央値、平均値、標準偏差を求める単純なアルゴリズムが存在する。

複数の度数分布間の差異と類似性の評価から仮説検定が考案された。この評価には代表値や平均の測定や統計的ばらつき（標準偏差や分散）の測定が関係する。

平均と中央値が異なる場合、度数分布に歪みがあると称する。度数分布の尖度とは、平均値への集中の度合であり、ヒストグラムで表した場合のグラフの尖り具合である。正規分布以上に尖っている場合を「急尖的; leptokurtic」と称し、逆の場合を「緩尖的; platykurtic」と称する。

度数分布は暗号解読での頻度解析にも使われる。これは文字の種類ごとの出現頻度と言語における文字種ごとの出現頻度から暗号を解読する手法である。

Remove ads

例

応用

脚注

参考文献

Wikiwand - on