文字の出現頻度

文字の出現頻度（もじのしゅつげんひんど、英: Letter frequency）とは、書記言語においてアルファベット（ひらがな、漢字）などの文字が出現する回数の平均をまとめたものを指す。文字の頻度分析はアラブ人数学者のアル＝キンディー（801–873）が暗号解読を行うために確立したことから始まる^[1]。またヨーロッパにおいては文字の頻度分析は1450年に活字が発明され、活字に必要な各字形の量を推定するために重要性を増した^[2]。一方言語学者の間では未知の表記体系に対する言語同定の技法として文字の頻度分析を行っている^[3]。

文字の出現頻度や頻度分析は暗号文やハングマン、スクラブル、Wordleのような単語パズルゲームにおいて利用されており^[4]、米国のテレビ番組『ホイール・オブ・フォーチュン』においても利用されている^[5]。エドガー・アラン・ポーの小説『黄金虫』では英文字の出現頻度の知見を活かして暗号文の解読を行った記述がある古い文献の一つであり^[6]、キャプテン・キッド秘蔵の財宝のありかを示すメッセージを頻度分析により解読している^[7]。

ハーバード・ジムは暗号学入門著書『Codes and Secret Writing』において英語の出現頻度は "ETAON RISHD LFCMU GYPWB VKJXZQ" の順序で出現頻度が高いとし、2文字（連接文字）に関しては "TH HE AN RE ER IN ON AT ND ST ES EN OF TE ED OR TI HI AS TO"、同じ文字が連続して出現する順序は "LL EE SS OO TT FF RR NN PP CC" である^[8]。なお、出現頻度の加算方法の違いによって数値は多少変動する場合がある。

文字の出現頻度は一部のキーボード配列のデザインにも影響を与えている^[9]。ブリッケンデルファー型タイプライターやDvorak配列、Colemak配列などは出現頻度の高い文字をホームポジションに配置している^[10]。

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

[10]

順位	平仮名	度数	割合
1	の	1,918,313	9.262%	9.262
2	に	1,108,840	5.354%	5.354
3	た	1,067,566	5.155%	5.155
4	い	1,060,284	5.119%	5.119
5	は	937,811	4.528%	4.528
6	を	936,356	4.521%	4.521
7	と	927,938	4.480%	4.48
8	る	916,652	4.425%	4.425
9	が	860,742	4.156%	4.156
10	し	848,132	4.095%	4.095
11	で	764,834	3.693%	3.693
12	て	758,316	3.661%	3.661
13	な	720,156	3.477%	3.477
14	か	537,294	2.594%	2.594
15	っ	467,350	2.257%	2.257
16	れ	450,805	2.177%	2.177
17	ら	423,294	2.044%	2.044
18	も	396,142	1.913%	1.913
19	う	352,965	1.704%	1.704
20	す	340,654	1.645%	1.645
21	り	333,999	1.613%	1.613
22	こ	312,227	1.508%	1.508
23	だ	280,911	1.356%	1.356
24	ま	278,599	1.345%	1.345
25	さ	258,960	1.250%	1.25
26	き	233,505	1.127%	1.127
27	め	223,806	1.081%	1.081
28	く	221,960	1.072%	1.072
29	あ	204,256	0.986%	0.986
30	け	199,362	0.963%	0.963
31	ど	196,555	0.949%	0.949
32	ん	190,068	0.918%	0.918
33	え	163,664	0.790%	0.79
34	よ	154,206	0.745%	0.745
35	つ	153,999	0.744%	0.744
36	や	146,156	0.706%	0.706
37	そ	131,611	0.635%	0.635
38	わ	123,077	0.594%	0.594
39	ち	99,183	0.479%	0.479
40	み	89,264	0.431%	0.431
41	せ	83,444	0.403%	0.403
42	ろ	73,467	0.355%	0.355
43	ば	72,228	0.349%	0.349
44	お	65,870	0.318%	0.318
45	じ	56,857	0.275%	0.275
46	べ	56,005	0.270%	0.27
47	ず	53,256	0.257%	0.257
48	げ	49,126	0.237%	0.237
49	ほ	48,752	0.235%	0.235
50	へ	47,013	0.227%	0.227
51	び	32,312	0.156%	0.156
52	む	31,212	0.151%	0.151
53	ご	26,965	0.130%	0.13
54	ね	23,490	0.113%	0.113
55	ぶ	23,280	0.112%	0.112
56	ぐ	21,549	0.104%	0.104
57	ぎ	19,865	0.096%	0.096
58	ひ	19,148	0.092%	0.092
59	ょ	14,425	0.070%	0.07
60	づ	13,125	0.063%	0.063
61	ぼ	12,402	0.060%	0.06
62	ざ	12,108	0.058%	0.058
63	ふ	11,606	0.056%	0.056
64	ゃ	11,522	0.056%	0.056
65	ぞ	10,047	0.049%	0.049
66	ゆ	8,486	0.041%	0.041
67	ぜ	6,893	0.033%	0.033
68	ぬ	5,124	0.025%	0.025
69	ぱ	4,349	0.021%	0.021
70	ゅ	2,755	0.013%	0.013
71	ぴ	1,608	0.008%	0.008
72	ぽ	1,315	0.006%	0.006
73	ぷ	986	0.005%	0.005
74	ぺ	477	0.002%	0.002
75	ぁ	125	0.001%	0.001
76	ぇ	106	0.001%	0.001
77	ぢ	82	0.000%
78	ゑ	75	0.000%
79	ゐ	48	0.000%
80	ぉ	21	0.000%
81	ぃ	21	0.000%
82	ゎ	3	0.000%
83	ぅ	1	0.000%

順位	片仮名	度数	割合
1	ン	290,948	8.063%	8.063
2	ル	189,442	5.250%	5.25
3	ス	178,214	4.939%	4.939
4	ト	162,802	4.512%	4.512
5	ア	127,845	3.543%	3.543
6	イ	120,807	3.348%	3.348
7	ラ	117,203	3.248%	3.248
8	リ	106,744	2.958%	2.958
9	ク	98,209	2.722%	2.722
10	ッ	86,894	2.408%	2.408
11	カ	82,982	2.300%	2.3
12	シ	80,626	2.235%	2.235
13	タ	75,319	2.087%	2.087
14	ロ	75,301	2.087%	2.087
15	ド	74,257	2.058%	2.058
16	ジ	61,171	1.695%	1.695
17	フ	61,115	1.694%	1.694
18	レ	60,608	1.680%	1.68
19	メ	60,230	1.669%	1.669
20	コ	58,724	1.628%	1.628
21	マ	56,123	1.555%	1.555
22	プ	54,159	1.501%	1.501
23	テ	53,404	1.480%	1.48
24	ム	50,758	1.407%	1.407
25	チ	48,437	1.342%	1.342
26	バ	44,970	1.246%	1.246
27	ビ	44,462	1.232%	1.232
28	グ	40,433	1.121%	1.121
29	キ	39,608	1.098%	1.098
30	ウ	39,323	1.090%	1.09
31	サ	39,202	1.086%	1.086
32	ニ	38,711	1.073%	1.073
33	ナ	38,047	1.054%	1.054
34	エ	36,458	1.010%	1.01
35	ブ	35,920	0.995%	0.995
36	パ	35,416	0.982%	0.982
37	セ	34,883	0.967%	0.967
38	オ	34,718	0.962%	0.962
39	ィ	33,747	0.935%	0.935
40	デ	32,665	0.905%	0.905
41	ュ	32,616	0.904%	0.904
42	ミ	29,262	0.811%	0.811
43	ャ	28,144	0.780%	0.78
44	ボ	26,651	0.739%	0.739
45	ダ	26,396	0.732%	0.732
46	ツ	24,541	0.680%	0.68
47	ポ	23,742	0.658%	0.658
48	ベ	22,755	0.631%	0.631
49	ネ	22,462	0.623%	0.623
50	ガ	22,061	0.611%	0.611
51	ハ	21,839	0.605%	0.605
52	ワ	21,784	0.604%	0.604
53	ソ	20,784	0.576%	0.576
54	ケ	20,633	0.572%	0.572
55	モ	20,070	0.556%	0.556
56	ノ	19,572	0.542%	0.542
57	ズ	19,240	0.533%	0.533
58	ピ	18,692	0.518%	0.518
59	ホ	18,204	0.505%	0.505
60	ェ	17,817	0.494%	0.494
61	ョ	17,731	0.491%	0.491
62	ペ	14,881	0.412%	0.412
63	ゴ	13,931	0.386%	0.386
64	ヤ	12,526	0.347%	0.347
65	ギ	10,732	0.297%	0.297
66	ヨ	10,318	0.286%	0.286
67	ザ	10,144	0.281%	0.281
68	ァ	10,121	0.280%	0.28
69	ゼ	7,689	0.213%	0.213
70	ヒ	7,289	0.202%	0.202
71	ヘ	7,129	0.198%	0.198
72	ユ	6,653	0.184%	0.184
73	ゲ	6,481	0.180%	0.18
74	ォ	6,245	0.173%	0.173
75	ヌ	2,897	0.080%	0.08
76	ゾ	2,640	0.073%	0.073
77	ヴ	1,145	0.032%	0.032
78	ゥ	1,050	0.029%	0.029
79	ヂ	149	0.004%	0.004
80	ヅ	127	0.004%	0.004
81	ヲ	122	0.003%	0.003
82	ヱ	73	0.002%	0.002
83	ヰ	40	0.001%	0.001
84	ヵ	14	0.000%
85	ヮ	9	0.000%
86	ヶ	2	0.000%

調査年	文字種別出現頻度						詳細	出典
調査年	平仮名	片仮名	漢字	アルファベット	記号	数字	詳細	出典
1964年	56.0%	6.3%	35.9%	0.2%	1.6%		1964年当時の雑誌九十種に対する調査。総数83,923文字。	^[45]
1981年	40.2%	4.9%	40.7%	2.0%	8.3%	3.9%	1981年当時のRICOHが保有する事務文書に対する調査。総数76,100文字。	^[46]
1994年	35.7%	16.0%	26.9%	3.9%	17.6%		1994年当時の雑誌七十種に対する調査。総数2,116,736文字。	^[45]
2000年	34.06%	6.34%	41.46%	0.46%	15.58%	2.10%	1993年の新聞記事に対する調査。総数5,500万文字。	^[47]

文字	英語における相対出現頻度^[48]^[49]
A	8.2%	8.2
B	1.5%	1.5
C	2.8%	2.8
D	4.3%	4.3
E	12.7%	12.7
F	2.2%	2.2
G	2.0%	2
H	6.1%	6.1
I	7.0%	7
J	0.15%	0.15
K	0.77%	0.77
L	4.0%	4
M	2.4%	2.4
N	6.7%	6.7
O	7.5%	7.5
P	1.9%	1.9
Q	0.095%	0.095
R	6.0%	6
S	6.3%	6.3
T	9.1%	9.1
U	2.8%	2.8
V	0.98%	0.98
W	2.4%	2.4
X	0.15%	0.15
Y	2.0%	2
Z	0.074%	0.074

文字	英語^[61]	フランス語^[62]	ドイツ語^[63]	スペイン語^[64]	ポルトガル語^[65]	イタリア語^[66]	トルコ語^[67]	スウェーデン語^[68]	ポーランド語^[69]	オランダ語^[70]	デンマーク語^[71]	アイスランド語^[72]	フィンランド語^[73]	チェコ語^[74]	ハンガリー語^[75]	ウェールズ語^[76]	リトアニア語^[77]	スロベニア語^[78]	エスペラント語^[79]	ルーマニア語^[80]	マレー語^[81]	インドネシア語^[81]
a	8.672%	7.636%	6.516%	11.525%	14.634%	11.745%	11.920%	9.383%	8.965%	7.49%	6.025%	10.110%	12.217%	6.219%	8.89%	10.241%	11.191%	10.466%	11.71%	9.95%	19.9%	20.39%
b	1.485%	0.901%	1.886%	2.215%	1.043%	0.927%	2.844%	1.535%	1.482%	1.58%	2.000%	1.043%	0.281%	1.558%	1.94%	1.867%	1.484%	1.939%	1.08%	1.07%	3.2%	2.64%
c	3.424%	3.260%	2.732%	4.019%	3.882%	4.501%	0.963%	1.486%	3.988%	1.24%	0.565%	~0%	0.281%	1.607%	0.646%	1.776%	0.602%	0.662%	0.86%	5.28%	0.3%	0.76%
d	3.904%	3.669%	5.076%	5.010%	4.992%	3.736%	4.706%	4.702%	3.293%	5.93%	5.858%	1.575%	1.043%	3.602%	1.92%	5.136%	2.580%	3.390%	2.93%	3.45%	2.9%	5.00%
e	12.155%	14.715%	16.396%	13.702%	13.101%	11.792%	8.912%	10.149%	7.921%	18.91%	15.453%	6.418%	7.968%	7.695%	11.6%	8.116%	5.621%	10.707%	9.26%	11.47%	8.7%	8.28%
f	2.302%	1.066%	1.656%	0.692%	1.023%	1.153%	0.461%	2.027%	0.312%	0.81%	2.406%	3.013%	0.194%	0.273%	0.548%	2.675%	0.347%	0.110%	1.01%	1.18%	0.0%	0.21%
g	1.945%	0.866%	3.009%	1.768%	1.303%	1.644%	1.253%	2.862%	1.377%	3.40%	4.077%	4.241%	0.392%	0.273%	3.79%	3.412%	1.795%	1.638%	1.16%	0.99%	1.6%	3.66%
h	4.745%	0.937%	4.577%	1.973%	1.281%	0.136%	1.212%	2.090%	1.072%	2.38%	1.621%	1.871%	1.851%	1.271%	1.26%	1.479%	0.276%	1.047%	0.35%	0.47%	2.6%	2.74%
i	7.532%	7.529%	6.550%	6.247%	6.186%	10.143%	8.600%*	5.817%	8.286%	6.50%	6.000%	7.578%	10.817%	4.353%	4.25%	7.569%	12.959%	9.042%	10.40%	9.96%	8.0%	7.98%
j	0.187%	0.813%	0.268%	0.493%	0.379%	0.011%	0.034%	0.614%	2.343%	1.46%	0.730%	1.144%	2.042%	2.119%	1.48%	0.078%	2.338%	4.675%	3.40%	0.24%	1.9%	0.87%
k	0.600%	0.074%	1.417%	0.026%	0.015%	0.009%	4.683%	3.140%	3.411%	2.25%	3.395%	3.314%	4.973%	3.737%	4.85%	0.040%	4.171%	3.704%	4.22%	0.11%	5.8%	5.14%
l	4.237%	5.456%	3.437%	4.967%	2.779%	6.510%	5.922%	5.275%	2.136%	3.57%	5.229%	4.532%	5.761%	3.842%	6.71%	3.358%	3.502%	5.266%	5.73%	4.48%	3.8%	3.26%
m	2.647%	2.968%	2.534%	3.157%	4.738%	2.512%	3.752%	3.471%	2.911%	2.21%	3.237%	4.041%	3.202%	3.227%	3.82%	2.593%	3.579%	3.305%	3.29%	3.10%	3.5%	4.21%
n	7.337%	7.095%	9.776%	6.712%	4.446%	6.883%	7.487%	8.542%	5.600%	10.03%	7.240%	7.711%	8.826%	6.535%	6.82%	8.552%	5.144%	6.328%	8.04%	6.47%	9.3%	9.33%
o	7.377%	5.796%	2.594%	8.683%	9.735%	9.832%	2.476%	4.482%	7.590%	6.06%	4.636%	2.166%	5.614%	8.666%	3.65%	6.280%	6.743%	9.084%	8.44%	4.07%	1.3%	1.26%
p	2.124%	2.521%	0.670%	2.510%	2.523%	3.056%	0.886%	1.839%	3.101%	1.57%	1.756%	0.789%	1.842%	3.413%	0.48%	0.819%	2.734%	3.374%	2.60%	3.18%	4.5%	2.61%
q	0.110%	1.362%	0.018%	0.877%	1.204%	0.505%	0	0.020%	0.003%	0.009%	0.007%	0	0.013%	0.001%	~0%	0.004%	0.005%	0	5.63%	0.00%	0.0%	0.01%
r	6.625%	6.693%	7.003%	6.871%	6.530%	6.367%	6.722%	8.431%	4.571%	6.41%	8.956%	8.581%	2.872%	3.697%	2.65%	7.085%	5.669%	5.010%	0	6.82%	8.3%	4.64%
s	6.633%	7.948%	7.270%	7.977%	6.805%	4.981%	3.014%	6.590%	4.263%	3.73%	5.805%	5.630%	7.862%	4.516%	6.99%	2.854%	7.881%	5.053%	6.25%	4.40%	3.8%	4.15%
t	8.598%	7.244%	6.154%	4.632%	4.336%	5.623%	3.314%	7.691%	3.966%	6.79%	6.862%	4.953%	8.750%	5.727%	6.96%	1.842%	5.332%	4.329%	5.51%	6.04%	3.2%	5.58%
u	2.691%	6.311%	4.166%	3.927%	3.639%	2.813%	3.235%	1.919%	2.347%	1.99%	1.979%	4.562%	5.008%	3.144%	0.392%	2.723%	4.586%	1.879%	3.19%	6.20%	4.5%	4.62%
v	1.061%	1.838%	0.846%	1.138%	1.575%	2.097%	0.959%	2.415%	0.034%	2.85%	2.332%	2.437%	2.250%	4.662%	2.31%	0.052%	2.656%	3.764%	1.86%	1.23%	0.3%	0.18%
w	1.673%	0.049%	1.921%	0.027%	0.037%	0.033%	0	0.142%	4.549%	1.52%	0.069%	0	0.094%	0.009%	~0%	4.642%	0.037%	0	0	0.03%	0.3%	0.48%
x	0.202%	0.427%	0.034%	0.515%	0.453%	0.008%	0	0.159%	0.019%	0.036%	0.028%	0.046%	0.031%	0.076%	~0%	0.040%	0.073%	0	0	0.11%	0.0%	0.03%
y	1.551%	0.708%	0.039%	1.433%	0.006%	0.020%	3.336%	0.708%	3.857%	0.035%	0.698%	0.900%	1.745%	1.909%	2.56%	8.971%	1.433%	0	0	0.07%	1.9%	1.88%
z	0.132%	0.326%	1.134%	0.467%	0.470%	1.181%	1.500%	0.070%	5.620%	1.39%	0.034%	0	0.051%	2.199%	4.3%	0.009%	0.345%	2.103%	0.48%	0.71%	0.3%	0.04%
à	0.0005%	0.486%	0	~0%	0.072%	0.635%	0	0	0	0	0	0	0	0	0	0.000%	0.0003%	0	0	0	0	0
â	0.0006%	0.051%	0	0	0.562%	~0%	~0%	0	0	0	0	0	0	0	0	0.147%	0.0002%	0	0	0.91%	0	0
á	0.005%	0	0	0.502%	0.118%	0	0	0	0	0	0	1.799%	0	2.236%	3.44%	0.0002%	0.002%	0	0	0	0	0
å	0.0007%	0	0	0	0	0	0	1.34%	0	0	1.190%	~0%	0.003%	0	0	0	0.0002%	0	0	0	0	0
ä	0.002%	0	0.578%	0	0	0	0	1.80%	0	0	0	0	3.577%	0	0	0.001%	0.001%	0	0	0	0	0
ã	0.0005%	0	0	0	0.733%	0	0	0	0	0	0	0	0	0	0	0	0.0003%	0	0	0	0	0
ą	0.00009%	0	0	0	0	0	0	0	1.021%	0	0	0	0	0	0	0	0.542%	0	0	0	0	0
ā	0.002%	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.001%	0	0	0	0	0
ă	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.0002%	0	0	4.06%	0	0
æ	0.0008%	0	0	0	0	0	0	0	0	0	0.872%	0.867%	0	0	0	0	0.0002%	0	0	0	0	0
œ	0.00008%	0.018%	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0
ç	0.001%	0.085%	0	~0%	0.530%	0	1.156%	0	0	0	0	~0%	0	0	0	0	0.0004%	0	0	0	0	0
ć	0.0006%	0	0	0	0	0	0	0	0.448%	0	0	0	0	0	0	0	0.0003%	0	0	0	0	0
ĉ	0%	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.80%	0	0	0
č	0.0005%	0	0	0	0	0	0	0	0	0	0	0	0	0.949%	0	0	0.430%	1.483%	0	0	0	0
ch	0	0	0	0	0	0	0	0	0	0	0	0	0	1.171%	0	0.949%	0	0	0	0	0	0
ď	0	0	0	0	0	0	0	0	0	0	0	0	0	0.022%	0	0	0	0	0	0	0	0
dd	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	2.927%	0	0	0	0	0	0
ð	0.0004%	0	0	0	0	0	0	0	0	0	0	4.393%	0	0	0	0	0.0001%	0	0	0	0	0
è	0.002%	0.271%	0	~0%	0	0.263%	0	0	0	0	0	0	0	0	0	0.0005%	0.0004%	0	0	0	0	0
é	0.011%	1.504%	0	0.433%	0.337%	0	0	0	~0%	0	0	0.647%	0	1.335%	4.25%	0.0001%	0.004%	0	0	0	0	0
ê	0.0003%	0.218%	0	0	0.450%	~0%	0	0	0	0	0	0	0	0	0	0.026%	0.0001%	0	0	0	0	0
ë	0.0006%	0.008%	0	0	0	0	0	0	0	0	0	0	0	0	0	0.002%	0.0002%	0	0	0	0	0
ė	0.00005%	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	1.664%	0	0	0	0	0
ę	0.0001%	0	0	0	0	0	0	0	1.131%	0	0	0	0	0	0	0	0.172%	0	0	0	0	0
ě	0.00008%	0	0	0	0	0	0	0	0	0	0	0	0	1.646%	0	0	0	0	0	0	0	0
ē	0.0003%	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.0004%	0	0	0	0	0
ff	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.382%	0	0	0	0	0	0
ĝ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.74%	0	0	0
ğ	0.0001%	0	0	0	0	0	1.125%	0	0	0	0	0	0	0	0	0	0.0001%	0	0	0	0	0
ng	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.366%	0	0	0	0	0	0
ĥ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.04%	0	0	0
î	0.0002%	0.045%	0	0	0	~0%	~0%	0	0	0	0	0	0	0	0	0.008%	0.0001%	0	0	1.40%	0	0
ì	0.0001%	0	0	0	0	(0.030%)	0	0	0	0	0	0	0	0	0	0.0001%	0.0001%	0	0	0	0	0
í	0.003%	0	0	0.725%	0.132%	0.030%	0	0	0	0	0	1.570%	0	3.270%	0.47%	~0%	0.002%	0	0	0	0	0
ï	0.0002%	0.005%	0	0	0	0	0	0	0	0	0	0	0	0	0	0.008%	0	0	0	0	0	0
ı	0.0002%	0	0	0	0	0	5.114%*	0	0	0	0	0	0	0	0	0	0.0002%	0	0	0	0	0
į	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.485%	0	0	0	0	0
ī	0.0005%	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.0007%	0	0	0	0	0
ĵ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.12%	0	0	0
ł	0.0007%	0	0	0	0	0	0	0	1.746%	0	0	0	0	0	0	0	0.001%	0	0	0	0	0
ľ	0	0	0	0	0	0	0	0	0	0	0	0	0	~0%	0	0	0	0	0	0	0	0
ll	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	1.031%	0	0	0	0	0	0
ñ	0.0009%	0	0	0.311%	0	0	0	0	0	0	0	0	0	0	0	0	0.0005%	0	0	0	0	0
ń	0.0002%	0	0	0	0	0	0	0	0.185%	0	0	0	0	0	0	0	0.0003%	0	0	0	0	0
ň	0	0	0	0	0	0	0	0	0	0	0	0	0	0.081%	0	0	0	0	0	0	0	0
ņ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.0001%	0	0	0	0	0
ò	0.0002%	0	0	0	0	0.002%	0	0	0	0	0	0	0	0	0	0.0002%	0.0001%	0	0	0	0	0
ö	0.003%	0	0.443%	0	0	0	0.777%	1.31%	0	0	0	0.777%	0.444%	0	0.784%	0.002%	0.001%	0	0	0	0	0
ô	0.0005%	0.023%	0	0	0.635%	~0%	0	0	0	0	0	0	0	0	0	0.101%	0.0001%	0	0	0	0	0
ó	0.003%	0	0	0.827%	0.296%	~0%	0	0	0.823%	0	0	0.994%	0	0.031%	0.597%	0.0002%	0.002%	0	0	0	0	0
ő	0.00008%	0	0	0	0	0	0	0	0	0	0	0	0	0	0.823%	0	0	0	0	0	0	0
õ	0.00005%	0	0	0	0.040%	0	0	0	0	0	0	0	0	0	0	0	0.0001%	0	0	0	0	0
ø	0.001%	0	0	0	0	0	0	0	0	0	0.939%	0	0	0	0	0	0.0003%	0	0	0	0	0
ph	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.066%	0	0	0	0	0	0
ř	0.0001%	0	0	0	0	0	0	0	0	0	0	0	0	1.217%	0	0	0	0	0	0	0	0
rh	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.398%	0	0	0	0	0	0
ŝ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.38%	0	0	0
ş	0.0003%	0	0	0	0	0	1.780%	0	0	0	0	0	0	0	0	0	0.0003%	0	0	1.55%	0	0
ś	0.0003%	0	0	0	0	0	0	0	0.683%	0	0	0	0	0	0	0	0.0002%	0	0	0	0	0
š	0.0008%	0	0	0	0	0	0	0	0	0	0	0	~0%	0.805%	0	0	1.134%	0.996%	0	0	0	0
ß	0.0003%	0	0.307%	0	0	0	0	0	0	0	0	0	0	0	0	0	0.0002%	0	0	0	0	0
ť	0	0	0	0	0	0	0	0	0	0	0	0	0	0.043%	0	0	0	0	0	0	0	0
ț	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	1.00%	0	0
þ	0.0001%	0	0	0	0	0	0	0	0	0	0	1.455%	0	0	0	0	0	0	0	0	0	0
th	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	1.294%	0	0	0	0	0	0
ù	0.00008%	0.058%	0	0	0	(0.166%)	0	0	0	0	0	0	0	0	0	0.000%	0.0001%	0	0	0	0	0
ú	0.0008%	0	0	0.168%	0.207%	0.166%	0	0	0	0	0	0.613%	0	0.103%	0.098%	~0%	0.0005%	0	0	0	0	0
û	0.0001%	0.060%	0	0	0	~0%	~0%	0	0	0	0	0	0	0	0	0.003%	0	0	0	0	0	0
ü	0.003%	0	0.995%	0.012%	0.026%	0	1.854%	0	0	0	0	0	0	0	0.617%	0.002%	0.001%	0	0	0	0	0
ű	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.117%	0	0	0	0	0	0	0
ů	0	0	0	0	0	0	0	0	0	0	0	0	0	0.695%	0	0	0	0	0	0	0	0
ŭ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.52%	0	0	0
ų	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	1.2602%	0	0	0	0	0
ū	0.0007%	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.4079%	0	0	0	0	0
ẃ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	~0%	0	0	0	0	0	0
ẁ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	~0%	0	0	0	0	0	0
ŵ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.033%	0	0	0	0	0	0
ẅ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0.0006%	0	0	0	0	0	0
ỳ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	~0%	0	0	0	0	0	0
ý	0.0001%	0	0	~0%	0	0	0	0	0	0	0	0.228%	0	1.072%	0	~0%	0.0001%	0	0	0	0	0
ŷ	0	0	0	0	0	0	0	0	0	0	0	0	0	0	0	~0%	0	0	0	0	0	0
ÿ	0	~0%	0	0	0	0	0	0	0	0	0	0	0	0	0	0.0005%	0	0	0	0	0	0
ź	0	0	0	0	0	0	0	0	0.061%	0	0	0	0	0	0	0	0	0	0	0	0	0
ż	0.00009%	0	0	0	0	0	0	0	0.885%	0	0	0	0	0	0	0	0.0002%	0	0	0	0	0
ž	0.0003%	0	0	0	0	0	0	0	0	0	0	0	~0%	0.995%	0	0	0.797%	0.646%	0	0	0	0

言語	順序	言語系統	語派
英語	etaoin shrdlu	インド・ヨーロッパ語族	ゲルマン語派
フランス語^{[注釈 2]}	esait nrulo		ロマンス諸語
スペイン語	eaosr nidlc
ポルトガル語	aeosr indmu
イタリア語	eaion lrtsc
ドイツ語	enisr atdhu		ゲルマン語派
スウェーデン語	eantr slido
オランダ語^[84]	enati rodsl
ポーランド語	aoiez nscwr		スラヴ語派
トルコ語	aeinr lıdkm	アルタイ諸語	チュルク語族
フィンランド語	aitne sloku	ウラル語族	フィン・ウゴル語派
エスペラント語	aieon lsrtk	人工言語	主にロマンス諸語、ゲルマン語派の影響を受けている。

文字	ロシア語^[85]	マケドニア語^[86]	タジク語^[87]^[88]	ウクライナ語^[89]	カザフ語^[90]	セルビア語^[91]	シュグナン語^[92]	ルシャン語^[93]	ウズベク語^[94]	ブルガリア語^[95]	モンゴル語^[96]	ベラルーシ語^[97]	タタール語^[98]	キルギス語^[99]
А	7.50%	13.293%	16.54%	8.07%	12.796%	12.182%	11.100%	14.779%	15.203%	12.323%	12.098%	15.52%	11.006%	13.56%
Б	2.01%	1.434%	4.45%	1.77%	1.823%	1.590%	1.745%	1.742%	3.655%	1.533%	2.543%	1.78%	2.798%	3.32%
В	4.33%	4.343%	1.58%	5.35%	0.083%	3.636%	1.795%	1.667%	1.248%	4.449%	1.299%	2.90%	0.757%	0.06%
Г	1.72%	1.505%	1.87%	1.55%	1.339%	1.741%	0.914%	1.436%	3.462%	1.567%	6.464%	1.91%	2.913%	2.73%
Д	3.09%	3.911%	6.77%	3.38%	5.060%	3.719%	7.488%	6.909%	4.322%	3.526%	4.514%	2.72%	3.052%	4.10%
Е	8.50%	8.945%	2.13%	4.95%	8.391%	9.383%	3.103%	1.799%	1.711%	8.972%	0.375%	3.46%	7.218%	4.76%
Ё	0.20%	0	0.54%	0	0.002%	0	0	0	0.563%	0	0.134%	0.36%	0.000%	0.007%
Ж	1.01%	0.568%	0.07%	0.93%	1.095%	0.604%	0.085%	0.166%	0.523%	0.708%	1.732%	0.58%	0.065%	2.47%
З	1.48%	1.979%	2.43%	2.32%	1.624%	1.620%	1.814%	2.241%	1.627%	2.292%	1.036%	2.43%	1.485%	1.46%
И	7.09%	9.160%	7.35%	6.26%	1.285%	9.443%	8.332%	6.823%	13.813%	8.875%	4.474%	0.03%	4.438%	3.15%
Й	1.21%	0	0.71%	1.38%	1.743%	0	3.727%	3.940%	1.564%	0.590%	4.296%	1.20%	1.086%	2.18%
К	3.30%	3.672%	2.71%	3.54%	2.421%	3.748%	1.979%	1.917%	2.852%	3.390%	0.186%	3.35%	4.995%	6.90%
Л	4.96%	2.959%	1.24%	3.69%	5.670%	3.077%	2.073%	1.931%	6.072%	3.284%	6.160%	3.35%	6.516%	5.09%
М	3.10%	2.309%	4.19%	3.03%	3.025%	3.587%	3.664%	3.845%	3.415%	2.465%	2.241%	2.64%	2.997%	2.61%
Н	6.70%	7.077%	6.84%	6.81%	6.216%	5.268%	5.475%	5.437%	7.120%	7.136%	8.183%	6.31%	7.129%	6.38%
О	11.07%	10.679%	8.45%	9.42%	2.430%	9.907%	4.310%	4.540%	4.648%	9.079%	4.760%	3.41%	1.796%	3.52%
П	2.47%	2.926%	1.05%	2.90%	1.451%	2.780%	1.308%	1.504%	0.543%	2.928%	0.108%	2.49%	1.393%	2.88%
Р	4.33%	5.090%	7.35%	4.48%	5.972%	4.596%	4.971%	5.366%	5.740%	4.920%	5.289%	4.63%	6.818%	6.65%
С	4.97%	4.751%	2.74%	4.24%	4.016%	4.977%	2.587%	2.738%	2.623%	5.081%	2.984%	3.82%	2.834%	2.56%
Т	5.97%	7.462%	3.57%	5.35%	6.028%	4.215%	5.690%	5.092%	4.104%	7.604%	3.431%	3.45%	5.289%	5.70%
У	2.22%	2.262%	4.67%	3.36%	1.636%	4.640%	4.748%	5.843%	3.306%	1.312%	3.780%	2.48%	2.598%	4.15%
Ф	0.21%	0.347%	1.10%	0.28%	0.087%	0.184%	0.589%	1.242%	0.444%	0.210%	0.027%	0.18%	0.409%	0.06%
Х	0.95%	0.146%	1.54%	1.19%	0.157%	0.684%	2.431%	2.440%	0.703%	0.655%	4.830%	1.12%	0.722%	0.03%
Ц	0.39%	0.857%	0	0.83%	0.120%	0.713%	0.941%	0.638%	0.057%	0.595%	0.705%	2.31%	0.166%	0.003%
Ч	1.40%	0.925%	0.84%	1.41%	0.005%	1.077%	1.456%	1.403%	1.263%	1.338%	1.222%	1.42%	1.481%	1.20%
Ш	0.72%	0.916%	2.61%	0.76%	1.343%	1.206%	0.700%	0.660%	2.036%	0.615%	0.837%	1.02%	1.788%	1.61%
Щ	0.30%	0	0	0.56%	0.002%	0	0	0	0	0.612%	0.0003%	0	0.006%	0%
Ъ	0.02%	0	0.13%	0	0.008%	0	0	0	0.193%	1.832%	~0%	0.01%	0.109%	0%
Ы	2.36%	0	0	0	7.974%	0	0	0	0	0	1.246%	4.56%	5.522%	5.54%
Ь	1.84%	0	0	1.77%	0.037%	0	0	0	0.192%	0.014%	0.721%	1.18%	0.403%	0.007%
Э	0.36%	0	0.13%	0	0.045%	0	0	0	0.505%	0	7.612%	1.05%	0.293%	0.94%
Ю	0.47%	0	0.05%	0.93%	0.031%	0	0	0	0.216%	0.138%	0.240%	0.69%	0.189%	0.10%
Я	1.96%	0	0.58%	2.48%	0.343%	0	0	0	0.558%	1.957%	0.528%	3.16%	1.085%	0.12%
А̄	0	0	0	0	0	0	2.811%	3.036%	0	0	0	0	0	0
ә	0	0	0	0	0.777%	0	0	0	0	0	0	0	6.647%	0
В̌	0	0	0	0	0	0	2.658%	2.357%	0	0	0	0	0	0
Ѓ	0	0.106%	0	0	0	0	0	0	0	0	0	0	0	0
Ғ	0	0	0.23%	0	1.863%	0	0.489%	0.276%	0.435%	0	0	0	0	0
Г̌	0	0	0	0	0	0	0.414%	0.238%	0	0	0	0	0	0
Д̌	0	0	0	0	0	0	1.456%	1.251%	0	0	0	0	0	0

文字	アラビア語^[100]	ウイグル語^[101]^[102]	ペルシア語^[103]	ウルドゥー語^[104]	マレー語^[105]	シンド語^[106]
ا	12.50%	8.23%	19.979%	12.235%	15.127%	11.725%
آ	0.15%	0	0	0.472%	0	0
أ	2.89%	0	0	0	0	0
إ	1.00%	0	0	0	0	0
ب	4.67%	1.98%	5.495%	2.713%	3.838%	2.104%
ٻ	0	0	0	0	0	0.363%
ڀ	0	0	0	0	0	0.260%
پ	0	2.00%	0.826%	1.661%	0.701%	1.788%
ت	2.61%	4.84%	6.191%	3.848%	5.756%	3.228%
ٿ	0	0	0	0	0	0.845%
ٽ	0	0	0	0	0	0.818%
ٺ	0	0	0	0	0	0.268%
ٹ	0	0	0	0.764%	0	0
ث	0.87%	0	0.182%	0.127%	0.071%	0.113%
ج	1.23%	0.52%	1.325%	1.535%	2.386%	3.786%
ڄ	0	0	0	0	0	0.139%
جهہ	0	0	0	0	0	0.683%
ڃ	0	0	0	0	0	0.149%
چ	0	1.33%	0.462%	0.651%	0.437%	0.689%
ڇ	0	0	0	0	0	0.245%
ح	1.86%	0	1.187%	0.911%	0.477%	0.872%
خ	0.79%	0.68%	1.589%	0.641%	0.152%	0.587%
د	2.67%	2.70%	9.027%	2.601%	5.289%	2.538%
ڌ	0	0	0	0	0	0.486%
ڏ	0	0	0	0	0	0.817%
ڊ	0	0	0	0	0	0.352%
ڍ	0	0	0	0	0	0.091%
ڈ	0	0	0	0.333%	0	0
ذ	0.96%	0	0.260%	0.144%	0.041%	0.142%
ر	4.20%	5.28%	5.896%	6.668%	5.543%	5.968%
ڙ	0	0	0	0	0	0.624%
ڑ	0	0	0	0.260%	0	0
ز	0.52%	1.38%	2.721%	0.825%	0.122%	0.603%
ژ	0	0.02%	0.122%	0.005%	0.030%	0
س	2.47%	2.82%	2.181%	3.611%	5.503%	3.341%
ش	0.73%	2.34%	1.721%	0.967%	0.234%	0.883%
ص	1.04%	0	0.458%	0.595%	0.152%	0.500%
ض	0.44%	0	0.200%	0.260%	0.030%	0.183%
ط	0.50%	0	0.373%	0.401%	0.061%	0.322%
ظ	0.18%	0	0.137%	0.189%	0.010%	0.184%

文字	ヒンディー語における文字の出現頻度^[107]
ँ	0.30%	0.3
ं	3.44%	3.44
ः	0.01%	0.01
अ	1.01%	1.01
आ	0.66%	0.66
इ	0.31%	0.31
ई	0.20%	0.2
उ	0.78%	0.78
ऊ	0.05%	0.05
ऋ	0.00%
ए	1.34%	1.34
ऐ	0.03%	0.03
ऑ	0.03%	0.03
ओ	0.10%	0.1
औ	0.94%	0.94
क	7.14%	7.14
ख	0.70%	0.7
ग	1.31%	1.31
घ	0.20%	0.2
च	1.16%	1.16
छ	0.45%	0.45
ज	1.39%	1.39
झ	0.19%	0.19
ञ	0.01%	0.01
ट	0.57%	0.57
ठ	0.17%	0.17
ड	0.75%	0.75
ढ	0.09%	0.09
ण	0.13%	0.13
त	2.89%	2.89
थ	1.15%	1.15
द	1.68%	1.68
ध	0.36%	0.36
न	3.48%	3.48
प	2.66%	2.66
फ	0.35%	0.35
ब	1.78%	1.78
भ	0.67%	0.67
म	3.28%	3.28
य	2.20%	2.2

背景

日本語における文字の出現頻度

平仮名

片仮名

漢字

文字種別の出現頻度

英語における文字の出現頻度

文字の相対出現頻度

単語の頭文字・末尾の文字の相対出現頻度

ラテン文字を使用する言語における文字の相対出現頻度

出現頻度のランキング

キリル文字を使用する言語における相対出現頻度

アラビア文字を使用する言語における相対出現頻度

ブラーフミー系文字を使用する言語における文字の相対出現頻度

デーヴァナーガリーを使用する言語

ヒンディー語

ガルワーリー語

マラーティー語

ベンガル語

タイ語

ビルマ語

タミル語

シンハラ語

マラヤーラム語

カンナダ語

テルグ語

その他の言語における文字の相対出現頻度

ギリシア語

ヘブライ語

中国語

韓国語

台湾語

アムハラ語

ゴート語

関連の出現頻度

単語の出現頻度

ジップの法則

日本語

英語

数字の出現頻度

低価格帯

ベンフォードの法則

単語の長さ

実装

AWKによる頻度分析プログラム

説明

プログラム

脚注

参考文献

関連項目

外部リンク