トップQs
タイムライン
チャット
視点
誤解を与える統計グラフ
ウィキペディアから
Remove ads
統計において、誤解を与える統計グラフ(ごかいをあたえるとうけいグラフ)もしくは歪められたグラフとは、データの事実を曲げて伝えかねないグラフである。これは統計の誤用であり、その結果として誤った結論が導かれる可能性がある。
![]() | この項目「誤解を与える統計グラフ」は翻訳されたばかりのものです。不自然あるいは曖昧な表現などが含まれる可能性があり、このままでは読みづらいかもしれません。(原文:en:Misleading graph 20:39, 18 Nov 2017 (UTC)) 修正、加筆に協力し、現在の表現をより自然な表現にして下さる方を求めています。ノートページや履歴も参照してください。(2017年11月) |
過度に複雑であったり、拙劣に構築されたグラフは誤解を招くおそれがある。たとえデータの特徴を正確に表示するように構築された時でさえも、グラフは異なる解釈で受け取られうる[1]。
誤解を与えるおそれのあるグラフは、データの適切な解釈を意図的に妨げようとしている場合や、グラフ作成ソフトに慣れていない、データを間違って解釈している、データが正確に伝わっていないなどの偶然的なものによる場合がある。このようなグラフはしばしば虚偽広告に用いられる。ダレル・ハフは誤解を与えるグラフについて最初に論じた著者の一人であり、1954年に出版された『統計でウソをつく法』の発行者である。
データの可視化の分野では、誤解を与えるグラフの作成を防いで情報を提示するためのやり方が述べられている。
Remove ads
誤解を与えるグラフの手法
要約
視点
It [a misleading graph] is vastly more effective, however, because it contains no adjectives or adverbs to spoil the illusion of objectivity, there's nothing anyone can pin on you.
過剰使用
必要ないグラフを使うことは、不要な混乱・解釈につながる可能性がある[2]。一般的にグラフに必要な説明が多いほど、グラフ自体の数は少なくなる。グラフは必ずしも表より情報を伝えられるとは限らない。
偏見のラベリング
偏見や含みを持つ言葉をグラフのタイトル、軸ラベル、説明文に使うことは、読み手に不適切なプライミング効果を与える可能性がある[3]。
円グラフ
- 大きさの異なる円グラフを比較することは、比較されている領域を正確に読み取ることができないため、誤解を与える可能性がある[4]。
- 認識するのが難しいほど細長い領域は、解釈するのが難しい場合がある。
- サンプル数が少ない場合、円グラフのラベルとしてパーセントを用いるのは、誤解を与える可能性がある[5]。
- 円グラフを3Dにしたり傾斜をつけたりすることで、透視効果の変形により解釈するのが難しくなる[6]。スライスの高さが変化する棒グラフにした円グラフは、読み手を混乱させる恐れがある。
円グラフの三次元化
円グラフの透視技法は、グラフを3Dに見せるために使われる。見た目をきれいにするなどの理由からしばしば使用されるが、3次元にすることはデータを読み取りやすくするわけではない。むしろ3次元に関わる透視効果の変形により解釈するのが難しくなっている。そのグラフの主眼となっているデータを表示するために使われない余計な次元を使うことは、円グラフに限らず一般的なグラフで推奨されないことである[7]。3Dの円グラフにおいては、見えている角度が原因となり、読み手に近いスライスの方が奥にあるスライスよりも大きいように見える[8]。
アメリカの著名な統計学者エドワード・タフトは、著書 The Visual Display of Quantitative Information において表が円グラフより好まれる理由をこう書いている。
多くの小さなデータセットでは表はグラフよりも優れている。表は物言わぬ円グラフよりも十中八九優れている。円グラフよりも悪いこともあることにはあるが、そのときは読み手は円グラフの内部と間の空間的な乱れの中にある量を比較するよう求められる。低いデータ密度のものが与えられ、視覚的な次元に沿って番号を並べることができない場合は、絶対に円グラフを使用しないでください。[9]。
不適切なスケーリング
絵文字を棒グラフで使用する場合、一様にスケーリングをするべきではない。なぜなら、知覚的に誤解を与えるグラフができてしまうからである[10]。高さや幅ではなく、絵文字の面積によって判断がされてしまう[11]。このスケーリングにより、差が2乗になってしまう。
絵文字の不適切なスケーリングの効果は、3次元でも同様であり、この場合、効果が3乗となる[12]。
![]() |
この架空のグラフで、3次元の絵文字の不適切なスケーリングの使用を見てみる。2001年のHome Salesが前年よりも大幅に増えたように見える。さらに度数の軸が与えられていないため、読み手は変化を定量化することができず、誤った変化の認識が残るだけである。2倍の倍率が、大きさとしては22 の4倍に見えるようになる。 |
さらに、不適切にスケーリングされた絵文字は、その物自体の大きさが実際に変化したという考えを読み手に残してしまう[13]。
対数スケール
対数スケールはデータを表現するのに非常に有効な手段であるが、対数目盛の概念を良く知らない読み手に対して、はっきりとラベル付けされていない状態で使うと、誤解を与えるおそれがある。対数目盛は、対数の底として選んだ数字のいくつによる累乗がデータの値になるのかをプロットする。底としてはe (2.71828...) や10が用いられる。例えばデータの値が10の場合は、対数目盛上は1となり、100000 (10^6)の場合は6となる。VEI (Log scales have common usage in some fields, including the VEI (火山爆発指数) や地震のリヒタースケール、天文学における星の大きさ、酸性・アルカリ性の溶液のpHなどいくつかの分野において、対数目盛は一般的に使われているが、データを目で見て即座に明らかでなくしてしまう効果もある。対数目盛が使われる理由は、グラフの作成者が同じ軸上に大きく異なるスケールのものを表示したいからであり、対数目盛がないと10^3 と 10^9 などの量を比較するのは視覚的な観点からすると実用的ではない。対数グラフだと明確にラベルされていない、もしくは対数目盛の知識を持っていない読み手に提示された対数グラフは、実際には大きく異なる大きさであるデータ値を、同じくらいの値に見えるような表現に一般的にはなってしまう。対数目盛を誤って使用すると大きく異なる値 (10と1万など) が近くに見える (対数目盛では10と1万は1と4になる)。小さな値の場合は負の値になる場合もある。
対数目盛を誤って使用すると、実際には指数関数的、非常に急速に高い値に向かって上昇する法則を持つ関係が線形関係にあるように見えてしまう。ほとんどユーモラスな表現であるが、「太いマーカーで書いた両対数プロットは何でも線形に見える」と言われている。
途中で切ったグラフ
途中で切ったグラフはy軸が0から始まらないグラフである。このグラフは比較的小さな変化を、重大な変化であるという印象に作り替えることができる。
このグラフは小さな違いを説明するのに有用である[14]。途中で切ることにより空間の節約にもなる。マイクロソフトのエクセルなどの商用ソフトウェアは、この例のように値が全て狭い範囲内にある場合、デフォルトにより切り捨てる傾向にある。
![]() |
![]() |
y軸の切断を示す方法はいくつかある。 |
軸の変更
目盛り無し
グラフの目盛りは差を誇張もしくは最小限にするためによく用いられる[15][16]。
不適当な間隔や単位
グラフで使われる間隔や単位は、変化の表現を創出もしくは緩和するために操作されている可能性がある。
データの省略
省略されたデータにより作成されたグラフは、結論の根拠となる情報を取り除いていることになる。
財務報告書においては、前向きな見通しとは関係のない負の結果やデータは排除され、より好都合な視覚的印象を作り出すことができる。
不適切な抽出
他のグラフに基づくグラフは、それらの提示内容を代表するものでなくてはならない。
抽出は例外を検索するときに有効に使うことができる。
第3の次元
情報を含まない余分な第3次元を使うのは、読み手を混乱させる可能性があるので、強く推奨しない。
- 第3次元は読み手を混乱させる可能性がある[6]。
- 同じ値であるが、遠近法により前にある青色の棒の方が、後ろにある緑の棒よりも大きく見える。
- 3次元で拡大縮小する場合、変化の効果は3乗される。
複雑性
グラフは統計データを容易に解釈するために作られるものである。しかし、複雑すぎるグラフはデータを分かりにくくし、解釈するのを難しくする可能性がある。
構成不足
構成が不充分なグラフは、データを識別して解釈するのを難しくする可能性がある。
Remove ads
歪みの測定
要約
視点
グラフが歪められているかどうかを判定し、その歪みを定量化するためのいくつかの方法が開発されている[17][18]。
嘘ファクター
高い嘘ファクター (>1) のグラフは、データの変化を誇張しているが、小さい嘘ファクター (>0, <1) のグラフは、データの変化を不明瞭にしている。完全に正確なグラフの嘘ファクターは1となる。
グラフ不一致指数
グラフ不一致指数 (graph discrepancy index、GDI)はグラフ歪み指数 (graph distortion index)とも呼ばれ、最初1998年にパウル・ヨハン・シュタインバルトにより提案された。GDIはマイナス100%から正の無限大の範囲で計算され、0%は、そのグラフは適切に構成されたことを示し、±5%の範囲より外のものは歪んでいるとみなされる。グラフの歪みの尺度としてGDIを用いる研究は、GDIが一貫性がなく不連続であることを発見し、比較のための測定としてのGDIを用いることを難しくした。
データインク比
データインク比は比較的高い必要があり、そうでなければそのグラフには不必要なグラフ要素がある可能性がある。
データ密度
データ密度は比較的高くなければならず、それ以外の場合は、データを表示するのに表を用いるのが適している[19]。
Remove ads
財務報告書やコーポレート・レポートでの使用法
グラフは財務データの要約と解釈に有用である[20]。グラフにより大きなデートセットの傾向を把握でき、専門家でない人もデータを解釈できるようになる[21]。
グラフは印象操作の1つの形として、企業の年次報告書でよく使われている[22]。アメリカ合衆国では、グラフはAU Section 550 Other Information in Documents Containing Audited Financial Statementsに該当するため、監査する必要がない。
発表されたいくつかの研究では、異なる国の異なる企業の企業報告書でのグラフの使用法を考察しており、これらの報告書内で不適切なデザイン、選択性、及び測定ゆがみが頻繁に使用されていることを発見している[23][24][25][26][27][28]。年次報告書に誤解を与えるグラフが存在することにより、基準を設定することが要求されている[29][30][31][32]。
研究により、財務的理解の水準が低い読み手が誤解を与えるグラフにより、誤った情報を受け取る可能性が高い一方で[33]、融資担当者などの財務的理解を持つ人でさえ、誤解する可能性があることが発見された[30]。
学術的研究
脚注
関連項目
外部リンク
Wikiwand - on
Seamless Wikipedia browsing. On steroids.
Remove ads