データを見る時に平均値、中央値、最頻値ってあるけど、どれを見ればいいの?
平均値ってよく聞くけど、信用していいの?
そのような疑問に脳神経外科専門医であるへなおがお答えします。
このブログでは脳神経外科医として20年以上多くの脳の病気と向き合い勤務医として働いてきた視点から、日常の様々なことを脳科学で解き明かし解説していきます。
基本的な知識についてはネット検索すれば数多く見つかると思いますので、ここでは自分の実際の経験をもとになるべく簡単な言葉で説明していきます。
この記事を読んでわかることはコレ!
- 多くの人を惑わせる「平均値」の意味をわかりやすく脳科学で説き明かします。
平均値、中央値、最頻値を知っておこう!
「平均値」の脳科学
- データをわかりやすくするために平均値は存在しています。
- しかし平均値が通用するのはデータが正規分布をとっている時だけです。
- 現代社会では多くの分野において一部だけが突出したベキ則が支配しています。
- ベキ則では平均値は何の意味も持ちません。
- 平均値という言葉を聞いた時にはその背後にある分布に注意してください。
テストで平均点をとった時に
そんな風に思っていませんか?
しかし実際の順位は真ん中よりも下だった…なんてことはよくある話です。
そう言ってクレームをつけてくる人がいるそうです。
情報があふれかえっている現代社会では、正しくデータを読み解かなければ、数値に振り回されて誤った判断をしてしまいます。
ですから少なくとも平均値、中央値、最頻値の3つはしっかりと押さえておいた方がよいでしょう。
平均値
平均値とは、すべてのデータの値を足してデータの個数で割った数値です。
平均値が信頼できるのは、その集団において値の偏(かたよ)りが少ない場合です。
テストで100点をとった人もいれば、0点をとった人もいて、点数にばらつきがある場合には平均点は信用できます。
しかしほとんどの人が100点をとっているようなテストでは、平均点は高値になってしまうので信用できません。
中央値
平均値と比べて中央値はあまり馴染みのない数値かもしれません。
中央値とは、集団のデータを小さい順に並べた時に中央に位置する数値です。
中央値は平均値と違って集団内の値の偏りの影響をあまり受けません。
まさに真ん中の数値なので中央値の点数をとっていれば真ん中にいると言っていいでしょう。
しかし中央値にも問題があります。
それはデータ全体の数値から算出される数値ではないので、経時的な変化で数値を比較する時には正しい評価が難しくなります。
最頻値
最頻値とは、データの中で最も出現頻度が高い数値です。
最頻値も中央値と同様に集団内の値の偏りの影響をあまり受けません。
もっとも多い数値なので、自分の実感に近い数値になりやすくなります。
年収のデータなどでは平均値や中央値よりも、実際の生活レベルに近い数値と感じられます。
最頻値の問題点としては、データの数が少ない場合にはあまり信頼できる数値とは言えなくなることです。
最頻値はデータ数が多いほど信頼性があがります。
しかしわたしたちが最も好んで使うのは圧倒的に平均値です。
なんでもかんでも平均値で理解しようとすると、当然混乱が生じて、時には平均値のワナにはまってだまされてしまう…なんてことも起きかねません。
平均値の危険なワナ
あなたはバスの乗っていたとしましょう。
そのバスにはあなたの他に49人の乗客が乗っています。
つまりバスの中にはあなたを含めて50人の乗客がいることになります。
次の停留所に着くと“日本で一番体重の重い人”が乗ってきました。
バスの乗客の平均体重はどのくらい変化するでしょうか?
5%でしょうか?
10%でしょうか?
偶然バスに乗り合わせた乗客50人の体重が50キロだったとしましょう。
つまり統計上の平均値も中央値も最頻値も50キロです。
そこに日本一体重の重い人…うわさでは300キロの人が加わります。
ざっと計算すると、バスの乗客の平均体重は55キロになります。
割合で言えば10%の上昇です。
この程度であれば想定内の数値と言えるでしょう。
では次の停留所で “日本一の資産家”が乗ってきた場合を考えてみましょう。
バスの乗客の平均資産額はどのくらい変化するでしょうか?
5%でしょうか?
10%でしょうか?
偶然バスに乗り合わせた乗客50人はそれぞれ500万円の資産を持っていたとしましょう。
ここでも統計上の平均値も中央値も最頻値も500万円ですべて同じ数値です。
そこに日本一の資産家である孫正義さんが加わります。
孫さんの総資産は約2兆円です。
バスの乗客の平均資産額はなんと約400億円に跳ね上がります。
割合で言えば約80万%の上昇です。
しかし中央値も最頻値も500万円のままです。
飛びぬけた資産を持つ1人が加わるだけで平均値はこれほどまでにがらりと変わってしまうのです。
こうなると「平均値」という言葉はもはやまったく意味をなさなくなってしまいます。
“平均値の危険なワナ”はわたしたちの生活のさまざまな場面に潜んでいます。
たとえば、水深の平均が1メートル以上ある川があったとしましょう。
その川は一見すると深そうには見えません。
ほとんどの場所では水深は数センチ程度しかありません。
しかし川の中央では流れが速く水深が10メートル近くあります。
それだけの深さがあれば溺(おぼ)れてしまうでしょう。
平均をもとに予測を立てていると、危険が隠されてしまい、時に命を落としかねない事態に巻き込まれてしまう可能性もあります。
平均値はその背後にある分布を覆(おおい)い隠してしまうのです。
“予測の脳科学”についてはこちらの記事もご参照ください。
参考専門家の予測は外れて当たり前?「予測」を脳科学で探る
専門家の予測はなぜ外れてばかりで当たらないのでしょう? そのような疑問に脳神経外科専門医であるへなおがお答えします。 このブログでは脳神経外科医として20年以上多くの脳の病 ...
続きを見る
夏の1日の平均紫外線量は健康に害をおよぼす数値では到底ありません。
しかしあなたが夏のあいだじゅう陽の射さないオフィスで過ごし、その後バカンスと言って真夏の海岸で何の対策もせずに1週間肌を焼いたとしたら、あなたは間違いなくトラブルを抱えることになるでしょう。
あなたが浴びた紫外線量は平均するときっとたいした数値にはならないはずです。
定期的にバカンスをとって肌を焼いている人が浴びる紫外線量には到底およびません。
しかしそれでもあなたは皮膚にトラブルを抱えることになるであろうことは容易に想像できるはずです。
平均値が通用しない現代社会
平均値、中央値、最頻値はなにも新しい用語ではありません。
昔から使われ数学的には理にかなった数値です。
“数学の脳科学”についてはこちらの記事もご参照ください。
参考数学の公式や数式を見るだけでなぜ苦手意識が湧き上がる?数学ができない人と得意な人の脳を探る
数学の公式や数式を見るだけで苦手意識が湧き上がるのはなぜなのでしょう? そのような疑問に脳神経外科専門医であるへなおがお答えします。 このブログでは脳神経外科医として20年 ...
続きを見る
しかし現代社会では新しい現象が次々と起こっていて、分布がどんどん偏(かたよ)った方向に進んでいます。
先ほどのバスのたとえで言うならば、ひとつ目の体重の話が今までの社会で、ふたつ目の資産の話が現代社会と言えるかもしれません。
現代社会で社、極端に大きい、あるいは小さい数値が散在して見られ、平均について語るのが適さないケースが増えているのです。
答えは、平均的なウェブサイトなど存在しません。
日本で人気のウェブサイトと言えば、Google、Yahoo!JAPAN、YouTube、Facebook、FC2、Amazon、Twitter、niconico、楽天…などでしょう。
このような聞き慣れたほんの少しのウェブサイトだけがユーザーの大半を引き付けているのに対して、無数にあるその他大勢のウェブサイトにはほんのわずかな人しか訪れません。
このようなきれいな正規分布になっていない、一部だけが突出している分布状態を、数学的には「ベキ則」と呼びます。
“ベキ則の脳科学”についてはこちらの記事もご参照ください。
参考ジンクスを破れなかった安倍首相の辞任を脳科学で探る
2020年に安倍首相が辞任したのにはジンクスが関係してるって本当なのでしょうか? そのような疑問に脳神経外科専門医であるへなおがお答えします。 このブログでは脳神経外科医と ...
続きを見る
ベキ則の社会では平均値の概念は何の意味も持ちません。
会社の平均的な規模はどのくらい?
ある都市の平均的な人口はどのくらい?
株価指数の1日の平均的な動きはどのくらい?
建設プロジェクトの平均的なコスト超過はどのくらい?
書籍の平均的な発行部数はどのくらい?
台風の平均的な被害額はどのくらい?
アプリの平均的なダウンロード数はどのくらい?
平均的なボーナスの金額はどのくらい?
お笑い芸人の平均的な収入はどのくらい?
これらはどれも算出しようとすればできないことはありません。
しかしそんなことをしても何の意味もありません。
どれもベキ則の分布が当てはまるからです。
あるひと握りのお笑い芸人だけが莫大なお金を稼いでいます。
一方で生活できるぎりぎりのお金しか稼げないお笑い芸人はごまんといるはずです。
しかしお笑い芸人の収入の平均値を算出すれば高額な数値が算出されてしまいます。
平均値だけを見れば、お笑い芸人は儲かる職業ということになるでしょう。
ではあなたは平均収入が高いからという理由だけで他人にお笑い芸人になることを勧めるでしょうか?
決してそんなことはしないはずです。
「平均値」にはご注意を!
ですから誰かが「平均値」という言葉を使った時にはぜひ注意してください。
その背後にあるデータの分布を探るべきです。
ひとつ目のバスの話と同じように、突出した一部が平均値にほぼ何の影響もおよぼさない分野では「平均値」という概念には意味があります。
しかしふたつ目のバスの話のように、突出した一部が他を大きく引き離している分野では「平均値」という言葉を使うのはやめた方がよいでしょう。
現代社会では「平均値」は平均であって平均ではないのです。
“「平均値」の脳科学”のまとめ
多くの人を惑わせる「平均値」の意味をわかりやすく脳科学で説き明かしてみました。
今回のまとめ
- データをわかりやすくするために平均値は存在しています。
- しかし平均値が通用するのはデータが正規分布をとっている時だけです。
- 現代社会では多くの分野において一部だけが突出したベキ則が支配しています。
- ベキ則では平均値は何の意味も持ちません。
- 平均値という言葉を聞いた時にはその背後にある分布に注意してください。
最後まで読んでくださりありがとうございました。
今後も長年勤めてきた脳神経外科医の視点からあなたのまわりのありふれた日常を脳科学で探り皆さんに情報を提供していきます。
最後にポチっとよろしくお願いします。