“めったにない安値”が見抜ける⁉︎正規分布と区間推定の実践的な使い方をわかりやすく解説!

"めったにない安値"が見抜ける⁉︎正規分布と区間推定の実践的な使い方をわかりやすく解説! 統計

「今、株価がすごく下がっているからお買い得かも!」

このように「もう下がらないだろうから買っておこう」と思って株を購入したことがある人も多いのではないでしょうか?

しかし、「もう下がらないだろう」と思って購入した株の値段が、その後も下がり続けてしまうこともよく起こりますよね。

「株価が下がっているからチャンス」
「もう下がらないだろうから買っておこう」

この「安くなっている」というのを直感で決めて売買のタイミングを測るのは、見知らぬ街で地図を見ずに移動するようなものです。

そこで役に立つのが、統計学の「正規分布」「区間推定」です。

今回は、データ分析でよく活用される「正規分布」と「区間推定」を使って、現在の株価が”単なる日常的な値動きの範囲内”なのか、それとも”めったにない安値”なのかを数学的に見抜く方法をわかりやすく解説します!

1. 「正規分布」とは?

「正規分布とは」のイメージ画像

まずは、「正規分布」について解説します。

正規分布とは、データが平均値の周辺に最も多く集まり、そこから離れるにつれて徐々に少なくなる、左右対称のなめらかなベル型(釣り鐘型)の分布のことです。

正規分布は統計学において最も実用上重要な分布で、推定や検定などを行う際にはデータが正規分布に従うという仮定を置くことがしばしばあります。

自然界や人間社会の中で起こる数多くの現象が、この正規分布の形に当てはまると言われているからです。

たとえば、全国の高校生の身長をグラフにすると、平均の周辺に多くの人が集まり、極端に背が高い人や低い人は少なくなっていきますよね。

これをグラフに表すと、綺麗な山型になります。

株式投資における「日々の株価の変動(リターン)」も、完璧ではありませんがこの正規分布に近い動きをすることが知られています。

つまり、この法則を利用することで、「普段の株価の動き」と「異常な株価の動き」を区別できるようになります。

2. データの散らばりを測る「標準偏差」と「95%」

正規分布に欠かせないのが、「標準偏差(シグマ:σ)」という概念です。

標準偏差とは、「データが平均値からどれくらい散らばっているか」を示す代表的な指標です。

正規分布に従うデータには、平均値を中心として標準偏差の何倍離れているかによって、そこに含まれるデータの割合がピタリと決まるという法則があります。

  • 1シグマ区間(平均 ± 1倍の標準偏差): 全体の約68%のデータが収まる
  • 2シグマ区間(平均 ± 2倍の標準偏差): 全体の約95%のデータが収まる
  • 3シグマ区間(平均 ± 3倍の標準偏差): 全体の約99.7%のデータが収まる

ここで注目するのが「2シグマ区間(約95%)」で、日常の株価の動きの95%はこの範囲内に収まるとされています。

95%正規分布の特徴を解説する画像

逆に言えば、この「平均 ± 2倍の標準偏差」の枠から外れたデータは、「100回のうち5回しか起きない(5%)」という、かなり「めったにない出来事」だと判断できます。

3. 「点」ではなく「幅」で捉える!区間推定の考え方

とはいえ、私たちが手に入れられる過去の株価データは、あくまで過去の一定期間という全体の一部に過ぎませんよね。

なので、そこから背後にある本当のデータ(母集団)を推測する必要があります。

母集団の本当の平均などを推測するとき、それを「ある一つの値」で指定して当てようとする方法を「点推定」と呼びます。

しかし、現実のデータ分析において、点推定にはどうしてもある程度の誤差が伴ってしまいます。

そこで、最初からある程度の誤差を認めた上で、「本当の値はこの区間(幅)に入っているだろう」と確率的に推測する「区間推定」を使います。

区間推定とは、真の母数の値が、ある区間(下限L, 上限U)に入る確率が一定の割合(例えば 1 – α )以上になるように保証する方法です。

この考え方を株価の変動に応用してみましょう。

過去のデータから「平均」と「標準偏差」を算出し、そこから「95%の確率で現在の株価が収まるであろう”いつもの変動幅”」を計算します。

この幅を基準にすることで、現在の価格が異常値かどうかを客観的に見抜くことが可能になります。

4. 実践編:株価データで「めったにない安値」を判定しよう

では、実際に株価データを使って「めったにない安値」を見抜く具体的な手順を見ていきましょう。

ステップ1:過去データの収集と基本計算

まずは、分析したい銘柄の過去データ(たとえば過去100日間の終値など)を集め、そのデータの「平均値」と「標準偏差」を計算します。

今回の場合、過去データから計算したA社株の平均値が「1,000円」、標準偏差が「50円」だったとします。

実際のデータを元にした平均や標準偏差の手計算では大変ですが、Excelなどの表計算ソフトを使えば簡単に計算を行うことができます。

ステップ2:95%の「いつもの範囲」を計算する

次に、計算した平均値と標準偏差を使って、「普段ならこの範囲に収まるだろう」という95%の変動幅のラインを計算します。

  • 下限ライン = (平均値) - 2 × (標準偏差)
  • 上限ライン = (平均値) + 2 × (標準偏差)
ふぁい
ふぁい

厳密な統計学の計算では、95%区間を表すために「1.96」という係数を使いますが、実践的な目安としては「約2倍」と覚えておけば十分機能します。

A社株の平均値は「1,000円」で標準偏差が「50円」なので、いつもの変動幅(95%の範囲)は以下のようになります。

正規分布の実際の使用例の画像
  • 下限ライン:1000 - 2 × 50 = 900円
  • 上限ライン:1000 + 2 × 50 = 1100円

ステップ3:現在の株価と照らし合わせる

もし現在、A社の株価が「850円」まで下がっていたらどうでしょうか?

株価が95%正規分布の外にある(異常な値)場合の解説画像

これは、95%の確率で収まるはずの「900円〜1100円」という枠を完全に下に突き抜けています。

つまり、統計学的に見て「100回のうち5回しか起きないレベルの異常な安値(安く売られすぎている状態)」であり、絶好の買い時の可能性が高いと判断できます!

今回は安値の解説でしたが、もちろん売る場合に「この高値は普通の範囲内なのか」もこの方法で調べることができます。

このように、直感ではなく統計データをもとに株の売り時・買い時を決めることができます。

5. 精度を上げるなら「n-1」で割る計算を意識しよう

標準偏差を計算する際、注意が必要なポイントが1点あります。

それは、「手元の過去データ(標本)から、相場全体(母集団)の本当のばらつきを推測している」という点です。

手元のデータの個数「n」でそのまま割ってばらつきを計算してしまうと、相場全体の本当のばらつきよりも少しだけ小さく見積もってしまう数学的な傾向があります。

そのため、真の姿をより正しく推測するためには、計算の分母を「n」から1を引いた「n-1」にして補正を行う必要があります。

この「n-1」で割る計算は、統計学の世界基準では「標本分散(Sample Variance)」と呼ばれ、現在のデータサイエンスや投資の実務において標準的に使われている手法です。

実践的なデータ分析では非常に重要なポイントですので、ぜひ覚えておいてください。

6. まとめ

「正規分布」と「区間推定」を活用することで、「何となく安い気がする」という直感を取り払い、データに基づいた冷静な投資判断ができるようになります。

しかし、相場に「絶対」はなく、例えば企業の業績悪化や不祥事、経済全体の大きな構造変化が起きた場合は、正規分布の前提そのものが崩れ、株価が下限ラインを超えて下落し続けることもあります。

このように、統計データはあくまで過去の軌跡であり、未来を100%保証するものではありません。

とはいえ、自分の中のなんとなくの直感に委ねるよりも、統計学というデータを元にした強力な裏付けを持つことで、損をするリスクを下げる投資行動がとれるようになります。

ぜひ、ご自身の気になる銘柄で「95%の枠」を計算し、日々の相場分析に役立ててみてください!

コメント