回帰分析のp値とt値を理解する|有意性の正しい見方と使い方

AI用語

回帰分析で頻繁に登場する「p値」と「t値」。
データ分析を行うときに必ず確認する項目ですが、実際にどう読み解けばよいのか迷う方も多いでしょう。
「p値が0.03だから有意」と言われても、それが何を意味するのか、どのように活用できるのかを理解するには、少しコツが必要です。

この記事では、回帰分析におけるp値とt値の意味・違い・使い方を、できるだけわかりやすく整理します。
特に「有意性」という言葉の正しい意味を知り、分析結果をより正確に読み取る力を身につけたい方に向けた内容です。


監修者プロフィール
森下浩志
日本最大級のAI情報プラットフォーム「romptn ai」編集長。著書に「0からはじめるStable Diffusion」「0からはじめるStable Diffusion モデル・拡張機能集編」など、AmazonベストセラーのAI関連書籍を多数執筆。AIにおける情報の非対称性を解消するための社内研修や出張講義も行う。

p値とt値の違いを一目で理解する比較表

まずはp値とt値の役割を整理しておきましょう。

項目p値(p-value)t値(t-statistic)
意味結果が偶然に出る確率係数が0でないかを表す数値
直感的理解小さいほど「偶然ではない」大きいほど「影響がある」
判断目安p < 0.05 で有意(偶然ではない)|t| ≧ 2 程度で有意の可能性
関係性t値が大きいほどp値は小さいp値が小さいほどt値は大きい

どちらも「この変数が結果に影響しているか」を判断するための統計的指標です。 p値とt値はセットで確認することで、分析結果の信頼性を把握できます。


p値が示す「有意性」の正しい理解

有意水準0.05は“絶対的な基準”ではない

p値が0.05未満だと「有意」と言われますが、これは統計上の便宜的な基準です。
「偶然で同じ結果が出る確率が5%以下なら、偶然ではないとみなそう」という取り決めに過ぎません。
したがってp=0.06でも「有意な傾向」と判断する場合もあります。

大規模データでは「有意=重要」とは限らない

サンプル数(n)が多いと、非常に小さな差でもp値が小さくなりがちです。
たとえば、n=10,000のデータで差が0.1%でもp<0.001になることがあります。
p値が小さくても、実際の効果が小さい場合は「意味のある差」とは言えません。

p値だけで判断しない

p値は「効果があるかどうか」を示すだけで、「どの程度の効果があるか」は教えてくれません。
分析ではp値に加えて効果量(effect size)信頼区間を確認し、結果をより立体的に解釈しましょう。


回帰分析の出力表を読むための基本

出力表の主な項目

項目意味
coef(係数)変数の影響度(プラス/マイナス)
std err(標準誤差)ばらつきの大きさ。小さいほど信頼性が高い
t係数が0でないかを検定する統計量
P>|t|p値。小さいほど偶然で起きた可能性が低い
[0.025, 0.975]95%信頼区間。真の値がこの範囲にある確率が高い

読むときの順番

  1. モデル全体の信頼性:F検定や決定係数(R²)で全体の妥当性を確認
  2. 各変数の有意性:t値・p値で「偶然ではないか」を判断
  3. 信頼区間:ゼロをまたいでいないか(安定性の確認)
  4. 効果量:係数の大きさ(実務的な影響)を評価

例:広告費と売上の関係を分析する場合

t=2.45, p=0.018 の場合、統計的には有意(偶然ではない)です。
ただし「売上+0.8%」という小さな影響なら、実務上の重要性は限定的かもしれません。
p値・t値だけでなく、結果のスケールと再現性をあわせて読むことが大切です。


分析結果を正しく活かすためのポイント

p値が小さい=強い効果とは限らない

p値は偶然かどうかの指標であり、効果の大きさを示すものではありません。
「有意である」ことと「重要である」ことを混同しないように注意しましょう。

p値が大きい=効果がないとも限らない

サンプル数が少ないと、効果があっても検出できないことがあります。
結果が有意でなくても、効果量や信頼区間を見て全体像を判断します。

「有意」だけで意思決定しない

分析の目的は「統計的に正しいことを言う」ではなく、「有用な示唆を得ること」です。
p値やt値はあくまで材料のひとつ。結果をどう活かすかは目的に合わせて考えましょう。


p値とt値を使いこなすために

レポートでは「結果→意味→次のアクション」で整理

統計結果を共有するときは、数字の羅列ではなく流れでまとめましょう。

段階書き方の例
結果広告費のp値は0.018で有意でした。
意味広告費が売上に正の影響を与える可能性があります。
次のアクション影響の大きさを検証し、最適な投資配分を検討します。

伝わる説明に変換する

統計的表現平易な言い換え
p=0.02偶然で起きる確率は約2%です。
t値が大きいこの要因の影響が明確に確認されました。
R²=0.7この分析で結果の約7割を説明できます。

理解を深めるための学び方

統計の考え方は、一度にすべてを覚える必要はありません。
実際にデータを使ってp値やt値を確認しながら、少しずつ「なぜこの数値が出るのか」を考えるのがおすすめです。
理解が深まるほど、数字の背景にあるストーリーが見えてきます。


よくある質問(FAQ)

Q1. p値が0.05を超えたら「意味がない」のでしょうか?

いいえ。p=0.06や0.07でも「偶然ではない」傾向を示す場合があります。 サンプルサイズや実際の効果の大きさと合わせて判断しましょう。

Q2. t値がマイナスになることはありますか?

あります。t値の符号は係数の符号と同じで、マイナスなら「負の影響(逆の関係)」を示します。 統計的には問題ありません。

Q3. F検定との違いは?

t検定(t値)は「個別の変数の影響」を確認するもので、 F検定は「モデル全体の有意性」を確認します。両方をあわせて見ると理解が深まります。


まとめ|p値とt値を正しく読み解くために

  • p値は「偶然で起きた可能性」、t値は「係数が0でない確からしさ」を示す
  • 「有意=重要」とは限らない。効果量・信頼区間もあわせて確認する
  • 結果をそのまま報告するのではなく、「意味」と「次の行動」に変換する

p値は確率、t値は確からしさ。理解すれば、分析がもっと面白くなります。

romptn ai厳選のおすすめ無料AIセミナーでは、AIの勉強法に不安を感じている方に向けた内容でオンラインセミナーを開催しています。

AIを使った副業の始め方や、収入を得るまでのロードマップについて解説しているほか、受講者の方には、ここでしか手に入らないおすすめのプロンプト集などの特典もプレゼント中です。

AIについて効率的に学ぶ方法や、業務での活用に関心がある方は、ぜひご参加ください。

\累計受講者10万人突破/