口下手エンジニアの悪あがき

自動車エンジニアのつぶやき

QC検定2級 計量値の検定と推定(公式まとめ)

f:id:ganbaru_engineer:20191008003549j:plain

QC検定2級の「検定と推定」を勉強する中で、一番苦労したところは、この問題文にある検定はどの分布を使ったらいいんだろう?どの検定統計量を使えばいいんだろうということでした。

 

問題を解く中で、それぞれの問については、こういうときはこうする、と解答の中で書いているんですが、結局全体でどれだけパターンがあって、いくつある内のどれで解いてるのかと全体像が見えないことが非常にもどかしかったです。それらをササッと一覧で見えるようにしておきたい。一部の書籍には出ているようですが備忘録的に記しておきたいともいます。

 

 

 検定とは?

なるべくかみ砕いていうとこういうことかな、と思います。

設計や工程、材料などの「変更・改善」した後の分布を、「変更・改善」する前の分布であると仮定帰無仮説)したときに、「変更・改善」した後の母集団からサンプリングしたデータを観察すると、「変更・改善」する前の分布と仮定した条件のもとでは、確率的に起こってもおかしくないデータの分布であったか、それとも確率的には非常に起こりにくい(通常5%以下)データの分布であったかどうかを判断し、「変更・改善」前後のデータに差があると言えるかどうかを判定すること。つまり、行った「変更・改善」の効果がホントにあったのかどうかをデータに基づく事実により検証するということ。

 

用語として、

・「変更・改善」する前の分布だと仮定する条件を「帰無仮説H_0

・「帰無仮説」にあてはまらい条件で、分布に差があると証明したい条件を「対立仮説H_1

・確率的に起こりにくい領域を「棄却域」

・確率的に起こりにくい、と言える確率を「優位水準\alpha」(通常5%)

・確率的に起こってもおかしくない領域を「採択域」

という。

Python 3 入門 + 応用 +アメリカのシリコンバレー流コードスタイルを学ぶオンライン講座

推定とは?

「変更・改善」した後の平均値がどこにあるかを「点推定」。平均値の値ががある一定の確率の中に存在する範囲を求めることを「区間推定」(通常95%)

検定・推定の手順
  1. 帰無仮説の設定
  2. 対立仮説の設定
  3. 検定統計量を求める
  4. 対応する分布表から棄却域を求める
  5. 検定統計量と棄却域を比較し、入っているかどうか判断する
  6. 入っている場合は、帰無仮説を棄却し、対立仮説を採択→差があると言えると判定
  7. 入っていない場合は、帰無仮説を採択する→差があるとは言えないと判定
  8. 点推定:「変更・改善」した後の対象となる量(平均値、標準偏差など)を求める
  9. 区間推定:対象となる量が95%の確率で存在する範囲を求める

 

みんなのAI講座 ゼロからPythonで学ぶ人工知能と機械学習


1つの母集団について、基準値または従来との比較

①母分散の比較

  ・・・分布:\chi^2分布

\displaystyle {H_0:\sigma^2=\sigma^2_0 ~ ~ ~検定統計量:\chi^2_0 =\frac{S}{\sigma^2_0}}

点推定:\displaystyle{\widehat{\sigma^2}=V=\frac{S}{n-1}}

95%信頼区間\displaystyle {\chi^2(\phi,0.975)\le\frac{S}{\sigma^2}\le \chi^2(\phi,0.025)}

②母平均の比較

  ・・・σ:既知の場合、使用する分布:正規分布

\displaystyle {H_0:\mu=\mu_0 ~ ~ ~検定統計量:u_0 =\frac{\bar{x} - \mu_0}{\frac{\sigma}{\sqrt{n}}}}

点推定:\displaystyle {\hat{x}=\frac{\sum{x_i}}{n}}

95%信頼区間\displaystyle {\bar{x}\pm K_{\frac{0.05}{2}}\frac{\sigma}{\sqrt{n}}}

③母平均の比較

  ・・・σ:未知の場合、使用する分布:t分布

\displaystyle {H_0:\mu=\mu_0 ~ ~ ~検定統計量:u_0 =\frac{\bar{x} - \mu_0}{\frac{s}{\sqrt{n}}}}

点推定:\displaystyle {\hat{x}=\frac{\sum{x_i}}{n}}

95%信頼区間\displaystyle {\bar{x}\pm t(\phi,0.05)\frac{s}{\sqrt{n}}}

2つの母集団の比較

④2つの母分散の比較

  ・・・使用する分布:F分布

\displaystyle {H_0:\sigma^2_1=\sigma^2_2 ~ ~ ~検定統計量:F_0 = \frac{V_2}{V_1} \,\,\small{(V_1\le V_2のとき、V_1\ge V_2のときは分母分子が逆)}}

点推定:\displaystyle {\widehat{\frac{\sigma^2_2}{\sigma^2_1}}=\frac{V_2}{V_1}}

95%信頼区間\displaystyle {\frac{1}{F^{\phi_2}_{\phi_1}(0.025)}\frac{V_2}{V_1}\le\frac{\sigma^2_2}{\sigma^2_1}\le F^{\phi_2}_{\phi_1}(0.025)\frac{V_2}{V_1}}

⑤二つの母平均の比較

  ・・・データ対応なし、\sigma^2_1=\sigma^2_2の場合、使用する分布:t分布

\displaystyle {H_0:\mu_1=\mu_2 ~ ~ ~検定統計量:t_0 =\frac{\bar{x_1} - \bar{x_2}}{\sqrt{V(\frac{1}{n_1}+\frac{1}{n_2})}}}

点推定:\displaystyle{\bar{x_1}-\bar{x_2}}

95%信頼区間\displaystyle {\mid \bar{x_1}-\bar{x_2} \mid \pm t(\phi_1+\phi_2,0.05) \sqrt{V(\frac{1}{n_1}+\frac{1}{n_2})}}

⑥二つの母平均の比較

  ・・・データ対応なし、\sigma^2_1 \neq \sigma^2_2の場合、使用する分布:t分布

\displaystyle {H_0:\mu_1=\mu_2 ~ ~ ~検定統計量:t_0 =\frac{\bar{x_1} - \bar{x_2}}{\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}}}

点推定:\displaystyle{\bar{x_1}-\bar{x_2}}

95%信頼区間\displaystyle{\mid\bar{x_1}-\bar{x_2}\mid \pm t(\phi,0.05)\sqrt{\frac{V_1}{n_1}+\frac{V_2}{n_2}}}

⑦二つの母平均の比較

  ・・・データ対応ありの場合、使用する分布:t分布

\displaystyle {H_0:\mu_d=0 ~ ~ ~検定統計量:t_0 =\frac{\bar{d}}{\frac{V_d}{n}}}

 

過去問は必ずやり込んでください!受かりたいなら過去問は絶対です。

過去問題で学ぶQC検定2級

 

 

こちらも記事もぜひどうぞ。 

ganbaruengineer.hatenablog.com

 

ganbaruengineer.hatenablog.com