【推測統計】母比率の区間推定とサンプルサイズの求め方【例題】
例題
母比率の区間推定
ある選挙において,100 人の投票者に出口調査を行ったところ,X候補に投票した人は 54 人であった。出口調査は単純無作為抽出に基づくとし,二項分布は近似的に正規分布に従うとする。X 候補の得票率の 95% 信頼区間を求めよ。
母比率をP、標本比率をRと表現すると、母比率の95%信頼区間の公式は以下のように表現されます。
\(P = R \pm 1.96 \times \sqrt{\frac{R(1-R)}{n}}\)
- 投票者 = 100
- X候補への投票者 = 54
つまり、\(R = \frac{54}{100} = 0.54\)ですので
\(\begin{eqnarray}
P &=& 0.54 \pm 1.96 \times \sqrt{\frac{0.54(1-0.54)}{100}} \\
&=& 0.54 \pm 0.098
\end{eqnarray}\)
答えは\(0.54 \pm 0.098\)となる。
必要なサンプルサイズ
10 万人以上の有権者がいる都市がある。有権者を対象とする単純無作為抽出による標本調査で,ある政策の支持率を区間推定したい。信頼係数 95% の信頼区間の幅が 6% 以下となるようにするには,少なくとも何人以上の有権者を調査すればよいか。ただし,調査された人は必ず支持または不支持のいずれかを回答するものとし,二項分布は近似的に正規分布に従うとする。
〔1〕
政策の支持率について事前の情報が全くないときは,少なくとも何人以上の有権者を調査すればよいか。
前項の問題で、母比率の95%の信頼区間の推定は
\(P = R \pm 1.96 \times \sqrt{\frac{R(1-R)}{n}}\)
で計算できることが分かりました。この式を不等式で変換すると信頼区間の幅は
\(R – 1.96 \times \sqrt{\frac{R(1-R)}{n}} \leq P \leq R + 1.96 \times \sqrt{\frac{R(1-R)}{n}} \)
となりますので、信頼区間の幅は
\(2 \times 1.96 \times \sqrt{\frac{R(1-R)}{n}}\)
と考えられます。
この問題は、政党の支持率についての情報がないため、母比率が最も大きくなるR=0.5を用いて
\(
2 \times 1.96 \times \sqrt{\frac{0.5(1-0.5)}{n}} \leq 0.06 \\
2 \times 1.96 \times \sqrt{\frac{0.25}{n}} \leq 0.06 \\
\sqrt{n} \geq \frac{3.92 \times 0.5}{0.06} \\
\sqrt{n} \geq 32.666 \\
n \geq 1067
\)
答えは1067人以上になります。
〔2〕
調査の結果から、政策の支持率がおよそ 80% であることがわかっているときは,少なくとも何人以上の有権者を調査すればよいか?
今回は政党の支持率、つまり標本比率がR=0.8と分かっているので使います。計算自体は前項の問題と全く同じです。
\(
2 \times 1.96 \times \sqrt{\frac{0.8(1-0.8)}{n}} \leq 0.06 \\
3.92 \times \frac{0.4}{\sqrt{n}} \leq 0.06 \\
n \geq 683
\)
答えは、683人以上となります。
コメント