2.1 λΆκ·μΉ μ€λ₯ μμ€ν
μ νλ₯ λͺ¨λΈ
λΆκ·μΉ μ€λ₯κ° λ΄μ¬λ μμ€ν
μΌλ‘ λμΌ μ‘°κ±΄μΌλ‘ μ μ°¨λ‘μ λ°λ³΅ μνμ ν κ²½μ°, λΆκ·μΉ νΉμ±μΌλ‘ μΈνμ¬ μ€λ₯κ° μνλ§λ€ λνλ μλ μκ³ λνλμ§
μμ μλ μμΌλ©°, λ°μ λΉλμ μμ λν λΆκ·μΉνλ€. μ¦ νλΉ μν μκ° μ½ 60μ΄μΈ μ΄ 10νμ μνμ νμλ€λ©΄, 3ν μνμ 10μ΄λμμ μ€λ₯κ°
λ°μνκ³ , 4ν μνμ 50μ΄λμμ μ€λ₯κ° λ°μνμμΌλ 5~7νμμλ μ€λ₯κ° λ°μνμ§ μκ³ 8, 10νμμ μ€λ₯κ° λ°μνμλ€κ³ νμ. μ΄ 10ν μ€
μ΄λ€ ν μ°¨μ μνμμ λ°μν μ§ λ°μ μ£ΌκΈ°μ λΉλλ λΆκ·μΉνκ³ , λ°μν ν μ°¨μ μνμμλ λ°μ μμ λν λΆκ·μΉνλ€. λ°λΌμ μ€λ₯κ° νμ λ°μλλ
μν 쑰건μ μ¬νν μ μμΌλ―λ‘ μ€λ₯μ λ°μ λΉλλ₯Ό νλ₯ μ μΌλ‘ νννμ¬μΌ νλ€.
λΆκ·μΉ μ€λ₯κ° λ΄μ¬λ μμ€ν
μ΄ ν΄λΉ μν 쑰건μμ λΆκ·μΉ μ€λ₯λ₯Ό λ°μμν¬ νλ₯ μ $p_{0}$λΌ νλ©΄, μ΄ μμ€ν
μ λΆκ·μΉ μ€λ₯ λ°μ νλ₯ $p_{0}$μΈ
λͺ¨μ§λ¨μΌλ‘ κ°μ£Όν μ μλ€. λΆκ·μΉ μ€λ₯λ₯Ό λ°μ μν€λ μνμ νλ³Έ 곡κ°μ΄ μ€λ₯μ λ°μ, λ―Έλ°μμ μνΈλ°°νμ μΈ 2κ° μμλ‘ κ΅¬μ±λκ³ , λ
립μ μΈ λ§€
μν(μν)λ§λ€ λ κ°μ μμ μ€ νλλ§μ΄ μν κ²°κ³Όλ‘ λνλλ―λ‘ λ² λ₯΄λμ΄ μνμ΄λ€. λ² λ₯΄λμ΄ μνμΈ λΆκ·μΉ μ€λ₯ λ°μ μνμ nλ² μνν μ€μ μ±κ³΅
νμ, μ¦ μ€λ₯ λ°μ λΉλλ₯Ό νλ₯ λ³μ XλΌ λμΌλ©΄, κ° μνλ§λ€ λ°μ νλ₯ $p_{0}$κ° μΌμ νκ³ κ° μνμ΄ ν΅κ³μ μΌλ‘ λ
립μ΄λ―λ‘ νλ₯ λ³μ Xλ
μ΄νλΆν¬λ₯Ό λ°λ₯Έλ€. λͺ¨μ nκ³Ό $p_{0}$λ₯Ό κ°λ μ΄νλΆν¬ λ³μμΈ νλ₯ λ³μ Xμ νλ₯ μ§λ ν¨μ $Pr(X=r)$, κΈ°λκ° $E\{X\}$, λΆμ°
$Var\{X\}$μ λ€μκ³Ό κ°μ΄ ννλλ€.
νλ³Έ λΉμ¨ $\hat p$λ νλ³Έ ν¬κΈ°λ§νΌμ μ€νμ ν΅νμ¬ κ΄μ°°λ μ€λ₯μ λ°μ νλ₯ λ‘ νλ³Έ ν¬κΈ° nν μνλμ λ°κ²¬λ μ€λ₯μ λ°μ νμ Xλ‘λΆν° λ€μκ³Ό
κ°μ΄ ννλ μ μλ€.
νλ₯ λ³μμ μμ λ°°λ₯Ό νμ¬ μ»μ΄μ§ μλ‘μ΄ νλ₯ λ³μμ νκ· κ³Ό λΆμ°μ κ΄κ³μΈ μ(4)μ μνμ¬ νλ³Έ λΉμ¨μ νλ₯ λΆν¬λ λ€μκ³Ό κ°μ νλ₯ μ§λ ν¨μ, κΈ°λκ°, λΆμ°μ κ°λ μ΄νλΆν¬λ‘ κ°μ£Όν μ μλ€.
n=20, λͺ¨λΉμ¨ $p_{0}$κ° 0.2, 0.5, 0.7μΈ μ΄νλΆν¬ νλ₯ λ³μμ νλ₯ μ§λν¨μμ μλ λ€μ <κ·Έλ¦Ό 1>κ³Ό κ°λ€.
κ·Έλ¦Ό. 1. μ΄νλΆν¬ νλ₯ μ§λν¨μ
Fig. 1. Probability Mass Function of Binary Distribution
μ΄νλΆν¬λ nμ΄ μ»€μ§μ λ°λΌ μ κ·λΆν¬μ κ·Όμ νλ©°, npβ₯5, nqβ₯5 μΌ λ μ κ·λΆν¬λ‘ κ°μ£Όνλ€.
μμ κ°μ΄ μμ€ν
μ λΆκ·μΉ μ€λ₯ λͺ¨λΈμ μ€λ₯ λ°μ νλ₯ μΈ $p_{0}$λ§μΌλ‘ ꡬμ±λλ€. κ·Έλ¬λ―λ‘ λͺ¨λΉμ¨ $p_{0}$λ₯Ό μκ³ μλ€λ©΄ μμ κ°μ΄ λͺ¨λΈλ§ν
μ μλ€. κ·Έλ¬λ μ°λ¦¬κ° μ»μ μ μλ κ°μ μ€νμμ νλν λΆκ·μΉ μ€λ₯μ λ°μ νλ₯ μΈ νλ³ΈλΉμ¨ $\hat p$ λΏμ΄λ―λ‘, μ΄ νλ³Έ λΉμ¨μ μ΄μ©νμ¬
λͺ¨λΉμ¨μ μΆμ ν¨μΌλ‘μ¨ μ€λ₯ μμ€ν
μ λͺ¨λΈλ§νμ¬μΌ νλ€. νλ³Έ λΉμ¨λ‘λΆν° μΆμ λ λͺ¨λΉμ¨, μ¦ λͺ¨λΉμ¨ μΆμ μΉλ₯Ό $\hat p_{0}$λΌ νκ³ μ μμ
λμ
νμ¬ κΈ°μ νλ©΄ μ€λ₯ μμ€ν
μ λ€μ μ(7)~(8)κ³Ό κ°λ€.
λͺ¨λΉμ¨ μΆμ μ κ°λ
μ μ΄ν΄νκΈ° μ½λλ‘ μ°μ μ μΌλ‘ μ€λͺ
νκΈ° μνμ¬, λ¨Όμ νλ³ΈλΉμ¨μ μΆμ λμΌλ‘ μ¬μ©νλ μ μΆμ λ°©λ²μ μ΄ν΄λ³΄κΈ°λ‘ νλ€. νλ³ΈλΉμ¨μ ν¨μ¨μ μ΄λ©°
μΌκ΄λ λΆνΈμΆμ λμ΄μ§λ§, νλ³Έ λΉμ¨κ³Ό λͺ¨λΉμ¨μ΄ κ°λ€λ κ²μ 보μ₯νμ§λ μλλ€. μ€μ λ‘ νλ³ΈλΉμ¨μ΄ λͺ¨λΉμ¨κ³Ό κ°μ νλ₯ μ λ§€μ° μ μ κ²μ΄λ€. μ΄λ₯Ό μ°μ μ μΌλ‘
μ΄ν΄λ³΄λ©΄ λ€μκ³Ό κ°λ€. n=20λ² μνμΌλ‘ νλ³ΈλΉμ¨ $\hat p$μ ꡬνμλλ 0.5λ₯Ό μ»μλ€κ³ κ°μ νμ. μ΄ λ, λͺ¨λΉμ¨μ 0.5λΌκ³ λκΈ°λ‘ νλ€λ©΄
νλ³ΈλΉμ¨μ΄ 0.5, n=20μΌ λ λͺ¨λΉμ¨μ΄ 0.5μΌ νλ₯ μ λ€μκ³Ό κ°μ΄ ꡬν μ μλ€.
μ΄λ‘λΆν°, νλ³Έ λΉμ¨μ΄ 0.5λΌ ν΄μ λ°λμ λͺ¨λΉμ¨μ΄ 0.5λΌκ³ 보μ₯ν μλ μλ€λ κ²μ μ μ μλ€. νλ³Έ λΉμ¨μ΄ 0.5 μΌ λ λͺ¨λΉμ¨μ΄ 0.5μΌ
νλ₯ μ 0.176μ΄λ€. λ€λ₯Έ ν κ²½μ°λ₯Ό λ μ΄ν΄λ³΄λ©΄, μμ λμΌνκ² μννμ n=20, νλ³ΈλΉμ¨ $\hat p$=0.5μΌ λ, λͺ¨λΉμ¨μ΄ 0.3μΌ νλ₯ μ
λ€μκ³Ό κ°λ€.
νλ³ΈλΉμ¨ $\hat p$μ΄ 0.2, 0.5, 0.7μΌ λ 0.1λΆν° 0.9κΉμ§ λͺ¨λΉμ¨μ κ°μ§ νλ₯ μ μμ κ°λ
μΌλ‘ ꡬνλ©΄ λ€μ <κ·Έλ¦Ό 2>μ κ°λ€.
κ·Έλ¦Ό. 2. νλ³ΈλΉμ¨μ μ£Όμ΄μ‘μ λ, λͺ¨λΉμ¨λ³ νλ₯
Fig. 2. Probability of population proportion when sample proportion is given
μ μ€λͺ
μμ, νλ³ΈλΉμ¨μ΄ μ£Όμ΄μ‘μ λ λͺ¨λΉμ¨μ΄ 0.1~0.9μΌ κ°λ₯μ±μ κ°λ
μ μΌλ‘ μ΄ν΄νκΈ° μνμ¬ μ°μ μ μΌλ‘ ꡬνμμΌλ μ΄λ₯Ό λΆνμ€μ±μ μ λλ₯Ό μΈ‘μ νλ
μ΄λ€ κΈ°μ€μ΄λ μμΉλ‘ μ¬μ©νκΈ°λ μ΄λ ΅λ€. μ΄κ²μ΄ μ μΆμ μ νκ³μ μΌλ‘, μ΄λ₯Ό 보μνκΈ° μνμ¬ μ λ’° μμ€κ³Ό κ΅¬κ° μΆμ μΉλ₯Ό μ μνλ κ΅¬κ° μΆμ λ²μ΄ μ μλμμΌλ―λ‘,
λΆκ·μΉ μ€λ₯ μμ€ν
μ λͺ¨λΉμ¨ μΆμ μ μνμ¬ κ΅¬κ° μΆμ λ°©λ²μ μ μ©νκ³ μ νλ€.
2.2 ꡬκ°μΆμ μ μ μ©ν μ€λ₯ μμ€ν
λͺ¨λΈλ§
λͺ¨λΉμ¨ μΆμ μμ ꡬνκ³ μ νλ κ²μ, λͺ¨λΉμ¨ μΆμ μΉμ κ·Έ μΆμ μΉμ λ―Ώμ λ§ν μ λλ₯Ό λνλ΄λ μ λ’° μμ€μ΄λ€. μ°λ¦¬μκ² μ£Όμ΄μ§ κ°μ νλ³Έμ ν¬κΈ° nκ³Ό
νλ³Έ λΉμ¨ $p_{s}$μ΄λ€.
κ΅¬κ° μΆμ μμλ ꡬκ°μΆμ λ $(P_{LB},\:P_{UB})$μ΄ λͺ¨μ, μ¬κΈ°μλ λͺ¨λΉμ¨μ ν¬ν¨ν νλ₯ μ μ λ’°μμ€ $100P_{CL}$%μ΄λΌ νλ©°,
λ€μκ³Ό κ°μ΄ ννλλ€.
λν, ꡬκ°μΆμ λ $(P_{LB},\:P_{UB})$μ μΆμΆλ νλ³Έμλ£μ λμ
νμ¬ κ³μ°ν μ€μ ꡬκ°, λλ ꡬκ°μΆμ μΉλ₯Ό $100P_{CL}$% μ 뒰ꡬκ°μ΄λΌ
νλ€. κ΅¬κ° μΆμ μμ μ λ’° μμ€μ μλ―Έλ νλ³Έ ν¬κΈ° nμΈ νλ³Έμ 100κ° μΆμΆνμ¬ νλ³Έ λΉμ¨μ 100κ° κ΅¬νκ³ , 100κ° κ°κ°μ νλ³Έ λΉμ¨μ μ λ’°
ꡬκ°μ ꡬνμμ λ, 100κ°μ μ λ’° κ΅¬κ° μ€ $100P_{CL}$κ°μ μ λ’° ꡬκ°μ΄ λͺ¨λΉμ¨μ ν¬ν¨νλ€λ λ»μ΄λ€. κ·Έλ¬λ μ κ· λΆν¬μΈ κ²½μ°, μ κ· λΆν¬
μ(13)μ μνμ¬ λͺ¨λΉμ¨($\mu$)κ³Ό νλ³ΈλΉμ¨(X)μ μμΉκ° λ°λμ΄λ λμΌν λΆν¬λ₯Ό κ°κ² λλ―λ‘, μΆμΆλ νλ³Έ λΉμ¨ $p_{s}$λ‘λΆν° ꡬν μ λ’° μμ€
$100P_{CL}$%μΈ μ λ’° κ΅¬κ° $(P_{LB},\:P_{UB})$μ λͺ¨λΉμ¨μ΄ ν¬ν¨λ νλ₯ (μ λ’° μμ€)μ΄ $100P_{CL}$%λΌ κ°μ νμ¬λ 무방νλ€.
$\mu$=νκ· , $\sigma^{2}$=λΆμ°
κ΅¬κ° μΆμ μ΄λ μΆμ νκ³ μ νλ λͺ¨μλ₯Ό μ€μ ꡬκ°μ μν΄ μΆμ νλ λ°©λ²μ΄λ€. λ°λΌμ ꡬκ°μΆμ μ μ€μꡬκ°μ μνμΆμ μΉμ ννμΆμ μΉ, λ κ°μ κ°μΌλ‘ ꡬμ±λλ©°
μμΈλ¬ ꡬκ°μΆμ λμ΄ λͺ¨μλ₯Ό ν¬ν¨ν νλ₯ μΈ μ λ’°μμ€μ ν¨κ» μ μνλ€. μΆμΆλ νλ³Έ λΉμ¨ $p_{s}$μ λμ
νμ¬ κ³μ°ν μ€μ κ΅¬κ° $(P_{LB},\:P_{UB})$μ
λͺ¨λΉμ¨ $p_{0}$μ $100P_{CL}$% μ 뒰ꡬκ°μ΄λΌ νλ©° <κ·Έλ¦Ό 3>μμ λνλ΄λ λ°μ κ°λ€.
κ·Έλ¦Ό. 3. λͺ¨λΉμ¨μ μμΈ‘ ꡬκ°μΆμ
Fig. 3. Two-sided interval estimation of population proportion
μΆμΆλ νλ³Έ λΉμ¨ $p_{s}$λ‘λΆν° ꡬν λͺ¨λΉμ¨μ μνμΆμ μΉ, ννμΆμ μΉλ μμμ μ€λͺ
ν λ°μ κ°μ΄ μ λ’°μμ€ $100P_{CL}$%λ‘ λ³΄μ₯λλ λͺ¨λΉμ¨
μΆμ μΉμ μ΅λκ°, μ΅μκ°μ΄ λλ€. μμ κ²½μ°λ μμΈ‘ κ΅¬κ° μΆμ μ΄λ©°, λ¨μΈ‘ μΆμ μ μ 뒰ꡬκ°μ λ€μμ <κ·Έλ¦Ό 4>μ κ°μΌλ©° μ(14)λ‘ ννλλ€.
μ€λͺ
ν κ΅¬κ° μΆμ λ°©λ²μ μνμ¬, μ λ’°μμ€κ³Ό λͺ¨λΉμ¨ μΆμ μΉλ‘ μν μΆμ μΉ λλ νν μΆμ μΉλ₯Ό ꡬν μ μλ€. μν μΆμ μΉμ νν μΆμ μΉ μ€μ μ ν
λ¬Έμ λ λ€μ μ μμ μ€λͺ
νκΈ°λ‘
κ·Έλ¦Ό. 4. λͺ¨λΉμ¨μ λ¨μΈ‘ ꡬκ°μΆμ
Fig. 4. One-sided interval estimation of population proportion
νλ©°, μ¬κΈ°μλ λ κ°μ μΆμ μΉ μ€ μ ν©ν νλλ₯Ό λͺ¨λΉμ¨ μΆμ μΉ $\hat p_{0}$μΌλ‘ μ ννμλ€λ κ°μ νμ 2.1μ μμ μ€λͺ
ν λΆκ·μΉ μ€λ₯
μμ€ν
λͺ¨λΈμ μ μ©νλ©΄ λ€μκ³Ό κ°μ΄ ννλ μ μλ€.
when $\hat p_{0}=P_{LB}$, $P(\hat p_{0}\le p_{0})=P_{CL}$
when $\hat p_{0}=P_{UB}$, $P(p_{0}\le\hat p_{0})=P_{CL}$
μ¦, μ(7), (8)μ μ λ’°μμ€μ΄ μΆκ°λ‘ μ μλλ€. λ°λΌμ ꡬκ°μΆμ λ²μ μ μ©ν λΆκ·μΉ μ€λ₯ μμ€ν
λͺ¨λΈμΈ μ(15), (16)μ μ¬μ©νκΈ° μνμ¬ μ λ’° μμ€ $100P_{CL}$%μΈ μ λ’° ꡬκ°μ ꡬνμ¬μΌ νλ€. κ·Έ λ°©λ²μλ μ¬λ¬ κ°μ§κ° μμΌλ©°, κ·Έ μ€ ν κ°μ§ λ°©λ²μΈ Wald
Intervalμ λ€μ μ μμ μκ°νλ€.
2.3 ꡬκ°μΆμ μ μν λͺ¨λΉμ¨ μΆμ μΉ μ°μΆ
μ€μ¬ κ·Ήν μ 리(Central Limit Theorem)μ μνμ¬ nμ΄ ν΄ κ²½μ° νλ³Έ λΉμ¨ $p_{s}=\dfrac{1}{n}X$μ λΆν¬λ $N(p_{0},\:\dfrac{p_{0}q_{0}}{n})$μΌλ‘
κ·Όμ¬ν μ μμΌλ λͺ¨λΉμ¨μ μ μ μμΌλ―λ‘, μΈ‘μ λ νλ³Έ λΉμ¨ $p_{s}=\dfrac{1}{n}X$λ₯Ό μ΄μ©νμ¬ κ·Όμ¬λ νλ₯ λΆν¬λ₯Ό ꡬνλ€. μ¦,
$p_{s}=\dfrac{X}{n}\sim$$N(p_{s},\:\dfrac{p_{s}q_{s}}{n})$
λ‘ κ·Όμ¬νλ€. μ λ’°λ $100(1-\alpha_{CL})$%μΈ μμΈ‘ μΆμ μ 뒰ꡬκ°μ μν $P_{UB}$ λ° νν $P_{LB}$λ Z-μΆμ λ°©λ²μΌλ‘
ꡬνλ©° λ€μκ³Ό κ°λ€.(3)(4)
(Z: νμ€μ κ·λΆν¬ νλ₯ λ³μ)
λ¨μΈ‘ μΆμ μ κ²½μ° μ μμμ $z_{\alpha_{CL}/2}$λ₯Ό $z_{\alpha_{CL}}$λ‘ λ°κΎΈλ©΄ λλ©° μ’μΈ‘ λ¨μΈ‘ μΆμ μ κ²½μ°λ μ(17), (18)μ λ€μ μ(19)μ κ°μ΄ λ€μ μΈ μ μλ€.
μ°μΈ‘ λ¨μΈ‘ κ²μ μ κ²½μ° μνμΆμ μΉλ λ€μ μκ³Ό κ°λ€.