1. L p Ph ng pháp NCKH – Ch ng trình CUD UPNT03
S D NG STATA 10.0 PHÂN TÍCH TH NG KÊ
TRONG NGHIÊN C U KHOA H C
KI M NH GI THI T
TS. BS T ng Kim H ng
1. Ki m nh s trung bình
1.1 Ki m nh 1 s trung bình
M file “PULSE” phân tích.
- L nh s d ng trong STATA nh sau:
+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> One
sample mean comparison test -> Ch n bi n s c n ki m nh và giá tr c n ki m nh, ví
d ch n bi n s Pulse1và hypothezied value la 80 -> Submit
(Gi s gi nh v phân ph i bình th ng c a bi n s ã c th a)
1
2. L p Ph ng pháp NCKH – Ch ng trình CUD UPNT03
t qu có c nh sau:
. ttest pulse1 == 80
One-sample t test
------------------------------------------------------------------------------
Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
pulse1 | 92 72.86957 1.147737 11.00871 70.58973 75.1494
------------------------------------------------------------------------------
mean = mean(pulse1) t = -6.2126
Ho: mean = 80 degrees of freedom = 91
Ha: mean < 80 Ha: mean != 80 Ha: mean > 80
Pr(T < t) = 0.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 1.0000
T k t qu này, ta th y r ng: Vì giá tr p <0.0001, nên chúng ta lo i b H0 và k t lu n
r ng d a trên m u này, trung bình m ch c a b nh nhân trong dân s khác bi t v i giá tr
80 l n/phút m t cách có ý ngh a
- Tính v i s có s n, l nh s d ng trong STATA nh sau:
ttesti n x s µ 0
Ví d v i m u 50 b nh nhân, có trung bình amylase huy t thanh là 96 v/ml, l ch
chu n 35, ta có th ch!ng minh trung bình amylase huy t thanh trong dân s có th c s
khác v i giá tr 120 v/ml không?
- L nh trong SATAT:
+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> One
sample mean comparison calculator
2
3. L p Ph ng pháp NCKH – Ch ng trình CUD UPNT03
t qu có c nh sau:
. ttesti 50 96 35 120
One-sample t test
------------------------------------------------------------------------------
| Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
x | 50 96 4.949747 35 86.05311 105.9469
------------------------------------------------------------------------------
mean = mean(x) t = -4.8487
Ho: mean = 120 degrees of freedom = 49
Ha: mean < 120 Ha: mean != 120 Ha: mean > 120
Pr(T < t) = 0.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 1.0000
T k t qu này, ta th y r ng: Vì giá tr p <0.0001, nên chúng ta lo i b H0 và k t lu n
r ng d a trên m u này, trung bình amylase huy t thanh c a dân s khác bi t v i giá tr
120 v/ml m t cách có ý ngh a
1.2 Ki m nh s khác bi t c a 2 s trung bình
1.2.1 Ki m nh s khác bi t c a 2 s trung bình l y t 2 m u khác
nhau
- L nh s d ng trong STATA nh sau:
+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> Two
sample mean comparison test -> Ch n 2 bi n s c n so sánh s trung bình -> Submit
- Tính v i s có s n, l nh s d ng trong STATA nh sau:
ttesti n1 x1 s1 n2 x2 s2
Ví d : M t nhóm nghiên c!u thu th p s li u amylase huy t thanh t m t m u g m
nh"ng ng i kh e m nh và 1 m u t nh"ng b nh nhân trong b nh vi n. Nhóm NC mu n
bi t trung bình amylase huy t thanh c a 2 dân s có khác nhau hay không. D" li u v 2
m u nh sau:
M u n x SD
Ng i kh e m nh 50 96 35
B nh nhân 60 120 40
3
4. L p Ph ng pháp NCKH – Ch ng trình CUD UPNT03
- L nh trong STATA:
+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> Two
sample mean comparison calculator
t qu có c nh sau:
. ttesti 50 96 35 60 120 40
Two-sample t test with equal variances
------------------------------------------------------------------------------
| Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
x | 50 96 4.949747 35 86.05311 105.9469
y | 60 120 5.163978 40 109.6669 130.3331
---------+--------------------------------------------------------------------
combined | 110 109.0909 3.766917 39.50776 101.625 116.5568
---------+--------------------------------------------------------------------
diff | -24 7.240735 -38.35239 -9.647607
------------------------------------------------------------------------------
diff = mean(x) - mean(y) t = -3.3146
Ho: diff = 0 degrees of freedom = 108
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
Pr(T < t) = 0.0006 Pr(|T| > |t|) = 0.0013 Pr(T > t) = 0.9994
T k t qu này, ta th y r ng: Vì giá tr p = 0.0013 <0.05, nên chúng ta lo i b H0 và k t
lu n r ng d a trên s li u này, chúng ta có th k t lu n m!c ý ngh a 5% r ng trung bình
amylase huy t thanh c a dân s ng i bình th ng và ng i b nh khác bi t nhau m t
cách có ý ngh a.
* L u ý: Tr c khi so sánh 2 s trung bình c n ph i ki m nh xem ph ng sai có b ng
nhau hay không quy t nh ch#n ph ng sai b ng nhau hay không b ng nhau khi làm
phép ki m t (s$ gi i thích rõ trong ph n d i ây)
* Ki m nh s khác bi t c a 2 s trung bình l y t 2 nhóm
M file “PULSE” phân tích.
- Ví d : chúng ta c n so sánh trung bình cân n%ng c a 2 nhóm nam và n"
- Tr c tiên chúng ta c n so sánh ph ng sai c a hai nhóm xem ph ng sai có b ng
nhau hay không.
4
5. L p Ph ng pháp NCKH – Ch ng trình CUD UPNT03
L nh s d ng trong STATA nh sau:
+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> Two group
variance comparison test -> Ch n bi n s c n ki m nh (weigh) và bi n s phân nhóm
(sex) -> Submit
(Gi s gi nh v phân ph i bình th ng c a bi n s ã c th a)
t qu có c nh sau:
. sdtest weight, by(sex)
Variance ratio test
------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
1 | 57 69.82456 1.100274 8.306888 67.62045 72.02868
2 | 35 54.57143 .9977165 5.90257 52.54382 56.59903
---------+--------------------------------------------------------------------
combined | 92 64.02174 1.098035 10.53198 61.84063 66.20285
------------------------------------------------------------------------------
ratio = sd(1) / sd(2) f = 1.9806
Ho: ratio = 1 degrees of freedom = 56, 34
Ha: ratio < 1 Ha: ratio != 1 Ha: ratio > 1
Pr(F < f) = 0.9825 2*Pr(F > f) = 0.0351 Pr(F > f) = 0.0175
H0: T& s 2 ph ng sai (sd1 và sd2) b ng 1, t!c là sd1 = sd2
T k t qu này, ta th y r ng: Vì giá tr p = 0.0351 <0.05, nên chúng ta lo i b H0 (2
ph ng sai b ng nhau) và k t lu n r ng d a trên s li u này, chúng ta có th k t lu n
m!c ý ngh a 5% r ng ph ng sai c a cân n%ng nam và n" khác bi t nhau m t cách có
ý ngh a.
- Sau khi ã xác nh là ph ng sai c a 2 m u không b ng nhau, ta so sánh 2 s trung
bình c a 2 m u (v i i u ki n ph ng sai không b ng nhau)
L nh s d ng trong STATA nh sau:
5
6. L p Ph ng pháp NCKH – Ch ng trình CUD UPNT03
+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> Two group
mean comparison test -> Ch n bi n s c n ki m nh (weigh) và bi n s phân nhóm (sex)
-> Ch n unequal variances -> Submit
(Gi s gi nh v phân ph i bình th ng c a bi n s ã c th a)
t qu có c nh sau:
. ttest weight, by(sex) unequal
Two-sample t test with unequal variances
------------------------------------------------------------------------------
Group | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
1 | 57 69.82456 1.100274 8.306888 67.62045 72.02868
2 | 35 54.57143 .9977165 5.90257 52.54382 56.59903
---------+--------------------------------------------------------------------
combined | 92 64.02174 1.098035 10.53198 61.84063 66.20285
---------+--------------------------------------------------------------------
diff | 15.25313 1.485275 12.30145 18.20481
------------------------------------------------------------------------------
diff = mean(1) - mean(2) t = 10.2696
Ho: diff = 0 Satterthwaite's degrees of freedom = 87.9805
Ha: diff < 0 Ha: diff != 0 Ha: diff > 0
Pr(T < t) = 1.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 0.0000
H0: S khác bi t 2 s trung bình (mean1 và mean2) b ng 0, t!c là mean1 = mean2
T k t qu này, ta th y r ng: Vì giá tr p < 0.0001, nên chúng ta lo i b H0 (2 trung bình
b ng nhau) và k t lu n r ng d a trên s li u này, chúng ta có th k t lu n m!c ý ngh a
5% r ng trung bình cân n%ng c a nam và n" khác bi t nhau m t cách có ý ngh a.
1.2.2 Ki m nh s khác bi t c a 2 s trung bình l y t cùng 1 m u (so
sánh tr c-sau, so sánh c p
M file “PULSE” phân tích.
- Ví d : chúng ta c n so sánh trung bình m ch tr c và sau khi dùng thu c có khác nhau
không
L nh s d ng trong STATA nh sau:
+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> Mean
comparison test, paired data -> Ch n bi n s c n ki m nh -> Submit
(Gi s gi nh v phân ph i bình th ng c a bi n s ã c th a)
6
7. L p Ph ng pháp NCKH – Ch ng trình CUD UPNT03
t qu có c nh sau:
. ttest pulse1 == pulse2
Paired t test
------------------------------------------------------------------------------
Variable | Obs Mean Std. Err. Std. Dev. [95% Conf. Interval]
---------+--------------------------------------------------------------------
pulse1 | 90 72.53333 1.141237 10.82673 70.26572 74.80095
pulse2 | 90 78.8 1.601981 15.19772 75.6169 81.9831
---------+--------------------------------------------------------------------
diff | 90 -6.266667 1.294259 12.27842 -8.838332 -3.695002
------------------------------------------------------------------------------
mean(diff) = mean(pulse1 - pulse2) t = -4.8419
Ho: mean(diff) = 0 degrees of freedom = 89
Ha: mean(diff) < 0 Ha: mean(diff) != 0 Ha: mean(diff) > 0
Pr(T < t) = 0.0000 Pr(|T| > |t|) = 0.0000 Pr(T > t) = 1.0000
H0: Trung bình c a s khác bi t (pulse1 - pulse2) b ng 0
T k t qu này, ta th y r ng: Vì giá tr p < 0.0001, nên chúng ta lo i b H0 (trung bình
c a s khác bi t =0) và k t lu n r ng d a trên s li u này, chúng ta có th k t lu n m!c
ý ngh a 5% r ng trung bình c a s khác bi t nh p m ch c a b nh nhân tr c và sau khi
i u tr khác 0, hay nói cách khác trung bình m ch c a b nh nhân tr c và sau khi i u
tr khác nhau m t cách có ý ngh a.
2. Ki m nh t l
2.1 Ki m nh 1 t l
- L nh s d ng trong STATA nh sau:
+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> One
sample proportion test -> Ch n bi n s c n ki m nh và giá tr c n ki m nh, ví d
ch n bi n s smoke và hypothezied value là 0.15 -> Submit
7
8. L p Ph ng pháp NCKH – Ch ng trình CUD UPNT03
2.2 Ki m nh 2 t l
- L nh s d ng trong STATA nh sau:
+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> Two
sample proportion test -> Ch n bi n s c n ki m nh -> Submit
* Ki m nh s khác bi t c a 2 t l l y t 2 nhóm
M file “PULSE” phân tích.
- Ví d : chúng ta c n so sánh t& l hút thu c lá c a nam và n"
- L nh s d ng trong STATA nh sau:
+ Statistics -> Summaries, tables and tests -> Classical tests of hypotheses -> Two group
proportion test -> Ch n bi n s c n ki m nh (smokes) và bi n s phân nhóm (sex) ->
Submit
8
9. L p Ph ng pháp NCKH – Ch ng trình CUD UPNT03
3. Phép ki m chi-bình ph ng (chi-square)
M file “PULSE” phân tích.
9
10. L p Ph ng pháp NCKH – Ch ng trình CUD UPNT03
- L nh s d ng trong STATA nh sau:
+ Statistics -> Summaries, tables and tests -> Tables -> Two way tables with measures
of association -> Nh p bi n s cho hàng và c t -> Ch n phép ki m c n s d ng (ví d
Chi-square hay Fisher’s exact test -> Submit
(N u mu n có t l theo hàng thì ch n thêm “within- row relative frequency”, n u mu n
có t l theo c t thì ch n thêm “within- column relative frequency”)
- Tính v i s có s n, l nh s d ng trong STATA nh sau:
tabi a bc de f, chi 2
hay
tabi a bc de f, exact
10