SlideShare ist ein Scribd-Unternehmen logo
1 von 39
Downloaden Sie, um offline zu lesen
Review
 複習
99/6/15
 楊政達
了解變項關係的方法

• 相關: ≧兩個變項的關係
• 迴歸: 以一個或多個變項預測其他變項
相關
           S xy
• rxy               rzxzy  S zxzy
          Sx  Sy

• -1≦r≦1 (數字表示強弱,正負表示方向)
• 描述二變項的線性關係
• 相關不代表因果關係
• 影響相關的因素:
1. Restriction of range
2. Heterogeneous of subsamples
變項性質                相關           其中二分/ordinal變
                                   項背後為常態分配
Binary/Binary          φ              四分相關

 Binary/連續        Point-biserial       Biserial

  連續/連續            Pearson’s r

Ordinal/ordinal   Spearman’s ρ       多序類相關
                   Kendall’sτ        (polychoric)
 Ordinal/連續         多列相關
                   (polyserial)
Ordinal/binary     多序類相關
                   (polychoric)
迴歸
• 單迴歸: 以一個X預測Y
       Y=aX+b+e
       Y  a  bX
       ˆ          Zy   ZX  rXY Zx
                  ˆ
• 用途:
  – 跨國跨單位跨研究比較
  – 跨參數比較
• 複迴歸: 以多個X預測Y
單迴歸
Source               SS                 df MS                 F
                                                          MS Yˆ
Model (reg)    SS Yˆ  r SS Y
                          2
                          XY
                                        1 SSY / 1                 ~ F(1,n  2, 0.05)
                                                          MSE

                                             SSe
Error         SS e  (1  rXY ) SS Y
                           2
                                       n-2        S e2
                                             n2


Total             SSY                  n-1   MSE
2
          rXY SS Y
F
   (1  rXY ) SS Y / n  2
         2




        rXY
t                 ~ t( n  2 )
      (1  r )2
              XY
         n2
複迴歸
Source             SS            df     MS              F
Model (reg)      R 2 SS Y        P           MSR
                                                   ~ F( p ,n  p 1,0.05)
                                             MSE

Error         (1  R 2 ) SS Y   N-P-1

Total           SSY             N-1     MSE=SSe
多元決定係數
        SS Yˆ     SSe
• R 
   2
              1
        SS Y      SS Y
壓抑變項
•   rXY1>0
•   rX1X2>0 and high
•   rxy2=0
•   X2為壓抑變項
假設
•   線性關係
•   X沒有測量誤差
•   沒有遺漏重要變項
•   資料互相獨立
•   Homoscedasticity of variance
•   Conditional normality of Y
•   殘差來自於常態分配母群且平均數為0
Parametric Statistics(母數統計法)



                σ² known → Z test
                         H₀: μ= a
One sample
                σ² unknown → t test 
                         H₀: μ= a           t(n‐1)
Parametric Statistics(母數統計法)
          Dependent samples → paired t test     D  D
                       H0: μD=0              t        ~ t ( n 1)
Two                                             SD / n
                                                                                       N: pair數
samples   Independent samples
                                                ( x1  x 2 )  ( 1   2 )
            σ₁²σ₂² known → Z test      Z                                      ~Z
                                                            2
                                                                         2
                                                             1
                                                                         2

                                                         n1           n2

            σ₁²=σ₂² unknown → tn1+n2‐2
                                                ( x1  x 2 )  ( 1   2 )
                                         t                                   ~ t ( n1 n 2 2)
                                                       2 1   1
                                                      SP (  )
                                                          n1 n2
            σ₁²≠σ₂² unknown ~  t’(df’)
                                                ( x1  x 2 )  ( 1   2 )
                                         t'                                    ~ t ' ( df ')
                                                              2           2
                                                         S   S
                                                            1            2

                                                         n1 n 2
Nonparametric Statistics(無母數統計法)



              Dependent samples → Wilcoxon Sum of diff test
                                 Signed Ranks test
Two samples                      Sign test

              Independent samples → Wilcoxon Rank Sum test
                                   Mann‐Whitney U test
                                   Median test
More than two samples:
               Parametric Statistics(母數統計法)

        Dependent samples → repeated measures(重複量數)

        Independent samples → Analysis of Variance(ANOVA,
        變異數分析)
            Nonparametric Statistics(無母數統計法)

         Dependent samples → Friedman Rank test

         Independent samples → Kruskal‐Wallis H test
• Z , t , χ², F 分配中, 以F分配最為有用
(因為可藉由F分配查出其他分配情形)

            Z               Z2                 (  2 / 1)
   t               t 2
                                   F(1, )    2
              2            
                             2
                                               (  / )
            ( )             ( )
                            

               2
              ( )
                 
                     2
 F( , )   
               2
                   
                (       )
                    
為何不做t test要做F test?

• α已知且固定
• Power上升
• 可處理兩個以上的變項
名詞介紹
•   因子
•   水準
•   主要效果
•   交互作用
•   簡單主要效果
•   固定效果模式 v.s 隨機效果模式
•   受試者間設計 v.s受試者內設計
•   正交對比
•   Split-plot design
•   Hierarchical design : crossed & nested
Review
T-test 和 ANOVA 的比較:


t = between variation (treatment) / within variation (error)

F = (within + between) / within
  = 1 + between / within
Sources of variability
Variability is measured by variance

四種來源:
1.Measurement error
2.Control error
                                       Error variance
  (uncontrolled extraneous variance)
3. Individual difference

4. Independent variable effect
One-way ANOVA
Two-way ANOVA
Assumptions:

Assumption of ANOVA

  - Independence
    觀察值彼此獨立
  - Normality
    觀察值取自於常態分配的母群
  - Homogeneity of variance
    各組水準下,資料的分配之變異數均相同
Repeated Measures
Assumptions
•   Independence
•   Normality
•   Homogeneity of variance     Compound symmetry
                                Sphericity (球型假設)
•   Homogeneity of covariance
設計之優缺點
• 優點:
 – 使用同樣的受試者誤差項(MSE)小Power大
 – 節省時間人力
• 缺點:
 – 疲勞練習等效果(carry over effect):設計時順序要
   random( counterbalance if possible)
 – 受試者流失
 – 受試者重複施測,時間間隔難以控制
 – 複對稱性假設(compound symmetry):變異數同質+共變
   數同質
   • 例:σ國=σ英=σ數
   •   σ國英=σ英數=σ國數
   • 容易違背
多個平均數的比較

事前比較



ANOVA   不顯著

        顯著    事後比較
Two types of error rate
(a) Error rate per comparison (αPC): the
    probability of making a type Ι errors for
    any of possible comparisons 每一個單一
    比較的機率
           PC = α’ C: number of comparisons
(b) Family error rate (αFW): the probability of
    making one or more type Ι errors for
    the full set of possible comparisons 至少
    犯一個type Ι error的機率
           FW  1 - (1 -  ) c
Review
Review
Magnitude of experimental effect
• To describe the degree of association
  between IV and DV
• (1) eta-square η2
          SS B
       
       2

          SS T

• 優點:易理解計算
• 缺點:數值偏高,高估了IV和DV的關係程度
• (2) omega-square ω2
           Y   Y|X
            2     2

     2 
              Y2


          SS B  ( j  1) MSW
       
      ˆ2

             SS T  MSW

• 優點:考慮自由度,不會高估IV和DV的相關程
  度
ANOVA & Regression
Review
• 然此矩陣在“解”時(做回歸時)會有
  multicollinearity 的問題,此問題即第一column
  為其他column之和(第一column 可寫為其他
  column之線性組合),因此不能解
• 可用兩種變通方式:
 – Dummy coding
 – Effect coding
無母數統計
• 優點

 – Make no priori assumption about the shape of
   the dist. i.e. weaker or no distributional
   assumption
 – No parameters assumed or estimated
 – More sensitive to medium than mean
 – Less affected by outliers ( usually we ranks)
 – Simple calculation
 – Small samples
• 缺點

 – Information loss (magnitude, sign, rank)
 – parametric statistic is more versatile
 – Less powerful if assumption of parametric
   tests are met

Weitere ähnliche Inhalte

Andere mochten auch

Making social media work
Making social media workMaking social media work
Making social media workJames Williams
 
Space Mission Unmanned
Space Mission UnmannedSpace Mission Unmanned
Space Mission Unmannedguestdd679bd
 
Low Level Visual Saliency Does Not Predict Change
Low Level Visual Saliency Does Not Predict ChangeLow Level Visual Saliency Does Not Predict Change
Low Level Visual Saliency Does Not Predict ChangeMiiya Wu
 
Worksheet In Class Rec Ord..
Worksheet In Class Rec Ord..Worksheet In Class Rec Ord..
Worksheet In Class Rec Ord..harl
 
Worksheet In Class Rec Ord..
Worksheet In Class Rec Ord..Worksheet In Class Rec Ord..
Worksheet In Class Rec Ord..harl
 
Worksheet In Class Rec Ord..
Worksheet In Class Rec Ord..Worksheet In Class Rec Ord..
Worksheet In Class Rec Ord..harl
 
Fortsatt framåt för fler jobb och företag
Fortsatt framåt för fler jobb och företagFortsatt framåt för fler jobb och företag
Fortsatt framåt för fler jobb och företagUlricehamnsbloggen
 
Worksheet In Class Rec Ord..
Worksheet In Class Rec Ord..Worksheet In Class Rec Ord..
Worksheet In Class Rec Ord..harl
 
För en skola i toppklass ett samspel mellan riks- och lokalpolitik
För en skola i toppklass   ett samspel mellan riks- och lokalpolitikFör en skola i toppklass   ett samspel mellan riks- och lokalpolitik
För en skola i toppklass ett samspel mellan riks- och lokalpolitikUlricehamnsbloggen
 
Turismo en las américas torres, garcía
Turismo en las américas torres, garcíaTurismo en las américas torres, garcía
Turismo en las américas torres, garcíaSergio Blanché
 
Acquisto di Aiyellow Standard
Acquisto di Aiyellow StandardAcquisto di Aiyellow Standard
Acquisto di Aiyellow Standardcreadess
 
Lenguaje audiovisual
Lenguaje audiovisualLenguaje audiovisual
Lenguaje audiovisualrapeta
 
High Care Symposium 7 april 2011 / Longproblematiek
High Care Symposium 7 april 2011 / LongproblematiekHigh Care Symposium 7 april 2011 / Longproblematiek
High Care Symposium 7 april 2011 / LongproblematiekMedisch Centrum Haaglanden
 

Andere mochten auch (20)

Making social media work
Making social media workMaking social media work
Making social media work
 
Space Mission Unmanned
Space Mission UnmannedSpace Mission Unmanned
Space Mission Unmanned
 
Low Level Visual Saliency Does Not Predict Change
Low Level Visual Saliency Does Not Predict ChangeLow Level Visual Saliency Does Not Predict Change
Low Level Visual Saliency Does Not Predict Change
 
Worksheet In Class Rec Ord..
Worksheet In Class Rec Ord..Worksheet In Class Rec Ord..
Worksheet In Class Rec Ord..
 
Untitled 1
Untitled 1Untitled 1
Untitled 1
 
1.1 1.4
1.1 1.41.1 1.4
1.1 1.4
 
Worksheet In Class Rec Ord..
Worksheet In Class Rec Ord..Worksheet In Class Rec Ord..
Worksheet In Class Rec Ord..
 
Worksheet In Class Rec Ord..
Worksheet In Class Rec Ord..Worksheet In Class Rec Ord..
Worksheet In Class Rec Ord..
 
Fortsatt framåt för fler jobb och företag
Fortsatt framåt för fler jobb och företagFortsatt framåt för fler jobb och företag
Fortsatt framåt för fler jobb och företag
 
Worksheet In Class Rec Ord..
Worksheet In Class Rec Ord..Worksheet In Class Rec Ord..
Worksheet In Class Rec Ord..
 
Catalogue des nouveautés BUFM janvier 2013
Catalogue des nouveautés BUFM janvier 2013Catalogue des nouveautés BUFM janvier 2013
Catalogue des nouveautés BUFM janvier 2013
 
Det händer mycket i kommunen
Det händer mycket i kommunenDet händer mycket i kommunen
Det händer mycket i kommunen
 
Philosophie_ecole
Philosophie_ecolePhilosophie_ecole
Philosophie_ecole
 
Poseidon Pharma
Poseidon PharmaPoseidon Pharma
Poseidon Pharma
 
För en skola i toppklass ett samspel mellan riks- och lokalpolitik
För en skola i toppklass   ett samspel mellan riks- och lokalpolitikFör en skola i toppklass   ett samspel mellan riks- och lokalpolitik
För en skola i toppklass ett samspel mellan riks- och lokalpolitik
 
Turismo en las américas torres, garcía
Turismo en las américas torres, garcíaTurismo en las américas torres, garcía
Turismo en las américas torres, garcía
 
Acquisto di Aiyellow Standard
Acquisto di Aiyellow StandardAcquisto di Aiyellow Standard
Acquisto di Aiyellow Standard
 
Lenguaje audiovisual
Lenguaje audiovisualLenguaje audiovisual
Lenguaje audiovisual
 
Nouveautés BUFM octobre 2012
Nouveautés BUFM octobre 2012Nouveautés BUFM octobre 2012
Nouveautés BUFM octobre 2012
 
High Care Symposium 7 april 2011 / Longproblematiek
High Care Symposium 7 april 2011 / LongproblematiekHigh Care Symposium 7 april 2011 / Longproblematiek
High Care Symposium 7 april 2011 / Longproblematiek
 

Ähnlich wie Review

通信网第二三章习题答案
通信网第二三章习题答案通信网第二三章习题答案
通信网第二三章习题答案bupt
 
人类行为与最大熵原理
人类行为与最大熵原理人类行为与最大熵原理
人类行为与最大熵原理Chengjun Wang
 
概率统计各章节总结
概率统计各章节总结概率统计各章节总结
概率统计各章节总结Ceelog
 
Variational inference
Variational inferenceVariational inference
Variational inferencesun peiyuan
 
(统本)《抽样技术》第七章 整群抽样
(统本)《抽样技术》第七章  整群抽样(统本)《抽样技术》第七章  整群抽样
(统本)《抽样技术》第七章 整群抽样yoyo1120love
 
2012力学相对论复习
2012力学相对论复习2012力学相对论复习
2012力学相对论复习xleog
 
3运动的守恒定律
3运动的守恒定律3运动的守恒定律
3运动的守恒定律vincent930218
 
Ch3習作簿word檔
Ch3習作簿word檔Ch3習作簿word檔
Ch3習作簿word檔lyt199529
 
Deterministic Signal
Deterministic SignalDeterministic Signal
Deterministic SignalPei-Che Chang
 

Ähnlich wie Review (12)

通信网第二三章习题答案
通信网第二三章习题答案通信网第二三章习题答案
通信网第二三章习题答案
 
人类行为与最大熵原理
人类行为与最大熵原理人类行为与最大熵原理
人类行为与最大熵原理
 
概率统计各章节总结
概率统计各章节总结概率统计各章节总结
概率统计各章节总结
 
Variational inference
Variational inferenceVariational inference
Variational inference
 
(统本)《抽样技术》第七章 整群抽样
(统本)《抽样技术》第七章  整群抽样(统本)《抽样技术》第七章  整群抽样
(统本)《抽样技术》第七章 整群抽样
 
2012力学相对论复习
2012力学相对论复习2012力学相对论复习
2012力学相对论复习
 
3运动的守恒定律
3运动的守恒定律3运动的守恒定律
3运动的守恒定律
 
Ch3習作簿word檔
Ch3習作簿word檔Ch3習作簿word檔
Ch3習作簿word檔
 
Graduate report
Graduate reportGraduate report
Graduate report
 
Deterministic Signal
Deterministic SignalDeterministic Signal
Deterministic Signal
 
7机械波
7机械波7机械波
7机械波
 
3 1矩陣列運算
3 1矩陣列運算3 1矩陣列運算
3 1矩陣列運算
 

Review

  • 2. 了解變項關係的方法 • 相關: ≧兩個變項的關係 • 迴歸: 以一個或多個變項預測其他變項
  • 3. 相關 S xy • rxy   rzxzy  S zxzy Sx  Sy • -1≦r≦1 (數字表示強弱,正負表示方向) • 描述二變項的線性關係 • 相關不代表因果關係 • 影響相關的因素: 1. Restriction of range 2. Heterogeneous of subsamples
  • 4. 變項性質 相關 其中二分/ordinal變 項背後為常態分配 Binary/Binary φ 四分相關 Binary/連續 Point-biserial Biserial 連續/連續 Pearson’s r Ordinal/ordinal Spearman’s ρ 多序類相關 Kendall’sτ (polychoric) Ordinal/連續 多列相關 (polyserial) Ordinal/binary 多序類相關 (polychoric)
  • 5. 迴歸 • 單迴歸: 以一個X預測Y Y=aX+b+e Y  a  bX ˆ Zy   ZX  rXY Zx ˆ • 用途: – 跨國跨單位跨研究比較 – 跨參數比較 • 複迴歸: 以多個X預測Y
  • 6. 單迴歸 Source SS df MS F MS Yˆ Model (reg) SS Yˆ  r SS Y 2 XY 1 SSY / 1 ~ F(1,n  2, 0.05) MSE SSe Error SS e  (1  rXY ) SS Y 2 n-2  S e2 n2 Total SSY n-1 MSE
  • 7. 2 rXY SS Y F (1  rXY ) SS Y / n  2 2 rXY t ~ t( n  2 ) (1  r )2 XY n2
  • 8. 複迴歸 Source SS df MS F Model (reg) R 2 SS Y P MSR ~ F( p ,n  p 1,0.05) MSE Error (1  R 2 ) SS Y N-P-1 Total SSY N-1 MSE=SSe
  • 9. 多元決定係數 SS Yˆ SSe • R  2  1 SS Y SS Y
  • 10. 壓抑變項 • rXY1>0 • rX1X2>0 and high • rxy2=0 • X2為壓抑變項
  • 11. 假設 • 線性關係 • X沒有測量誤差 • 沒有遺漏重要變項 • 資料互相獨立 • Homoscedasticity of variance • Conditional normality of Y • 殘差來自於常態分配母群且平均數為0
  • 12. Parametric Statistics(母數統計法) σ² known → Z test H₀: μ= a One sample σ² unknown → t test  H₀: μ= a t(n‐1)
  • 13. Parametric Statistics(母數統計法) Dependent samples → paired t test  D  D H0: μD=0 t ~ t ( n 1) Two  SD / n N: pair數 samples Independent samples ( x1  x 2 )  ( 1   2 ) σ₁²σ₂² known → Z test Z ~Z  2  2 1  2 n1 n2 σ₁²=σ₂² unknown → tn1+n2‐2 ( x1  x 2 )  ( 1   2 ) t ~ t ( n1 n 2 2) 2 1 1 SP (  ) n1 n2 σ₁²≠σ₂² unknown ~  t’(df’) ( x1  x 2 )  ( 1   2 ) t'  ~ t ' ( df ') 2 2 S S  1 2 n1 n 2
  • 14. Nonparametric Statistics(無母數統計法) Dependent samples → Wilcoxon Sum of diff test Signed Ranks test Two samples Sign test Independent samples → Wilcoxon Rank Sum test Mann‐Whitney U test Median test
  • 15. More than two samples: Parametric Statistics(母數統計法) Dependent samples → repeated measures(重複量數) Independent samples → Analysis of Variance(ANOVA, 變異數分析) Nonparametric Statistics(無母數統計法) Dependent samples → Friedman Rank test Independent samples → Kruskal‐Wallis H test
  • 16. • Z , t , χ², F 分配中, 以F分配最為有用 (因為可藉由F分配查出其他分配情形) Z Z2 (  2 / 1) t t 2  F(1, )  2  2  2 (  / ) ( ) ( )   2 ( )    2 F( , )  2  ( ) 
  • 17. 為何不做t test要做F test? • α已知且固定 • Power上升 • 可處理兩個以上的變項
  • 18. 名詞介紹 • 因子 • 水準 • 主要效果 • 交互作用 • 簡單主要效果 • 固定效果模式 v.s 隨機效果模式 • 受試者間設計 v.s受試者內設計 • 正交對比 • Split-plot design • Hierarchical design : crossed & nested
  • 20. T-test 和 ANOVA 的比較: t = between variation (treatment) / within variation (error) F = (within + between) / within = 1 + between / within
  • 21. Sources of variability Variability is measured by variance 四種來源: 1.Measurement error 2.Control error Error variance (uncontrolled extraneous variance) 3. Individual difference 4. Independent variable effect
  • 24. Assumptions: Assumption of ANOVA - Independence 觀察值彼此獨立 - Normality 觀察值取自於常態分配的母群 - Homogeneity of variance 各組水準下,資料的分配之變異數均相同
  • 26. Assumptions • Independence • Normality • Homogeneity of variance Compound symmetry Sphericity (球型假設) • Homogeneity of covariance
  • 27. 設計之優缺點 • 優點: – 使用同樣的受試者誤差項(MSE)小Power大 – 節省時間人力 • 缺點: – 疲勞練習等效果(carry over effect):設計時順序要 random( counterbalance if possible) – 受試者流失 – 受試者重複施測,時間間隔難以控制 – 複對稱性假設(compound symmetry):變異數同質+共變 數同質 • 例:σ國=σ英=σ數 • σ國英=σ英數=σ國數 • 容易違背
  • 28. 多個平均數的比較 事前比較 ANOVA 不顯著 顯著 事後比較
  • 29. Two types of error rate (a) Error rate per comparison (αPC): the probability of making a type Ι errors for any of possible comparisons 每一個單一 比較的機率 PC = α’ C: number of comparisons (b) Family error rate (αFW): the probability of making one or more type Ι errors for the full set of possible comparisons 至少 犯一個type Ι error的機率 FW  1 - (1 -  ) c
  • 32. Magnitude of experimental effect • To describe the degree of association between IV and DV • (1) eta-square η2 SS B   2 SS T • 優點:易理解計算 • 缺點:數值偏高,高估了IV和DV的關係程度
  • 33. • (2) omega-square ω2  Y   Y|X 2 2 2  Y2 SS B  ( j  1) MSW   ˆ2 SS T  MSW • 優點:考慮自由度,不會高估IV和DV的相關程 度
  • 36. • 然此矩陣在“解”時(做回歸時)會有 multicollinearity 的問題,此問題即第一column 為其他column之和(第一column 可寫為其他 column之線性組合),因此不能解 • 可用兩種變通方式: – Dummy coding – Effect coding
  • 38. • 優點 – Make no priori assumption about the shape of the dist. i.e. weaker or no distributional assumption – No parameters assumed or estimated – More sensitive to medium than mean – Less affected by outliers ( usually we ranks) – Simple calculation – Small samples
  • 39. • 缺點 – Information loss (magnitude, sign, rank) – parametric statistic is more versatile – Less powerful if assumption of parametric tests are met