傾向スコアマッチと多重補完法の解説 その1
- 8. 相関 ≠ 因果
・ ドイツで、コウノトリのつがいの数と出生数が正の
相関関係を示している。
・ コウノトリが増えると出生が増えるという因果関
係?
- 10. 相関 ≠ 因果
・ 世界での海賊行為の数と地球温暖化が負の相関
関係を示している。
・ 海賊は地球温暖化を阻止していたという因果関
係?
- 26. Rubin’s causal model
あり データ
介入ありの
場合の転帰
欠損値
介入なしの
場合の転帰
実際に求まるのは
上記の差だが…
介入以外の独立変
数も違う別世界
なし 欠損値 データ
年齢
性別
対象患者
重症度
ADL
緊急度
経済状況
治療時期
医療機関
…
未知の因子
治療選択は共変量
に影響される
治療
Yokukikumab
- 30. Rubin’s causal model
あり データ
介入ありの
場合の転帰
欠損値
介入なしの
場合の転帰
なし 欠損値 データ
年齢
性別
対象患者
重症度
ADL
緊急度
経済状況
治療時期
医療機関
…
未知の因子
PSMの場合
治療
Yokukikumab
- 31. Rubin’s causal model
あり データ
介入ありの
場合の転帰
欠損値
介入なしの
場合の転帰
なし 欠損値 データ
58歳
女性
対象患者
中等症
ADL自立
待機的
健康保険
2014年
大学病院
…
未知の因子
PSMの場合
治療
Yokukikumab
- 32. Rubin’s causal model
あり データ
介入ありの
場合の転帰
欠損値
介入なしの
場合の転帰
なし 欠損値 データ
76歳
男性
対象患者
重症
伝い歩き
待機的
無保険
2008年
一般病院
…
未知の因子
PSMの場合
治療
Yokukikumab
- 33. Rubin’s causal model
あり データ
介入ありの
場合の転帰
欠損値
介入なしの
場合の転帰
なし 欠損値 データ
76歳
男性
対象患者
重症
伝い歩き
待機的
無保険
2008年
一般病院
…
未知の因子
PSMの場合
この確率を背景因子か
ら計算したものがPS
治療
Yokukikumab
- 44. • “lalonde” datasetを使っています。
• 教育効果(介入)の年収(転帰)に対する因果
関係を調べてみましょう。
• 12変数からなる445例の観察研究です。
– 背景因子 8変数
– 治療 1変数
– 転帰 3変数
• 欠損値の無い完全データです。
実際にやってみましょう
- 45. 変数表
独立変数 (Propensity scoreの構成変数)
age 年齢
educ 教育年数
black 黒人
hisp ヒスパニック
married 既婚者
nodegr 高校卒業
re74 1974年の年収
re75 1975年の年収
介入 (Propensity scoreの目的変数)
treat 教育プログラムの有無
目的変数
re78 1978年の年収
実際にやってみましょう
- 46. Before PSM
Stratified by treat
0 1 p test
n 260 185
age (mean (sd)) 25.05 (7.06) 25.82 (7.16) 0.265
educ (mean (sd)) 10.09 (1.61) 10.35 (2.01) 0.135
black (mean (sd)) 0.83 (0.38) 0.84 (0.36) 0.649
hisp (mean (sd)) 0.11 (0.31) 0.06 (0.24) 0.076
married (mean (sd)) 0.15 (0.36) 0.19 (0.39) 0.327
nodegr (mean (sd)) 0.83 (0.37) 0.71 (0.46) 0.001
re74 (mean (sd)) 2107.03 (5687.91) 2095.57 (4886.62) 0.982
re75 (mean (sd)) 1266.91 (3102.98) 1532.06 (3219.25) 0.382
re78 (mean (sd)) 4554.80 (5483.84) 6349.15 (7867.40) 0.005
u74 (mean (sd)) 0.75 (0.43) 0.71 (0.46) 0.326
u75 (mean (sd)) 0.68 (0.47) 0.60 (0.49) 0.065
- 47. After PSM
Stratified by treat
0 1 p test
n 150 150
age (mean (sd)) 25.41 (6.86) 25.48 (7.29) 0.929
educ (mean (sd)) 10.11 (1.67) 10.29 (1.77) 0.349
black (mean (sd)) 0.87 (0.33) 0.87 (0.34) 0.864
hisp (mean (sd)) 0.05 (0.23) 0.06 (0.24) 0.804
married (mean (sd)) 0.18 (0.39) 0.16 (0.37) 0.646
nodegr (mean (sd)) 0.81 (0.40) 0.77 (0.42) 0.399
re74 (mean (sd)) 1821.88 (4792.12) 1517.04 (4370.13) 0.565
re75 (mean (sd)) 1329.82 (3350.84) 914.13 (1943.45) 0.190
re78 (mean (sd)) 4064.76 (4568.86) 6149.53 (7960.04) 0.006
u74 (mean (sd)) 0.76 (0.43) 0.78 (0.42) 0.682
u75 (mean (sd)) 0.68 (0.47) 0.68 (0.47) 1.000
- 49. Propensity score matching
欠点
• 多くは後ろ向き解析。
• サンプルサイズの計算が困難。
• PSの構成変数を決める標準的な手法は確立していない。
• 介入前の背景因子がPSを構成するため、計算困難な場合
がある。
• 未知の背景因子は十分に調整できない。
• マッチングできなかった対象を除外するため、
– 検出力が低下する。
– PSの重なり合いが少ない介入の解析は困難。
• 欠損値に脆弱で更に検出力が低下する。