Multiple ImputationとPropensity scoreについて
Multiple ImputationとPropensity scoreについて以前いろいろ情報を集めたので、
ネ申:Dr.Rubin
いろいろ書いてから以下のサイトがあったことに気づいた。
The multiple imputation FAQ page
Circ Cardiovasc Qual Outcomes. 2010 Jan;3(1):98-105. doi: 10.1161/CIRCOUTCOMES.109.
Missing data analysis using multiple imputation: getting to the heart of the matter.
He Y.
PMID: 20123676 
以下は上の論文から一部コピペ。
まず押さえておくべき概念(しかしなかなか覚えれない)。
”Three broad types of missingness mechanisms, moving from the simplest to the most general, are:
1.Missing completely at random (MCAR):
 A variable is MCAR if the probability of missingness is independent of 
any characteristics of the subjects. For example, each survey respondent
 decides whether to answer the “age” question by rolling a die and 
refusing to answer it if a “1” appears (ie, with a probability of 1/6). However, most missingness is not completely random.
 In the hospice study, for example, older patients are more likely than 
younger ones to have nonresponse on either income or insurance 
questions.
・すべての欠測は、完全にランダムに起こる=
・ Complete Case Analysis(CCA)でも妥当な結論が得られる(=
・Complete Case Analysisは推奨しない Little et al. (2012)) 解析対象集団から、
2.Missing at random (MAR):
 A more general assumption, MAR, is that the probability a variable is 
missing depends only on observed variables. For instance, older patients
 might be more likely to miss “insurance” than younger patients, and 
then “insurance“ is MAR if the study has collected information on age 
for all patients in the survey.
・欠測のメカニズムは、
・ WEEやモデルに基づく推定方法(ML, Bayes,MIなど)で、妥当な推測が可能
・単一代入法(LOCFなど)も仮定が正しければ妥当な(
・単一代入法を利用する上では、十分な科学的根拠の説明が必要!
・名前からは誤解されがちだが、完全にランダムな欠損ではない!
※ Dr.
3.Not missing at random (NMAR):
 Missingness is no longer “at random” if its probability depends on 
variables that are incomplete. A common example is that people with 
higher income are less likely to reveal them, that is, the nonresponse 
probability for the income variable depends on values that can be 
missing.”
・欠測のメカニズムは、
 (まぁ通常の欠損メカニズムはどれもこれでしょう)
・感度解析をするしかない!!
・Pattern-Mixture Models
・Selection Models
・MNARのもとでの解析手法のスタンダードの確立は、
・NMARは、文献によってはMNAR (Missing Not At Random) とされることもある
”Ad Hoc Missing Data Methods Complete-Case Analysis
A common missing data approach is complete-case analysis (CC、もしくはCCA),
 which uses only subjects who have all variables observed and is also 
the default option in many statistical software. When data are MCAR, CC 
analysis results are unbiased. When data are MAR but not MCAR, it is 
permissible to exclude the missing observations, provided that a 
regression model controls for all the variables that affect the 
probability of missingness.9 However, CC analysis generally has major 
deficiencies.5,10 The results can be biased when data are not MCAR. In 
addition, the reduction of statistical power by discarding cases is a 
major drawback. For example, suppose data are MCAR across 20 variables 
and the missingness fraction is 5% for each variable. Using CC analysis 
will lose close to two thirds of the subjects because the fully observed
 subjects only account for (1% to 5%)20 ≍36% of the original sample.”
MIについてのソフトウエア
”Software
Some popular imputation software includes:
- SAS: PROC MI uses regression methods and propensity scores for imputation. PROC MIANALYZE combines estimates output from various complete-data procedures.
- S-plus: The missing data library supports different models for multivariate normal (“impGauss”), categorical variables (“impLogin”), and the conditional gaussian (“impCgm”) for imputation involving both continuous and categorical variables.
- R: It supports libraries such as “norm,” “cat,” “mix,” and “pan” for imputing data under multivariate normal models, log-linear models, general location models, and linear mixed models, respectively. In addition, libraries including “mi” and “Hmisc” impute data in more complex scenarios and provide tools for diagnostics.
- IVEware: Imputation and Variance Estimation software for SRMI, callable by SAS (http://www.isr.umich.edu/src/smp/ive). 
- MICE: Multiple Imputation by Chained Equations, library available in both S-plus and R (http://web.inter.nl.net/users/S.van.Buuren/mi/html/ mice.htm). 
- ICE: SRMI library available in STATA.”
●津川さん
→
” MVN modelを使うのが得策だと思います。
Am J Epidemiol. 2010 Mar 1;171(5):624-32. doi: 10.1093/aje/kwp425. Epub 2010 Jan 27.
Multiple imputation for missing data: fully conditional specification versus multivariate normal imputation.
Lee KJ1, Carlin JB.
”Multivariate normal(MVN)はカテゴリー変数であってもbinary variableであっても連続変数として扱うモデルです。
セオリー的に証明されており、
Rubinが初めて開発したMIはこちらになります。
MICEはより新しいモデルで、
MVNの方がモデルとして安定していますし、
カテゴリー変数などは0/1のダミー変数にして、0~
”MICEはlogistic regressionなどを使うので、complete separationの問題などがあるとconvergeしませ
一方で、MVNは全ての欠損値を一回でimputeするので、
両方やってみて感度分析とするのが一番良いと思いますが。”
”こちらのKohei Hasegawa先生との論文ではMVNでMIした後に、
Appendixに詳しい方法が書いてあります。
”METHODS
Multiple imputation
In
 the patient- and ED-level models we conducted multiple imputation 
byusing the multivariate normal imputation method for the variables 
withmissing data. The proportion of missing values was small (
REFERENCES
E1. Rubin DB. Multiple imputation for nonresponse in surveys. New York: John Wiley& Sons; 1987.
E2. Little RJ, Rubin DB. Statistical analysis with missing data. New York: Wiley-Interscience;2002.
E3. Graham JW. Missing data analysis: making it work in the real world. Ann RevPsychol 2009;60:549-76.
E4.
 von Hippel PT. Regression with missing y’s: an improved strategy for 
analyzingmultiple imputed data. Sociol Method 2007;37:83-117.” ”
●相良さん
→
”SASでMIをされるのであれば、
インストールの際に以下の手順が必要ですが、
私でも出来るので先生方であれば、まず大丈夫だと思います。
Make
 sure the directory containing the SAS executable binary file (SAS.EXE) 
is on the System Path. A quick way to check this is simply to select the
 Start Menu, Run... prompt and then type in cmd, to open a Windows 
Command Prompt. Change into the C:\iveware directory; then type sas at 
the command prompt. If SAS executes then it is already set on the System
 Path.”
”いろんなアプリケーションがあるようですね。
Am Stat. 2007 Feb;61(1):79-90.
Much ado about nothing: A comparison of missing data methods and software to fit incomplete data regression models.
Horton NJ1, Kleinman KP.”
”proc miとiveを比較している文献もありました。
●相田先生、
”*ただし、MICEは収束しにくく、MVN(
Lee
 KJ, Carlin JB: Multiple imputation for missing data: fully conditional 
specification versus multivariate normal imputation. Am J Epidemiol  
171(5):624-632,2010.”
●データセットはいくつ作るべきか?
Selecting the number of imputations (m)
Historically,
 the recommendation was for three to five MI datasets. Relatively low 
values of m may be appropriate when the fraction of missing information 
is low and the analysis techniques are relatively simple. Recently, 
however, larger values of m are often being recommended. To some extent,
 this change in the recommended number of imputations is based on the 
radical increase in the computing power available to the typical 
researcher, making it more practical to run create and analyze MI 
datasets with a larger number of imputations. Recommendations for 
the number of m vary. For example, five to 20 imputations for low 
fractions of  missing information, and as many as 50 (or more) 
imputations when the proportion of missing data is relatively high. Note
 that estimates of coefficients stabilize at much lower values of m than
 estimates of variances and covariances of error terms (i.e., standard 
errors). A larger number of imputations may also allow hypothesis tests 
with less restrictive assumptions (i.e., that do not assume equal 
fractions of missing information for all coefficients). Multiple runs of
 m imputations are recommended to assess the stability of the parameter 
estimates. 
・データセットをたくさん作ると、
・高橋(2014)(下記リンク)では、
・Dr.野間(2014、講演会):「最低でも100‐
●Rounding After Multiple Imputation With Non-binary Categorical Covariates
論文書くとき:欠損値の範囲は報告すべき(○%-▲%)
アウトカムまでMIするんでしょうか?
統計学的に考えれば、アウトカムであれ曝露因子であれ、
↓
**Imputing the Missing Y’s: Implications for Survey Producers and SurveyUsers
 上記論文では以下について例を出して解説
1) アウトカムだけcomplete analysis
2) アウトカムも含めてMIして、
3) アウトカムも含めてMIして、MIしたアウトカムを使う
ざっくりいえば、3>2>1の順で、厳しい検定になりそう。
とくに3は、使用するNが増えているのに、
論文のスペースが許すなら、supplementary tableなどで感度分析として上述の1~
スペースがないなら、3を提示すべきか?
いやーしかしそれっておかしい気が・・・・だってそれって曲論、
●
Handling missing data in RCTs; a review of the top medical journals
http://www.biomedcentral.com/
(坪谷による粗い日本語訳&サマリ)
”いわゆる4大医学雑誌(BMJ,JAMA,Lancet,
ということで、トップジャーナルでさえ、
最後に・・・:
N Engl J Med. 2012 Oct 4;367(14):1355-60. doi: 10.1056/NEJMsr1203730.
The prevention and treatment of missing data in clinical trials.
PMID: 23034025
”まぁいろいろ書いたが、
解析での対処方法
・臨床試験において、
・個々の試験のデザイン,測定値の特性などに応じて,
・モデリングや推測の方法も非常に広範に及び、
欠測に対する4つの調整方法
・ Complete-Case Analysis
・ 単純な補完方法(Single Imputation)
・ 重みつき推定方程式(Weighted Estimating Equation; WEE)による方法
・ モデルに基づく方法(最尤法,ベイズ推測,多重代入法など)
補完方法
・ Single Imputation 単一代入法: 欠測値に対して、適当な単一の値を代入する補完方法。超簡単。 すべての単一代入法は「欠測データを100%確実に予測できる」
・ 得られるP値も誤り(Type-1 Error Rateを名目水準以下に保持できない)
・ 得られる信頼区間も誤り(過度に狭い)
・ 主要な評価に用いるのであれば、この精度の問題も含め、
 ・ Last Observation Carried Forward (LOCF): 脱落を起こした時点での値を、
・WEE:
・Inverse Probability Weighting:欠損を起こしやすいケースに重み付けをする
★★★★★★★★★★★★★★★★★★★★★★★★★★★★★★
Propensity score:
坪谷の理解:PSの使い方はいろいろあって、
大切な論文:
Rubin DB: Estimating causal effects from large data sets using propensity scores.
Ann Intern Med 1997; 127: 757-763.
日本語論文・本:
星野 崇宏
調査観察データの統計科学―― 因果推論・選択バイアス・データ融合 ――
岩波書店
岩崎 学
不完全データの統計解析
エコノミスト社
素晴らしいウェッブの資料
・吉田氏のスライド
・星野氏の論文
・東北大学循環器の宮田氏の資料
・慈恵の浦島氏の資料
PSをpredictするmodelを作る時の共変量の選択の注
①従属変数より因果が後の変数はいれてはならない
②処置後変数で、かつ従属変数より因果関係が前の中間変数は、
③従属変数と関連がありそうな共変量は、
などを考えつつ、
そしてmatched pairを作って、両群の基本特性を比較してみて、
え?再考はどうやるかって?残念ながら「
Am J Epidemiol. 2006 Jun 15;163(12):1149-56. Epub 2006 Apr 19.
Variable selection for propensity score models.
”The
 results suggest that variables that are unrelated to the exposure but 
related to the outcome should always be included in a PS model. The 
inclusion of these variables will decrease the variance of an estimated 
exposure effect without increasing bias. In contrast, including 
variables that are related to the exposure but not to the outcome will 
increase the variance of the estimated exposure effect without 
decreasing bias.”
Contemp Clin Trials. 2011 Sep;32(5):731-40. doi: 10.1016/j.cct.2011.05.006. Epub 2011 May 16.
Are propensity scores really superior to 
-----------------------
2014/12/01追記
ICRweb 統計スコアの講義(2014.5)資料より
(P.45)どの解析法が最も良い?
→統計家の中でもディスカッション中
• 条件にもよるがIPTWが最も推定値のバイアスが少ない傾向あり
Austin PC Int J Biostat. 2009 Apr 14; 5(1):Article 13.他
• 多変量解析は唯⼀
Multivariate Behav Res. 2011 May; 46(3): 399–424.
• マッチングは相対的にバイアスが少ないので、まずマッチングを⾏
Katz, Mitchell H. Cambridge University Press, 2010.
(P.47)傾向スコアの解析をしないとマズイか?
• 過去の発表された論⽂をレビューすると、従来の⼿法(
Shah et al. Journal of Clinical Epidemiology 58(2005) 550-559.Sturmer et al. Journal of Clinical Epidemiology 59(2006) 437-447.
• ⼀般の単純な解析で⽬的が⼗分果たされるなら、従来の⼿法を⽤
Katz, Mitchell H. Cambridge University Press, 2010.
• 結局の所、傾向スコアの解析・傾向スコアを⽤
Katz, Mitchell H. Cambridge University Press, 2010.
-----------------------
2015/02/16追記
J Thorac Cardiovasc Surg. 2007 Nov;134(5):1128-35.
Propensity-score matching in the cardiovascular surgery literature from 2004 
Austin PC1.
There are three commonly used propensity score methods: 
1) covariate adjustment using the propensity score,
2) stratification on the propensity score, 
3)  and propensity score matching.
Earlier
 studies have shown that propensity score matching results in the 
comparison of treated and untreated subjects who are more similar than 
does stratification on the propensity score.6,7
6. Austin PC, Grootendorst P, Anderson GM. 
A
 comparison of the ability of different propensity score models to 
balance measured variables between treated and untreated subjects: A 
Monte Carlo study. 
Stat Med. 2007;26:734-53.
7. Austin PC, Mamdani MM. 
A comparison of propensity score methods:a case-study estimating the effectiveness of post-AMI statin use. 
Stat Med. 2006;25:2084-2106.
→PSの方法は、1)PSそのものを調整因子に使う、2)
マッチング前後で、2群間の各変数のばらつきの差の変化の指標
「標準化効果量」Absolute Standardized Difference
実際に使っている論文:Wijeysundera DN et al: Arch Intern Med 170: 1365-74, 2010
しかしこの論文では、
この論文では、「標準化効果量」については、
J Thorac Cardiovasc Surg. 2007 Nov;134(5):1128-35.Propensity-
ということで上記も読んでみましたが、上記は「標準化効果量」
「Wijeysundera DN et al: Arch Intern Med 170: 1365-74, 2010」の論文がREFを間違えたのか、
「Absolute Standardized Difference」の説明を求めて、pubmedで"
Pharmacoepidemiol
 Drug Saf. 2014 Aug;23(8):802-11. doi: 10.1002/pds.3574. Epub 2014 Jan 
29.Propensity score balance measures in pharmacoepidemiology: a 
simulation study.Ali MS1, Groenwold RH, Pestman WR, Belitser SV, Roes 
KC, Hoes AW, de Boer A, Klungel OH.
一方で、pubmedではなく、google scholarで同様の検索をすると、
まぁそれはともかく、「Absolute Standardized Difference, %」は重要だろうなぁ~とは思いました、
ちなみに以下のTsuboya et alの論文では、
Am J Ind Med. 2015 Feb;58(2):229-37. doi: 10.1002/ajim.22409.
Working
 overtime and risk factors for coronary heart disease: A propensity 
score analysis based in the J-SHINE (Japanese Study of Stratification, 
Health, Income, and Neighborhood) study.
Tsuboya T1, Aida J, Osaka K, Kawachi I. 
PMID: 25603945 
まぁとはいうものの正直細かいことは見議論しだしても大差ないの
最近思うことは、我々(統計そのものの専門家ではない)
追及しても大差はありませんが、
ロジスティックやCOXの方法論などと同じかなと思います。
 
0 件のコメント:
コメントを投稿