統計学輪講(第10回)

統計学輪講(第10回)
日時      2015年06月23日(火)    14時55分~15時45分
場所      経済学部新棟3階第3教室
講演者    田島 里華 (医D1)
演題      スパースな疫学研究データ解析におけるベイズ的回帰分析手法の比較

概要
 集団内の疾患発症状況を捉え、リスク因子による影響の強さを定量化し、評価することを目指す疫学研究では、
扱う疾患の頻度が小さい上に調整すべき交絡因子が多いために、回帰分析の結果が不安定となるスパースデータが
得られることが多い。医学研究では、リスク因子の影響に関する事前知識が存在している場合がほとんどだが、
これが解析に活かされることは少ない。本研究は、日本人女性で発症が稀な心筋梗塞に対する、総コレステロールの
影響の大きさを評価する際に、既存の医学知識を回帰係数の事前分布に反映したベイズ的ロジスティック回帰の
適用を提案する。具体的には、疾患発症に対する説明変数の対数オッズ比の事前分布に、既知の情報に基づいて
平均と分散の値を設定した多変量正規分布を考える[1]。
 シミュレーション実験にて、提案法の性能を、通常の回帰と、無情報事前分布を用いた回帰と比較した。結果、
他の方法では推定が不安定であった回帰係数に関し、提案法はバイアスを少量増やすことで平均二乗誤差を大きく
減少させた。また、提案法を日本国内の疫学研究データ解析に適用した。結果、総コレステロール値が240 mg/dL以上の
カテゴリで心筋梗塞のリスク上昇が示唆された。また、心筋梗塞に対する確立したリスク因子であるにも拘らず、
オッズ比の点推定値が通常の回帰で0.001以下であった交絡因子の喫煙で、既知の医学知識を反映したベイズ的回帰により、
推定値は1を超える方向に縮約された。ベイズ的回帰により、事前の医学知識を疫学におけるスパースデータ解析に反映し、
より信頼できる結果が得られる可能性が示唆された。

1. Greenland S. Putting background information about relative risks into conjugate prior distributions. Biometrics 2001;57:6
63-70.