統計学輪講(第29回)

日時      2010年11月16日(火)  15時50分~16時40分
場所      経済学部新棟3階第3教室
講演者    中西 佑介 (情報理工M2)
演題      比較するモデルのL^2距離を用いた混合分布の均一性の検定(文献紹介)

概要

混合分布の成分の数を確かめることは統計学において興味深く挑戦的な問題であ
った.Chenらは分布によらない近似的に強力な方法である修正尤度比検定量(
MLRT)を提案したが、この論文では有限な混合分布が均一であるかをどうかを検
定する新しい方法を提案する.提案する方法であるD検定は、均一なモデルと混
合モデルの$L^2$距離に基づいたものである.基本的な分布が混合分布の成分で
ある場合、D検定統計量はパラメータ推定量の閉形式表現(closed-form
expression)で書けることが特徴であり,尤度比タイプの統計量とは違う点であ
る.このため、データマイニングへの利用が期待できる.また均一であるという
帰無仮説の下でのD検定統計量の収束率を証明することができる.混合分布の成
分が正規分布である場合、D検定はMLRTに対抗できることも実証した.一方、指
数分布の場合は、サンプル数が少ない時はMLRTの方が良いが、これは均一なモデ
ルと混合モデルの視覚的な差がない、つまりL^2距離がほとんどないためと考え
られる.そこで我々は適切な重み関数を導入することによって、D検定に用いる
データを変形する方法も提案した.この一般化されたD検定を利用すれば前記の
場合でも改善することが可能である.

参考文献:
Charnigo, R and Sun, J: Testing homogeneity in a mixture distribution
via L^2 -distance between competing models. J. Am. Statist. Assoc. ,
2004