統計学輪講 第20回
日時 | 2022年11月29日(火) 15時45分 ~ 16時35分 |
---|---|
場所 | ハイブリッド開催 |
講演者 | 加藤真大 (総合文化研究科D2) |
演題 | 最適腕識別:適応的実験計画による方策選択 |
概要 |
最適腕識別は,最も期待報酬の大きい方策(あるいは処置・腕)を効率的に発見する,多腕バンディット問題の一種である.最適腕識別のアルゴリズムは,近年,適応的実験計画による方策選択の手法として,機械学習や統計学の分野で注目を集めている.この発表では,最適腕識別における,サンプルサイズが大きくなる場合の漸近最適性について議論する.リグレットや誤識別率などの異なる指標や,大偏差原理やミニマックスやベイズなどの異なる評価の枠組みのもとで,どのようなアルゴリズムが最適になるかを説明する.特に,文脈(共変量)が観測できる場合の最適腕識別のアルゴリズムを,セミパラメトリック理論に基づいて考察する.最後に,今後の発展の方向性として,方策学習(あるいはempirical welfare maximization)のアルゴリズムとの組み合わせについて紹介する. |