統計学輪講 第09回

日時 2023年06月13日(火)
14時55分 ~ 15時45分
場所 経済学部新棟3階第3教室
講演者 岡野 遼 (経済D2)
演題 ワッサースタイン計量の下での多変量ガウス分布間の回帰モデル
概要

各サンプルが確率分布の形で与えられるようなデータセットを考える。このようなデータは分布値データと呼ばれ、それを解析するための統計手法の開発が近年進められている。分布値データを扱う主要なアプローチとして、確率分布の集合にワッサースタイン計量を導入するというものがあり、特に[1]などではこのアプローチに基づいて、一次元分布を一次元分布に回帰させるような回帰モデル(分布間回帰モデル)を提案している。しかしそれらのモデルは、分布が一次元の場合のワッサースタイン計量特有の性質に基づいており、分布が多次元のケースに拡張することが難しい。

本発表では、ガウス分布間の最適輸送問題が多次元分布であっても例外的に陽に解けることに注目し、ワッサースタイン計量の下での多変量ガウス分布間の回帰モデルを提案する。まず、ガウス分布を線形な行列空間の要素へ変換する方法を提案し、この変換がワッサースタイン計量をある程度保存することを示す。提案モデルは、変換した行列間の線形回帰モデルとして定義される。次に、提案したモデルを用いて分布の予測を行う場合の予測誤差の理論解析を行う。また、テンソルの低ランク分解を用いて分布の次元が大きい場合に対処する方法や、ガウス性の仮定を緩和する方法についても議論する。最後に、シミュレーションと実データ解析を通じて、提案手法による分布の予測が他手法による予測に比べてワッサースタイン距離の意味で誤差が少なくなることを示す。本発表は今泉允聡先生との共同研究の内容に基づく。

参考文献:
[1] Chen, Y., Lin, Z. and Müller, H.-G. (2023). Wasserstein regression.
Journal of the American Statistical Association, vol. 118(542), pp. 869-882.