統計学輪講(第8回) 日時 2016年06月14日(火) 14時55分~15時45分 場所 経済学部新棟3階第3教室 講演者 田中 凌慧 (農学部 生産・環境生物学専攻D1) 演題 ベイジアン最適化のゲノミックセレクションへの応用 概要 育種(品種改良)の高速化に向けて近年注目されているのがゲノミックセレクション(GS、Meuwissenら 2001)である。 GSでは、遺伝情報xを入力、形質値yを出力とした回帰モデルを考えることにより、一部の個体群の遺伝情報と形質値 (訓練データ)をもとに、未試験の個体の形質値を予測する。これにより、圃場試験にかかる時間的・労力的なコストを 削減することができる。本発表では、GSを用いた育種をさらに効率化する方法として、ベイジアン最適化を応用した研究を紹介する。 育種とは、端的に言えば、選抜(多数の遺伝資源や既存品種から一部を選ぶこと)と交配(それを掛け合わせて子供を得ること) を繰り返すことで、所望の形質を持つ個体を作り出す営みである。仮に形質yの値が大きいほど望ましいとすれば、育種は、 出力(形質値)yを最大にする入力(遺伝情報)xを持つ個体を探索する、一種の最適化問題と捉えることができる。これは、 形質値と遺伝情報の関係式y=f(x)が未知であるため、未知の関数を最適化する問題といえる。また、データの組(x,y)を 得ることは圃場試験に対応する高コストな行為であるため、できるだけ少ない数のデータ(少ない関数評価の回数)で 最適化を行うことが望ましい。GSにおけるこれらの制約は、ベイジアン最適化(Mockus 1994)において想定される条件と 類似している。一般的なベイジアン最適化は、未知の目的関数をガウス過程を用いて近似し、expected improvement (EI)と 呼ばれる量を基準にサンプリングを行うことを繰り返し、少ない回数の関数評価で未知の関数を最適化する。この近似と サンプリングのステップはGSにおけるモデル構築と選抜に似ており、したがってEIを基準に選抜を行うことですぐれた個体を 高速に発見できると考えられた。そこで、簡単な状況として、有限個の品種候補から最も遺伝的に優れた品種を探索する状況を想 定し、既存のデータを用いたシミュレーションを行った。シミュレーションの結果、通常GSで行われる予測値の事後平均を 基準とする選抜に比べて、EIを基準とする選抜のほうが、早期に最良の品種を発見できることが示唆された。