統計学輪講(第19回) 日時 2017年10月24日(火) 14時55分~16時35分 場所 経済学部新棟3階第3教室 講演者 大森 宏 (農) 演題 転移学習(fine tuning)による写真間類似度の推定 概要 ある環境で撮られた写真群に対して、グルーピング実験から得られた写真間視覚的類似度データがある。 別の環境で撮られた写真群の視覚的類似度データがあるとき、両者の写真間の視覚的類似度を推定する問題を考える。 最近、画像認識の分野で深層学習(deep learning)が急速に進歩してきた。 特に、畳み込みニューラルネット(convolutional neural network : cnn)を用いたVGG16が有名である。 これは、画像認識コンテストILSVRC2014で優勝したシステムで、画像の1000クラス分類を行う。 VGG16の1億4千万の学習済みパラメータは公開されている。 このニューラルネットの上位層は1000クラス分類に特化しているが、下位層では写真の一般的な特徴を抽出しているので、 これをそのまま用い、上位層のみを自分の問題用に最適化すれば短時間で学習できる。これを転移学習(fine tuning)と言う。 今回は、入力画像の大きさにより数千から数万程度になるVGG16上位層の出力を画像間類似度に回帰して、 両者の写真間の類似度がどの程度推定できるのか調べた。 テストケースとして、写真間視覚的類似度データがある200枚からなる学生生活写真を2つに分け、 分けた群内のみに類似度データがあると想定して、全体の類似度が復元できるかを見た。 また、川越市内で撮影された240件の写真と本郷地区で撮影された67件の写真との類似度の推定を行ったので、結果を報告する。