統計学輪講(第19回)

    統計学輪講(第19回)
    日時      2017年10月24日(火)    14時55分~16時35分
    場所      経済学部新棟3階第3教室
    講演者    大森 宏 (農)
    演題      転移学習(fine tuning)による写真間類似度の推定

    概要
    ある環境で撮られた写真群に対して、グルーピング実験から得られた写真間視覚的類似度データがある。
    別の環境で撮られた写真群の視覚的類似度データがあるとき、両者の写真間の視覚的類似度を推定する問題を考える。
    最近、画像認識の分野で深層学習(deep learning)が急速に進歩してきた。
    特に、畳み込みニューラルネット(convolutional neural network : 
    cnn)を用いたVGG16が有名である。
    これは、画像認識コンテストILSVRC2014で優勝したシステムで、画像の1000クラス分類を行う。
    VGG16の1億4千万の学習済みパラメータは公開されている。
    このニューラルネットの上位層は1000クラス分類に特化しているが、下位層では写真の一般的な特徴を抽出しているので、
    これをそのまま用い、上位層のみを自分の問題用に最適化すれば短時間で学習できる。これを転移学習(fine 
    tuning)と言う。
    今回は、入力画像の大きさにより数千から数万程度になるVGG16上位層の出力を画像間類似度に回帰して、
    両者の写真間の類似度がどの程度推定できるのか調べた。
    テストケースとして、写真間視覚的類似度データがある200枚からなる学生生活写真を2つに分け、
    分けた群内のみに類似度データがあると想定して、全体の類似度が復元できるかを見た。
    また、川越市内で撮影された240件の写真と本郷地区で撮影された67件の写真との類似度の推定を行ったので、結果を報告する。