統計学輪講(第24回)


日時    2001年10月 9日(火) 15時50分〜16時40分
場所    経済学部5階視聴覚室
講演者  戸石睦美(経済M1)
演題     未発見の種の数の推定法を、シェイクスピアの総語彙数の推定に
          応用したEfron & Thistedの論文についての紹介

概要:  シェイクスピアの全作品は31,534語から成る。(のべ884,647語)
それに対し、Efron & Thistedは、シェイクスピアが実際にはどのくらいの
単語を知っていたのかについて、Fisherによるparametric empirical 
Bayes modelとGood & Toulmin によるnonparametric modelの2種類の
方法によって推定を試みている。その推定結果として、少なくともあと
35,000語を知っていたと結論付けている。本稿では、その2種類の推定方法を
検討し、結果についても考察する。


統計学輪講のスケジュールに戻る.