日 時 2017年3月15日(水) 18:30-19:30
場 所 MTRL KYOTO
スピーカー 橋本 雄太さん(京都大学大学院 文学研究科)
内容 歴史災害史料の市民参加型翻刻プラットフォーム『みんなで翻刻』の紹介。クラウドソーシングのプロセスに市民の学習を組み込むサイトの設計について。


メモ

当日参加者12名(世話人3名+スピーカー含む)

  • 京都大学古地震研究会について
    • 「みんなで翻刻」の主宰団体
    • 普段の活動では日本史や地震学等のメンバーが集まり古文献を読んでいる。
    • 人数が限られているため、メンバーだけでは読める分量に限りがあった。
  • 地震と古文献について
    • 日本には100年以上の地震研究の歴史がある。
    • 地震にかんする歴史資料のデータベース化が各地の大学等で進められている。
    • 資料の中には一部史料が未収録だったり史料本文が省略されたりしたものもある。
    • そのため、地震が起きた日付等が取り違えられて解釈されてしまうこともある。
  • 「みんなで翻刻」開発までの経緯
    • 石本文庫(東大地震研の石本先生が個人的に収集した歴史資料)を使用。
    • くずし字を読むという作業は難易度が高い。
    • しかし、くずし字学習アプリのダウンロード数が多かった。
    • くずし字学習への一定の需要があると予測し学習ベースのプロジェクト設計に。
    • 言語学習分野での先行事例(duolingo、Lang-8)を参考にした。
  • 「みんなで翻刻」の設計
    • 機能の紹介(添削希望、「あっぱれ」、学習要素、フォーラムなど沢山の機能がある)
    • それぞれの歴史資料の難易度は研究会が決めている。
    • 作業進捗は資料の画像単位で管理。
    • ゆるキャラ「しみまる」(“紙魚(シミ)”がモチーフ)
  • 公開後の対応
    • 各種広報活動(プレスリリース、関西版を中心とした新聞報道、ニコニコ生放送)
    • 現在、8割以上の公開資料が翻刻着手済み。
    • 朝日新聞デジタルでの公開直後、ニコニコ生放送直後にアクセス数上昇。
  • 質の担保について
    • 参加者同士で翻刻内容を修正しあうなど集合知を利用。
    • 最終的には研究会がチェックして質を担保。
    • 現在定量的評価は行っていないが、かなりのレベルで正確という印象がある。
    • ただし表記揺れなどの課題もある。
    • Twitterでは好意的意見(「楽しい」等)も否定的意見(「一瞬で飽きてしまう」等)も。
  • 参加者の傾向
    • 先週からTwitterで使用者アンケートを実施。
    • 大学で日本史や国文学を専攻していたなどの参加が多い。
    • Twitter経由で知った人が多く、新聞報道で知った人は少ない。
    • 作業的な楽しさを感じている、という人が多そう。
  • まとめ
    • 古文献のテキスト化
    • くずし字という難度の高い作業
    • 学習ベースのプロジェクト設計
  • 宣伝
    • ニコニコ超会議(2017/4/29-30)に「みんなで翻刻」出展予定
  • Q&A
    • 他分野への「みんなで翻刻」のシステムを応用すること自体は比較的容易ではないか。画像収集や権利手続きなどに手間がかかるかもしれない。
    • 関連分野の専門家からは肯定的な意見が多いという印象がある。
    • システム開発は橋本さんが担当。約5か月かかった。
    • 他の研究者が同様の試みを行いたい場合、プラットフォームを外注するという手もあるが、その分野に詳しい人が中に入らないと細かい所で問題が出てくる可能性も。