『電子くずし字字典データベース』『木簡画像データベース・木簡字典』連携検索

・連携のコンセンプト

 歴史を学び研究するに当たっては、さまざまなモノに記された文字を正確によみとることが何より必須である。東京大学史料編纂所では古文書・古記録・典籍類に書かれた文字を読み解くため、奈良文化財研究所では地中から発掘された木簡に記された文字を読むため、それぞれ字形・字体の画像を集めたデータベースを開発し公開を進めてきた。『電子くずし字字典データベース』『木簡画像データベース・木簡字典』の両データベースは、対象とする資料は異なるものの、字を読むツールとしてのコンセプトや機能において共有する部分が大きく、連携することによって、その利便性は著しく高まるだろう。
 両データベースが連結されることで、字形画像の検索範囲は時代的に一挙にひろがりを持つことになる。史料編纂所の『電子くずし字字典データベース』は、所蔵史料から字形を集めているが、その覆う範囲は平安時代から江戸時代初頭に止まっている。これに奈良文化財研究所が蓄積する木簡データが統合されることで、飛鳥・奈良という古代の情報が一挙に加わることになる。利用者は古代から近世初頭に至る字形の変遷を、一画面のうちに見ることが可能となるのである。
 また検索の結果、表示される文字画像には、豊富な典拠情報が付加されている。字を読むための字典類は多数出版されているが、本という物理的制約もあって、その文字をどこから採取してきたのかという出典や、その記された年代といった情報は極めて限定されていた。両データベースは、ネットワーク上の電子媒体であるという特性を生かして、様々なメタ情報をふんだんに搭載しており、研究者の厳密な要求に答えることが可能になるだろう。


・両データベースのコンテンツ

*電子くずし字字典データベース

 史料編纂所所蔵の古文書・古記録より字形・字体を収集している。
1)収録文字・語彙種約 20,000種(2009年3月現在)
2)文字画像数約148,000件(2009年3月現在)

*木簡画像データベース・木簡字典

 奈良文化財研究所が管理する木簡より字形・字体を収集している。
1)文字数約24,000件(2009年8月現在)
2)文字種約 1,500種(2009年8月現在)
3)文字画像数約35,000件(2009年8月現在)


・連携の経緯について

2004年度両データベースの開発にあたり担当者間で情報交換開始
2005年度両データベースの公開へ
2008年4月東大史料編纂所にて科学研究費補助金基盤(S)「史料デジタル収集の体系化に基づく歴史オントロジー構築の研究」(研究代表者:林譲・史料編纂所教授)が、奈良文化財研究所にて科学研究費補助金基盤(S)「木簡など出土文字資料釈読支援システムの高次化と綜合的研究拠点データベースの構築」(研究代表者:渡辺晃宏)が採択され、データベース連携にむけた環境が整備される。
2009年5月田辺征夫奈良文化財研究所長と加藤友康史料編纂所長との間で、両データベース連携に関する覚書交換。
2009年10月連携検索供用開始


・開発担当者

 東大史料編纂所・電子くずし字字典開発プロジェクト
  久留島典子(代表)・井上聡・遠藤珠紀・和田幸大・宮崎肇
 奈良文化財研究所・都城発掘調査部史料研究室
  渡辺晃宏(代表)・馬場基・山本崇・浅野啓介・井上幸