奈良文化財研究所   東京大学史料編纂所

木簡庫東京大学史料編纂所データベースへ

凡例・ご利用方法


Ⅰ.木簡・くずし字解読システム-MOJIZO- とは

「木簡・くずし字解読システム―MOJIZO―」(MOJIZO:モジゾー 英語名:Image matching search for mokkan or cursive characters)は、奈良文化財研究所と東京大学史料編纂所が共同で開発した、画像から検索する〈画像引き〉文字画像データベースです。文字(画像)のクラ(蔵)の意味を込めて、MOJIZOと名付けました。
 このデータベースでは、検索対象の画像を解析し、奈良文化財研究所が蓄積する木簡の字形・字体と、東京大学史料編纂所が集める古文書・古記録・典籍類の字形・字体のそれぞれから、類似する文字画像を表示します。読めない文字についても似た字形の文字を探せる画期的なシステムを、連携検索として実現しました。
 「木簡・くずし字解読システム―MOJIZO―」は、文字画像データベースの新しい可能性を開くものです。既に公開している「木簡画像データベース・木簡字典」(2018年3月に「木簡庫」に統合)「電子くずし字字典」連携検索による、テキストによる検索〈文字引き〉とあわせてご利用ください。

共同研究の経緯

奈良文化財研究所と東京大学史料編纂所は、当該分野における日本を代表する拠点的研究機関として、2009年5月にデータベース連携に関する覚書を交換しました。そして、同年10月に『木簡画像データベース・木簡字典』(2018年3月に「木簡庫」に統合)『電子くずし字字典データベース』連携検索の公開に至っています(連携の経緯は>>>こちら)。 以来、連携協力体制を強化し続け、下記の研究プロジェクトの一環として、かねてより両研究所と共同研究(文字認識分野)を進めていた、桜美林大学耒代誠仁先生の技術協力を受け、このシステムを開発しました。

制作担当者

  • 奈良文化財研究所
     都城発掘調査部史料研究室
      渡辺晃宏・馬場基・山本崇・桑田訓也・山本祥隆・井上幸・方国花・藤間温子
     企画調整部文化財情報研究室
      高田祐一
  • 東京大学史料編纂所 電子くずし字字典開発プロジェクト
     久留島典子(代表)・小宮木代良・松澤克行・井上聡・稲田奈津子・遠藤珠紀・山田太造・和田幸大(当時)・宮崎肇
  • 桜美林大学 総合科学系
     耒代誠仁

関係するプロジェクトと科学研究費補助金

この研究およびシステム開発は、奈良文化財研究所(担当;都城発掘調査部史料研究室)と東京大学史料編纂所(担当;附属画像史料解析センタープロジェクト電子くずし字字典データベース開発プロジェクト(代表 久留島典子))の連携によるものです。
また、下記の日本学術振興会の科学研究費補助金による研究成果の一部です。

  • ①「木簡など出土文字資料の資源化のための機能的情報集約と知の結集」
    (基盤研究(S)、2013~2017年度(予定)、研究代表者 渡辺晃宏、課題番号25220401)
  • ②「歴史的文字に関する経験知の共有資源化と多元的分析のための人文・情報学融合研究」
    (基盤研究(A)、2014~2017年度(予定)、研究代表者 馬場基、課題番号26244041)
  • ③「歴史知識情報のオープンデータ化にむけたスキームと情報利活用手法の再構築」
    (基盤研究(A)、2014~2018年度(予定)、研究代表者 久留島典子、課題番号26240049)
  • ④「古文書字形の機関横断的デジタルアーカイブの拡充・活用を支援する情報技術」
    (基盤研究(C)、2015~2017年度(予定)、研究代表者 耒代誠仁、課題番号15K02841)
《研究分担者一覧》 上記、各科研の分担者は以下の通りです。( )内は所属〈当時〉。

科研① 研究代表者 渡辺晃宏

  • 大山  航 (三重大学)
  • 小口 雅史 (法政大学)
  • 耒代 誠仁 (桜美林大学)
  • 久留島典子 (東京大学史料編纂所)
  • 笹原 宏之 (早稲田大学)
  • 朱  碧蘭 (東京農工大学)
  • 白井啓一郎 (信州大学)
  • 高田 智和 (国立国語研究所)
  • 中川 正樹 (東京農工大学)
  • 馬場  基 (奈良文化財研究所)
  • 森本  晋 (奈良文化財研究所)
  • 山口 英男 (東京大学史料編纂所)
  • 山本  崇 (奈良文化財研究所)

科研② 研究代表者 馬場基

  • 井上  聡 (東京大学史料編纂所)
  • 耒代 誠仁 (桜美林大学)
  • 木村 直樹 (長崎大学)
  • 桑田 訓也 (奈良文化財研究所)
  • 高田 智和 (国立国語研究所)
  • 高田 祐一 (奈良文化財研究所)
  • 吉川  聡 (奈良文化財研究所)
  • 渡辺 晃宏 (奈良文化財研究所)

科研③ 研究代表者 久留島典子

  • 有川 正俊 (東京大学空間情報科学研究センター)
  • 遠藤 基郎 (東京大学史料編纂所)
  • 木村 直樹 (長崎大学)
  • 小宮木代良 (東京大学史料編纂所)
  • 近藤 成一 (東京大学史料編纂所)
  • 柴山  守 (京都大学国際交流推進機構)
  • 馬場  基 (奈良文化財研究所)
  • 古瀬  蔵 (国文学研究資料館)
  • 山家 浩樹 (東京大学史料編纂所)
  • 山口 英男 (東京大学史料編纂所)
  • 山田 太造 (東京大学史料編纂所)

ご協力

  • 株式会社 DTS WEST(システム開発)
  • 澤村真理子(ロゴデザイン)

バージョン情報

  • 2016.3.25 β版
     今後、研究開発を進め、さらなる機能拡充をめざします。
     サービス開始日:2016年3月25日
     スマホ・タブレット版開始日:2017年3月16日

お問合せ

システムや使用方法についてのお問い合わせ、不具合などお気づきの点は、以下までお知らせください。
(なお、個別のデータ内容については、対応しかねる場合もございますので、あらかじめご了承ください。)

  • 奈良文化財研究所都城発掘調査部史料研究室 history-labo☆nabunken.go.jp
  • 奈良文化財研究所研究支援推進部総務課    webinfo☆nabunken.go.jp
    (☆を@に変えてください。)
  • 東京大学史料編纂所   >>>こちら(編纂所お問い合わせフォームに移動します)

Ⅱ.凡例

  1. このデータベースでは、検索対象の画像を解析し、奈良文化財研究所が蓄積する木簡の字形・字体と、東京大学史料編纂所が集める古文書・古記録・典籍類の字形・字体の中から類似する文字画像をそれぞれ表示します。奈良文化財研究所所蔵データ解析結果と東京大学史料編纂所所蔵データ解析結果では構成が異なります。以下の内容をご確認ください。
  2. 解析対象は1文字です。解析したい画像は1文字分になるように、準備してください。
    (画像編集については、>>「画像準備マニュアル」(PDF)をご参照ください)
    なお、奈良文化財研究所の解析用データに、一部合字(「戸主」など)が含まれています。
  3. 解析結果欄の文字画像は検索画像と類似度の高い順に表示されます。結果一覧画面には、まず8件が表示され、画像右上の「さらに見る」ボタンをクリックすると100件まで閲覧可能です。
    >>画面の説明はご利用方法をご参照ください
  4. 解析結果の文字画像の下に表示される文字は、UTF-8の文字コードで表示できる範囲となっています。UTF-8の文字コードにない特殊な文字については、以下の表示方法をとっています。

    【奈良文化財研究所】

    「〓」で示し、可能な限りその後に( )で字形の構成を示します(例:「〓」(土+鬲))。

    【東京大学史料編纂所】

    「&#m+大漢和辞典の文字コード」にて表示します(例:「&#m12646;」)。
  5. 解析結果の出典欄は以下の通りです。

    【奈良文化財研究所】

    木簡の正報告書が刊行されているものは、正報告書(『平城宮木簡』1~7、『平城京木簡』1~3)の出典を優先的に示します。

    〈 〉内は訂正報告を示します。正報告書未収録のものは、木簡概報(『平城宮発掘調査出土木簡概報』4~44)の出典を記します。

    例)「平城宮1-50」=『平城宮木簡』1所収の50号木簡を示す。

      城29-19上(311)=『平城宮発掘調査出土木簡概報』29の19頁上段掲載の通し番号(311)号木簡を示す。

    詳しくは本システムの検索結果からリンクしている木簡庫(詳細情報ページ)の出典欄をご確認ください。

    出典に関する詳細は、木簡庫の出典一覧情報をご参照ください。



    【東京大学史料編纂所】

    「文書名/史料群名」の順となっています。 

  6. 解析結果一覧の文字画像、あるいは出典欄をクリックすると当該文字の詳細画面が表示され、さらに詳しい情報を閲覧できます。

Ⅲ.ご利用方法

※解析画像の作成方法については「画像準備マニュアル」(PDF)をご参照ください。
①解析画面
解析画面

①解析を始める画面です。


[1]画像選択

次のいずれかの方法で画像選択できます。
A 文字画像を直接[1]にドラッグします。
B [1]をクリックまたはタップして文字画像を選択します。
C スマホ・タブレットの場合、[1]をタップして写真撮影を行い、撮影画像を直接選択することもできます。なお、OSや機種によっては、正常に動作しない場合があります。

[2]解析する

この解析するボタンを押すと解析が始まります。解析が終わると②の解析結果一覧画面が開きます。

②結果一覧画面1
結果一覧画面1

②解析結果として、奈良文化財研究所と東京大学史料編纂所の解析結果一覧を表示する画面です。


[3]選択した画像を表示します。

[4]奈良文化財研究所解析結果表示欄

[5]東京大学史料編纂所解析結果表示欄

(以下、[4][5]共通)

[6]類似文字画像

類似度の高い順に8件表示されます。
それ以上の例を表示するには、次の[7]さらに見るボタンを押してください。

[7]さらに見る

100件まで表示します。(③の画面が開きます。)

[8]画像に該当する文字を示します。

[9]出典表示欄

[8][9]欄の詳細は、凡例をご参照ください。
各画像や出典をクリックすると奈良文化財研究所「木簡庫」、東京大学史料編纂所「電子くずし字字典データベース」の詳細画面が表示されます。

[10]解析したい画像を変更する場合は、こちらから再度画像を選択してください。

[11]最初の画面に戻る

①解析画面に戻ります。

③結果一覧画面2
結果一覧画面2

③結果一覧画面1で表示した結果を含めた、100件までの画像を、各機関ごとに、別タブで表示する画面です。


[12]選択した画像

[13]文字画像等(結果一覧画面1と同じ構成です)

[14]閉じる

この画面を閉じます。

※スマホ・タブレットの場合は画面サイズにより表示文言、ボタン、解析結果一覧画面の表示数(スマホの場合は6件)が変わる場合があります。

Ⅳ.よくあるご質問

よくあるご質問は こちら をご参照ください。