歴史地名データをNeatline/Omekaにマッピング

昨年度、人間文化研究機構+H-GIS研究会から、歴史地名データが公開されました。これは単なるテキストデータなのですが、それゆえに大変画期的なものです。何が画期的かと言えば、みんなで自由に加工して好きなように使えるからです。きれいな地図も絵も何もありませんが、代わりに、このデータを使って自分で便利な地図や絵を作成することができますし、それをきれいにデザインすることもできます。さらに、再配布も可となっているため、このデータを使って自分で作った地図や絵をネットに公開することもできます。

 

さて、そこでさっそく、この地名データを使って何かしてみたい・・・と思いつつ半年ほど過ぎてしまいましたが、このたびようやく、諸事情によりこれをいじらねばならない状況になりましたので、少しいじってみました。とりあえず今回は、「城」に関する地名をNeatline/Omekaの地図上に一括マッピングしてみる、と言う内容を例としてあげてみます。たとえば以下のような感じになります。こちらでマップそのものも閲覧できます。

 

f:id:digitalnagasaki:20181121095302p:plain

 

この方法について、以下にご紹介していきます。

 

まず、必要なものは、OmekaにCSVImportプラグインとNeatlineプラグインをインストールしたものです。Omekaのインストールについてはこちらをご覧ください。自力でインストールせずとも、どこかにOmekaのインスタンスを用意してくれる人/部署を見つければよいのですが、自分のパソコンにもインストールできます。

 

 さて、準備ができましたら次はデータの加工です。ここで微妙にややこしいのが、Omeka/Neatlineの場合、メルカトル図法での座標情報を要求してくる点です。一方、歴史地名データでは世界測地系(WGS 84)を用いているため、これを変換する必要があります。この点はNeatlineユーザの間ではわりとよく知られているようで、こちらJavascriptでの変換プログラムも提供されています。これに加えて、データ形式

GEOMETRYCOLLECTION(POINT(15111247.565786 4161286.75838))

という感じにしてOmeka上の(ダブリン・コアの)Coverageフィールドにマッピングしておくと、Neatline地図上にプロットできる座標情報になるみたいです。というわけで、とりあえず、最後のフィールドにこれを追記したものをこちらに置いておきます。計算式が間違っていたり、データがずれていたりしたらお知らせください。

 

 それでは次に、この29万件以上のデータからお城のデータだけを取り出してみます。ここで大変ありがたいことに、この歴史地名データには「属性」がついていて、地名_属性.txt というファイルにその説明が記されています。これを見ていくと、

16,"建物","城",1

という行があります。この16番というのが 地名.txtの「属性」フィールドに対応しているようですので、「属性」フィールドが16となっているものを取り出してみます。この場合、データ量が結構多いので、grep などを使うと便利でしょうか。取り出した上で、さらにフィールド名を先頭行に入れたものがこちらになります。206件ありました。

 

 ここまでできたら、あとはOmekaに取り込むだけです。が、まず最初に大事なのは「コレクション」を作っておくことです。今回は「お城マップ」というコレクションを作成しています。

 次に、以下のようにしてCSVImport機能で任意のコレクション(この例では「お城マップ」)を指定してから

f:id:digitalnagasaki:20181121102449p:plain

 

このファイルを読み込ませると、以下のような感じになりますので、少なくとも Coverageとtitleだけはきちんと選択しておいてください。あとはお好みで。

 

f:id:digitalnagasaki:20181121102212p:plain

 

インポートが終わったら、次はこのデータをNeatlineの地図にインポートします。

 

Neatlineの地図は、コレクション単位等でアイテムをインポートすることができます。この際に、coverageに所定のフォーマットのデータが入っていると、地図上にいきなり一括マッピングしてくれます。今回の場合ですと、以下のような感じです。

 

f:id:digitalnagasaki:20181121102630p:plain

 

加工可能な形でデータが公開されていると、このように、色々自由に活用できるという点が大変ありがたいですね。あとは、まあ、ぼちぼち、手で修正するもよし、もっとデータを加工してからCSVImportするもよし、色々楽しめるのではないかと思います。

 

 

日本大学文理学部のシンポでIIIFの話をします。

 明日は日本大学文理学部で行われるシンポジウムで少しIIIFのご紹介をさせていただきます。情報感度が高い人には「またあの話か」という感想しかないだろうと思いますが、経団連の会長が今期の人になってようやくメールを使うようになったという話題が出たり、某大辞典デジタル版が5万字のうちの多くの文字がパソコンで表示できないという前提で切り出し文字画像で作成され、しかもWindows対応のみのスタンドアロン版で作成発売されてしまったりと、まだまだ意志決定をされる方々のところまでIT関連の情報を共有することは我が国にとって大きな課題であるように改めて思っておりまして、最新のシステムの開発に没頭したい気持ちも強いのですが、しかし、地味にきちんと、なるべくわかりやすい言葉で現在の状況を広めていく努力がつねに重要であると肝に銘じているところです。

 

 ところで、今回のお話を準備するにあたって、少し対策が必要な状況が発生して、まあなんとか解決できたので、もしかしたらみなさんのお役に立つかもしれないと思い、メモとして残しておきます。

 

 今回も、トロント大学図書館で開発されているOmeka IIIF Toolkit を事例の一つに使おうと思っていたのですが、以前にhttpで登録したIIIFコンテンツやNeatline上のannotationのIIIF Manifest / IIIF Image APIURIが、httpsにリダイレクトされるようになったことでなんだかうまく動かなくなってしまったのです。リダイレクトの仕方をきちんとすればちゃんと動くのですが、しかし、この状況では、もはやhttpのURI自体に意味がなく、なるべくhttpsに変更してしまった方がいいように思ったのです。

 もちろん、一つずつ手で直していくこともできますが、それではどうにもこうにも大変です。そこで、Omekaのデータが実際に登録されているMySQLのデータベース上で直接書き換えてしまおう、というわけです。

 MySQLのデータベース自体のいじり方は、色々なサイトで解説がありますのでそちらに譲ります。ここでは、mysql -u root -p で use <Omekaが使っているDB名> で、とりあえず当該のDBを触れる状態になっていることを前提とします。

 ここでは、omeka_element_texts と omeka_iiif_items_cached_json_data のテーブルに、修正すべき内容が含まれているようです。そこで、それぞれ、

 

update omeka_element_texts set text=replace(text, 'http://unique_name', 'https://unique_name.');

update omeka_iiif_items_cached_json_data set data=replace(data, 'http://unique_name', 'https://unique_name');

 

という風にすると、Omekaに登録した情報やNeatlineで付与したannotationの類いを一通り修正できるようです。ただ、気をつけていただきたいのは、unique_nameのところがちゃんとユニークでないと、余計なところまで変換してデータが全部ダメになってしまうという点です。当然のことながら、作業をする前にダンプはとっておきましょうね。

 

欧米の文献学者によるデジタル文献学の最先端と欧州デジタルアーカイブの最先端

来週月曜日(9/10)、一橋講堂(東京都千代田区)にて、無料公開国際シンポジウムが開催されます。参加費無料・要登録で、登録は本日までです。バート・キャベル先生、ユリア・ノルデグラフ先生、スーザン・シュライプマン先生による、同時通訳付きのご講演です。文化資料を対象としたデジタル技術の研究活用についての最新動向を、日本とヨーロッパの例を中心として日本語で聴講できるまたとない機会です。まだ残席ございますので、ぜひご登録&ご参加をお待ちいたしております。詳しくはこの記事の下をご覧ください。

 

無料公開国際シンポジウムの背景とさらなるお誘い

このブログでも何度か触れてきましたが、欧米の文献学者の中には、デジタル媒体をきちんと活用していこうという流れが強くあり、それを反映したデジタル化ガイドラインも作成され、技術の進歩にあわせて改訂が続けられてきています。そのガイドラインの策定・改訂を欧米で長らく担ってきたTEI (Text Encoding Initiative) 協会が、今回初めて、欧米を離れて日本で年次大会を開催します。欧米の文献学者(IT専門家ではなく)が主導するデジタル文献学を日本で知ることができるという、絶好の機会になります。年次大会の事前申し込みは締め切りましたが、当日申し込みも可能ですので、ぜひお越しください。

 

無料公開国際シンポジウムをもう少し詳しく

これにあわせて開催される日本デジタル・ヒューマニティーズ学会の年次国際学術大会JADH2018と合同で開催されるのが、冒頭でご紹介した、無料国際シンポジウムです。

ロバート・キャンベル先生は、すでに日本でも有名な先生ですが、現在は、国文学研究資料館の館長として、日本古典研究のための大規模デジタル化プロジェクトを率いておられます。

ユリア・ノルデグラフ先生は、音声・映像や文化遺産の保存と利活用の研究に取り組んでおられ、アムステルダム大学のデジタル文化遺産の教授としてヨーロッパの文化資料のデジタル化と利活用を先導しておられます。

スーザン・シュライプマン先生は、アイルランド詩の研究の傍ら、欧米のデジタル・ヒューマニティーズを牽引する活動に長らく取り組んでおられ、米国で長らく仕事をされた後、アイルランドに移られました。米国では、この分野の研究者を育成するとともに欧米で決定版とされる入門書を2度にわたって編集・刊行し、現在はアイルランドクラウドソーシング翻刻プロジェクトを率いるなど、多方面で活躍しておられます。

 ロバート・キャンベル先生のお話から、日本の古典籍デジタル化の最先端をおうかがいできることは言うまでもありませんが、

 デジタルアーカイブに関心をお持ちの方は、ユリア・ノルデグラフ先生のお話から、ヨーロピアーナの先にある姿をイメージできると思います。

 文献学のデジタル化(単なる文字起こしではなく)についてご関心をお持ちの方は、スーザン・シュライプマン先生のお話から、文献学を含む人文学の社会における位置づけを含む多くのことを学ぶことができると思います。

 特に、海外からいらっしゃるお二人の先生のお話を、日本で日本語で聞ける機会は非常に貴重です。この機会を、ぜひ、ご活用いただければと思っております。

 

デジタル校訂テクスト作成のMOOCに日本語字幕がつきました

このところ、東京大学で開講されている人文情報学に関する授業を通じてDHへの取組みを始めた大学院生を中心に、近隣の若手研究者にも加わっていただいて、「デジタル校訂テクスト作成のMOOCに日本語字幕をつける」という取組みを行っていました。

 

やや長目の前置き

 ここで一つ、お断りしておかなければならないのは、「校訂テクスト」という用語です。「校訂」という言葉には、誤ったものを訂正するというニュアンスが入ってしまいがちであり、実際の所、「正しいテクストを作るために」校訂を行っているという時代もあったようです。しかしながら、残っている様々な写本・版本・原稿は、「正しい」と言えるものが本当に存在するのか、という問題が常につきまといます。たとえば、源氏物語を書いた紫式部の直筆原稿が残っていない以上、どれが正しいかというのは推測でしかありません。でも、江戸時代に広く読まれた木版の源氏物語は、もしかしたら紫式部が書いた源氏物語からは少々離れたものかもしれませんが、しかし、一方で、江戸時代に広く読まれた(であろう)テクストであるという状況には、研究対象としても相応の意義・価値が見いだせるかもしれません。江戸時代にそれを読んだ人たちにとっては、それが源氏物語であり、それを元にして色々な思考や活動を紡いでいったのですから。

 似たようなことは、聖書でも仏典でも見いだすことはできるでしょう。そうだとすると、現在残されている写本・版本などが様々に異なりを見つけられるからといって、それらをまとめて「正しいテクスト」を見出そうとすることは、やや乱暴なことである、という風に考えることもできます。そうすると、そのようにして様々な少しずつ異なる文章を含む写本・版本群をとりまとめて一つのテクストとして提示しようという取組みを「校訂」、つまり、誤りを正す、というニュアンスを含む言葉で表現するのは、誤解を招いてしまうのではないか、という懸念が生じます。この懸念を避けるために、「学術編集版」という言葉が提唱されています。

 実際の所、紙媒体では、たとえば Nestle-Aland版ギリシャ語新訳聖書に端的に見られるように、「本文」を書いた上で、脚注に「異文」を記載するというスタイルを避けることはなかなか容易ではありません。この状況で「校訂」と言ってしまうと、「本文こそ(のみが?)正しく価値がある」という考え方を、ともすれば強化してしまいがちであるようにも思われます。しかし、デジタル媒体では、必ずしも「本文」のみを示す必要はなく、むしろ、複数の異文を含むテクスト様々なビューで表示してみる、といったことが簡便に行える可能性があり、実際に、このMOOCで紹介しているText Encoding Initiative (TEI) Guidelinesは、それを実現するための記述方法であり、欧米の文献学ではすでにそういうことが普通にできるようになっています。たとえば西洋中世写本研究のカリキュラムにも、この記述の仕方が取り入れられ、若手研究者にとっては、得手不得手はともかく、リテラシーのレベルでとりあえず学んでおく技術ということになっているようです。

 さて、少し話を戻しますと、筆者としては、基本的には「学術編集版」に賛成なのですが、しかしながら、今度は、日本語の「編集」という言葉が孕む行為としての弱い側面が、editという言葉がもつ強さを十分に反映できず、逆の意味での誤解を招かないか、という心配も一方で持っております。そのようなことから、ここでは「校訂テクスト」という、誤解を招くかもしれない言葉を、しかし、日本語の慣用としてのわかりやすさから、用いてみています。TEIをベースとした、「デジタル学術編集版」が、「校訂」という言葉の持つ危うさを実践の面からフォローしてくれるのではないか、という期待もあります。(特に、lemmaを持たないcritical apparatusという使い方がそれを示してくれていると思っています。)

 

デジタル校訂テクスト作成のためのMOOC

 前置きが長くなりましたが、そのようなことで、デジタル学術編集版(≒デジタル校訂テクスト)を作成(記述)するために、DARIAH(欧州人文学デジタル研究基盤)が昨年後半に公開したMOOCに日本語字幕をつけるという作業が、完了はしておりませんが、かなり進みましたので、お知らせする次第です。

 MOOCのサイトはこちらです。

 なお、様々に用意されている教材群や説明書きはまだ和訳されていません。が、MOOCのビデオをみていただくだけでも、TEIによるテクスト校訂の記述がどのような考え方に基づいて行われているか、というのは、テクスト校訂についてご存じの方であれば、把握していただけるのではないかと思います。私がこの仕事に取り組んでいて面白いと思うことの一つは、西洋中世のことを研究している、日本語や東洋の言語文化のことなどまるで知らない人たちが語る「デジタル校訂」についての問題意識とそれに基づく実装が、西洋中世写本のことなどまったくわからないこちらにもよくわかる、ということです。もちろん、西洋文献学の影響を受けたから、という背景もあるだろうとは思いますが、それを踏まえた上でも、やはり面白いと感じてしまうところです。MOOCのビデオの一覧はこちらで閲覧できますので、よかったらぜひ、字幕を日本語にして、お楽しみください。

 おそらく、日本語で、テクスト校訂に関するTEIガイドラインのまとまった解説はこれが初めてなのではないかと思います。その意味でも、今回の日本語字幕付きMOOCは貴重なものなのではないかと思います。(個人的には、部分的には論文で言及したりしたことはあります。あるいは、もしすでにこういうものがあるということをご存じの方がおられましたらぜひお知らせください。)

 

 それと、注意しておいていただきたいのは、ここで講義されていることが「記述方法」である、という点です。「表示」と「記述」は別なものである、という考え方が割と広く受容されているようであり、「表示」のためのソフトウェアはまた別途開発されています。有名なものに、メリーランド大学Versioning Machineがあります。が、他にも色々な表示用ソフトウェアが世界各地で開発されています。一度、TEIのガイドラインに準拠して記述しておけば、あとは様々なソフトウェアで表示したり処理したり分析したりすることができるし、さらに、いつか誰かがとても素晴らしいソフトウェアを開発してくれた時に、労せずしてそれにうまく読み込ませてさらに利活用の幅を拡げることができる(=将来に向けての前向きな投資)、ということでもあるのです。

 

日本語字幕を作成された方々

 今回の日本語字幕作成に携わった方々は、以下のとおりです。DARIAHのサイトにも掲載されていますが、頑張ってくださったみなさんに敬意を表して、字幕翻訳者一覧をこちらにも掲載させていただきます。

  • 伊集院栞 Shiori Ijuin (The University of Tokyo)
  • 幾浦裕之 Hiroyuki Ikuura (Waseda University)
  • 一色大悟 Dr. Daigo Isshiki (The University of Tokyo)
  • 小林拓実 Takumi Kobayashi (The University of Tokyo)
  • 小風尚樹 Naoki Kokaze (The University of Tokyo)
  • 李増先 Dr. Zengxian Li (Ritsumeikan University)
  • 宮崎展昌 Dr. Tensho Miyazaki (Intl. Institute for DH)
  • 永崎研宣 Dr. Kiyonori Nagasaki (Intl. Institute for DH)
  • 纓田宗紀 Soki Oda (The University of Tokyo)
  • 岡田一祐 Dr. Kazuhiro Okada (National Institute of Japanese Literature)
  • 山王綾乃 Ayano Sanno (Ochanomizu University)
  • 鈴木親彦 Chikahiko Suzuki (Center for Open Data in the Humanities)
  • 田中翔Shogo Tanaka (The University of Tokyo)
  • 王一凡 Yifan Wang (The University of Tokyo)

 

終わりに代えて

DARIAHのMOOCは、他にも様々な用意されています。自分で日本語訳して日本語でも使えるようにしたい教材を発見した人がおられましたら、先方に相談してみますのでぜひお声がけ下さい。

国内外のデジタルアーカイブの研究活用事例を知るイベント2件:

さて、またずいぶんブログの更新を怠っておりましたが、その間、色々なところで活動しておりました。特に印象に残ったのは、ヴェトナムのDHコミュニティの立ち上げのお手伝いの仕事でした。これはもう少ししたら具体的なことをアナウンスできると思います。その他、ワシントンDCで開催されたIIIFカンファレンスで発表したり、IRG国際会議で北京に行ったりしていましたが、そのご報告はまた後日ということで、今回は、表題の件です。

 

 私も研究分担者をさせていただいている科研費基盤研究(S)のプロジェクトで、フランスとドイツ/米国から、デジタル・ヒューマニティーズの著名な研究者かつ実践者をお二人お呼びして、日本でワークショップとシンポジウムを開催する運びとなりました。

 そこで、同時通訳付きのシンポジウム(+国内の最新事例のデモ19件)と、使い勝手なども含めたテキストデータベースの具体的な話をする小さなワークショップという、二つのイベントを開催することになりました。(いずれも、参加費無料ですが要参加申込みですので、上記リンク先のサイトにて、お早めにお願いいたします。

 

 海外から来て下さるお二人のお仕事については、それぞれのサイトにも書いてありますが、このお二人のプロジェクトは、ヨーロッパ全体を対象とした大型で包括的な研究向けデジタル基盤提供プロジェクトDARIAHと、専門分野に特化された精密かつ巨大なデジタルアーカイブペルセウスデジタル図書館・西洋古典フルテキストデータベース)という、対照的な、しかしそれぞれがデジタルアーカイブの研究利用という観点から世界の最先端を行っているものです。特に、ペルセウスデジタル図書館についてのご講演は、本邦初です。メールマガジン『人文情報学月報』で特集されたことがあります。ペルセウス・デジタル・ライブラリーのご紹介(1)(2)(3)このお二人にそれぞれ同時通訳付きで講演をしていただくのが、7/6のシンポジウムです。この日は、人文学のためのデジタル学術基盤を考えるという趣旨になりますので、これらに加えて、国立情報学研究所の大向先生からも、日本のデジタル学術情報基盤全般と、そこにおける人文学の位置づけについてのお話をいただきます。

 

 また、それに加えて、今回は、国内の関連する組織・プロジェクト等から19件のポスター・デモンストレーション発表をいただきます。これは、国内での人文学向けのデジタルアーカイブ研究活用の最先端の事例とその中心メンバーの方々に、参加者の皆さんと直接やりとりをしていただき、情報を得ていただくということを目指しております。近年の人文学におけるデジタルの活用に関する議論を拝見しておりますと、海外どころか、国内の事情もうまく共有されないままにあまり建設的でない議論になってしまうことも時々あるようです。今回は、そういう状況を一気に解消して、皆で地に足の着いた将来像を描いてみることができるようになることをも目指しております。デモンストレーションを提供して下さる機関については、こちらのリストをご覧下さい。ほとんどは研究活用に向けたデジタルアーカイブ、もしくはそのサービス基盤を提供しているところからの発表、ということになります。

 

 それらの機関からポスターとデモンストレーション発表を出していただき、それぞれに液晶ディスプレイを使っていただきながら40分間+αのデモンストレーション時間に説明と質疑応答をしていただくという形になる予定です。残念ながらこの19件だけでは国内の先進事例のすべてを網羅できているわけではないのですが、しかし、これだけのプロジェクトが一堂に会し、情報提供をしてくださる機会は非常に希ですので、我国の人文学におけるデジタル研究基盤、あるいは、デジタル時代の人文学の将来像にご関心をお持ちのみなさま方におかれましては、ぜひこの機会をご活用いただきたく存じております。

 

 もう一つのイベントは、前日(7/5)に開催される、上記のワークショップです。こちらは同時通訳はなく、英語での開催となりますが、ペルセウスデジタル図書館と、SAT大蔵経テキストDBという、二つのテキストデータベースを採り上げて、より具体的なテクストDBについての議論が行われる予定です。とりわけ、西洋古典のテクスト研究におけるデジタル技術活用の最新動向についてご関心がおありの方は、こちらもぜひご参加下さい。

 

 ということで、参加されるみなさまと、うまく色々な有益な情報を共有できればと思っております。そして、参加できなかった方々とも、事後に、なんらかの形で情報を共有できればと思っております。すべきことが多すぎて、みんなで大変な時期にさしかかっておりますが、なんとか乗り切っていきましょう。

 

IIIFの活用をもう少し踏み込んで:SAT2018の事例より

ここのところ、合間を見つけて、ちょこちょこと作っていたものが、ようやく日の目をみてもよさそうなところまできたのでご紹介です。再びIIIFの話です。

 

SAT大蔵経テキストデータベース2018(SAT2018) と IIIF Manifests for Buddhist Studies (IIIF-BS)をうまく組み合わせてより利便性を高めたいと思っておりまして、結果として、以下のようなものができました。たとえば、『妙法蓮華経』の例を見て頂くと、右下にダイアログが開いて、以下のように、各地から公開されている経典画像の断片が、全体のどの部分にあたるか、というのが比較的正確に表示されるようになりました。

f:id:digitalnagasaki:20180426033124p:plain

これは大正新集大藏經の行番号をIIIF-BSで各IIIFマニフェストに割り当てておいて、その行番号をみて該当する箇所に該当するIIIFマニフェストを表示しています。横方向が経典の全体で、そのうちでそれぞれのIIIFマニフェストが対応する部分に関して、バーとして表示されるようにしています。このバーをクリックすると、IIIF対応画像に関しては、上のようにMiradorに表示されます。なお、この図の縦方向は、今のところ、公開期間ごとに分けているというだけでそれ以上の意味はありませんのでご注意ください。これを年代別にできるといいなあと思っているのですが、そのためには各画像の年代を調べて書いていかないといけないので、それはちょっと骨が折れそうです。(でもいつかできるようにしたいです)

 この表は、ホイール操作でズームすることもできるので、たとえば以下のようにして拡大してみて、各資料がどこまで残っているかを詳しく比較しながら確認することもできます。

f:id:digitalnagasaki:20180426033953p:plain

 

それから、「高麗蔵」「宮内庁宋版一切經」などは、まだIIIF対応ではないので、単に新しいウインドウ/タブがポップアップするだけ、という風になっています。

お試ししてみたい方は、以下にいくつかリンクを用意しておきますので、それぞれクリックしてみて「巻タイトル」の隣にある「画像一覧」というボタンをクリックしてみて下さい。そうすると、上記のような画像一覧の表が表示されるようになっています。

 

妙法蓮華経

http://21dzk.l.u-tokyo.ac.jp/SAT2018/T0262.html

『金光明最勝王経』

http://21dzk.l.u-tokyo.ac.jp/SAT2018/T0665.html

f:id:digitalnagasaki:20180426034706p:plain

 

今夜はもう寝なければならないので、とりいそぎ、速報ということでここまでとさせてください。

 

 

 

 

 

 

 

IIIF対応で画像を公開することの意義を改めて:各図書館等の事例より

前回の記事に引き続き、もう少し具体的に、各地の図書館等のIIIF画像とSAT2018との連携の状況についてのご紹介を通じて、IIIF対応で画像を公開することの意義を改めてみていきたいと思います。

 

1.京都大学東京大学の例

たとえば、以下の画像群は、左からみていくと、東京大学総合図書館、SAT研究会、京都大学図書館から公開されている画像です。東京大学総合図書館とSAT研究会の画像は仏教学のプロジェクトとしてデジタル化・公開されているので、このように使われているのはある意味これまでの流れの続きと言えると思います。

 一方、ここでまず注目しておきたいのは、京都大学図書館の画像です。京都大学図書館に関しては、おそらく、仏教学のプロジェクトの一環として公開したわけではなくて、自らのコレクションを学術利用全般のために公開するという文脈で公開したのだと想像しております。しかし、IIIF対応で公開したことによって、公開した側としてはそれ以上の手間暇はとくにかけなくとも、このようにして専門家コミュニティが利用するサイトにかなり便利な形で組み込まれて、教育・研究に活用される環境が作られていくことになります。

 

f:id:digitalnagasaki:20180409032637j:plain

ちなみに、このビューを得るには、以下のURLにアクセスして、巻17のところにあるIIIFアイコンを二つクリックして、ついでに大正新脩大藏経の巻17の始めの行のIIIFアイコンもクリックすると、大体完了です。

http://21dzk.l.u-tokyo.ac.jp/SAT2018/T1563_.29.0854b08.html

全画面表示する前は以下のような感じになりますが、全画面表示すると、上のように、大きく表示されて、読みやすくなります。

f:id:digitalnagasaki:20180408162835j:plain

 

 

2.ハーバード大学京都大学東京大学の例

あるいは、同様に、以下の例では、大慧普覺禪師語録巻二十五のうち、ハーバード大学京都大学東京大学、SAT研究会から公開されているものを並べてみています。

f:id:digitalnagasaki:20180408175338j:plain

これは、以下のURLから、一つ前の例と同様に、巻二十五のところにあるIIIFアイコンをクリックしていただくと表示できるようになっています。

http://21dzk.l.u-tokyo.ac.jp/SAT2018/T1998A.47.0916b11.html

 

3.九州大学・フランス国立図書館の例

以下の例は、金光明最勝王経という経典の第三巻の画像です。九州大学図書館では、この経典のかなりきれいな全巻揃いの写本を公開している一方で、フランス国立図書館で公開している敦煌写本画像のなかに同じ箇所のものがあったので、これも並べられるようにIIIFアイコンを用意しております。以下のURLから、上述のような仕方で閲覧できます。

http://21dzk.l.u-tokyo.ac.jp/SAT2018/T0665_.16.0413c10.html

f:id:digitalnagasaki:20180409034745p:plain

 

4.島根大学東京大学の例

島根大学図書館でも最近IIIF対応での画像公開が始まりましたが、そこに少し仏典画像が含まれていました。そこの『大智度論』の写本も、このようにして既存の他の画像と並べることができるのですが、この場合、右の二つの例とは区切り方が異なっており、大正新脩大藏経の脚注によれば、石山寺に写本で伝えられるものと一致していることから、そちらの系統の写本であることが想像されます。こちらは、頁を開いたあと、このビューにたどり着くのに少々手間がかかるので、URLは省略します。そういうパターンでもうまくアクセスできるようにすることを、次の開発目標にしています。

f:id:digitalnagasaki:20180409041408p:plain

 

5.バイエルン州立図書館・東京大学の例

バイエルン州立図書館は、IIIFに初期段階から熱心に関わっている機関の一つですが、そこでも、最近、東アジア資料のIIIF画像公開を始めたようです。日本の資料も色々ありますので、それはそれでどなたか何とかしてくださるとありがたいと思っておりますが、仏典関連資料も色々ありましたので、それもリンクしてみております。

http://21dzk.l.u-tokyo.ac.jp/SAT2018/T0262_.09.0027b13.html

f:id:digitalnagasaki:20180409042246p:plain

 

6. バチカン図書館の例

バチカン図書館では、NTTデータが技術面を担当しつつ、膨大なコレクションをIIIF対応で公開しつつありますが、そのなかに一つ、金泥写経があります。さすがにNTTデータが担当しているだけあってか、頁めくり方向を右⇒左にきちんと対応させていました。IIIFのルールとしてはきちんと用意されているのですが、ハーバードやフランス国立図書館等、欧米の機関だとなかなか対応できていないなかで、ありがたいことです。

f:id:digitalnagasaki:20180409043938p:plain

 

7.国文学研究資料館九州大学の例

国文学研究資料館は、現在、日本で最も多くのIIIF対応画像を公開している機関です。ここは、日本の古典籍を多く収集しているため、仏典関連でも、日本で広く読まれたものが多く公開されているのかもしれません。ここでは「仏説善悪因果経」が複数公開されていましたので、並べて見ています。読み下しにしてくずし字にしたものが一つ公開されていましたが、それと同じ版とおぼしきものは九州大学からも公開されていますので、それもならべてみています。それ以外にも、いくつか、国文学研究資料館から公開されていましたので、とりあえず見つけたものをリストしてみています。

http://21dzk.l.u-tokyo.ac.jp/SAT2018/T2881.html

f:id:digitalnagasaki:20180409045446p:plain

 

8.終わりに

 IIIFを通じて世界の文化機関が目指したのは、このようにして自らのコレクションを公開した際に、利用者が各自の文脈に応じてそれらを再編成し、効率的効果的に活用できるようにする環境を提供する、ということでした。ここまでみてきたように、ほとんどの機関は、仏教学のプロジェクトとして仏典画像を公開したのではなく、自らのコレクションを公開した中に、たまたま仏教学に役立つ資料画像が含まれていた、ということであるように思えます。それが、IIIF対応で公開されていることによって、このように、第三者が資料を集めて、特定の利用者コミュニティの利用方法に特化する形でサービス提供できるようになりました。この事例では、SAT2018から連携したことによって、各公開機関の方で電子テクストを用意していなくとも、SAT2018で全文検索した結果から画像にたどりつくルートが用意されたという形になっています。

 さらに、ここでは、単にSAT2018という単独のデジタルアーカイブで活用できるようにするだけでなく、以下のサイトにおいて、共同でIIIF対応画像を収集し、共同で目録情報を付与し、Web APIで利用できるようにもしています。

http://bauddha.dhii.jp/SAT/iiifmani/show.php

このIIIF Manifests for Buddhist Stufiesというサイトを介することで、同様のサービスを他のデジタルアーカイブにも追加することができるのです。たとえば、文学研究や歴史研究、あるいは漢字研究のためのサイトに特定のいくつかの仏典の画像が有用であるならば、その仏典に関するIIIF画像だけを、以下のようなURLで動的に入手することができます。(以下の例では、妙法蓮華経の巻第六の画像のIIIF Manifest URIのリストをApache Solrの検索結果の形で入手できます。)

http://bauddha.dhii.jp/SAT/iiifmani/show.php?m=getByCatNum&cnum=T0262&scrnm=s6

動的に、というのは、たとえば、上記のサイトに同じ経典の同じ巻の情報を誰かが追加したら、それを利用者はリアルタイムに入手・利用できるようになる、ということです。

 このように、単に、世界中のデジタルコンテンツに横串を指して利用者に便利なサービスを様々に提供できるようになるだけでなく、様々な便利なサービスを生み出すためのサービスを作りだしてそのような動きを促進することもできる、というのがIIIFが持つ大きな可能性であり、面白さでもあると思います。

 デジタル画像を公開するにあたり、少しでもうまく・幅広く活用されることを目指すなら、このようにして活用可能性を大幅に広げる機能を持ち、すでに世界的にも広く活用されるようになっているIIIFに対応しておくことは、目的達成のためのとても有力な選択肢であるように思われます。ここまで読まれた方で、まだ対応しておられない機関の方は、ぜひ、これを機に採用をご検討いただければと思っております。なお、すでに国内でもIIIFに対応できる企業は知る限りでも4社以上ありますので、外部発注をするにしてもそれほど問題なく導入できることと思いますし、内製が可能な組織であれば、容易に導入できるフリーソフトが様々に用意されていますので、ぜひ挑戦してみてください。

 さらに、画像だけでなく、音声・動画や3D等についても、徐々にIIIF対応が広がりつつあります。まだ事例はそれほど多くないですが、少なくとも画像と同様のことができるようになっていく見通しですので、そのようなコンテンツに関しても、採用に向けて検討してみていただくとよいかもしれません。