ケンブリッジ大学デジタル図書館の日本資料の書誌情報を視覚化してみる

本日は、第3回 日本宗教文献調査学 合同研究集会という会合でパネルディスカッションの司会をさせていただきました。 司会が自分が言うのもなんですが、大変興味深い議論が行われたようにも思いまして、ご参加いただいたみなさまのおかげで意義のある場になったように思いました。

もし、このパネルディスカッションの場でこういう話になった場合に、ということで少し用意したネタがあったのですが、結局披露することができずに お蔵入りとなってしまったのでこちらで紹介させていただきます。内容は表題の通りです。

ケンブリッジ大学デジタル図書館では、幅広い分野をまたぐデジタル図書館を公開していて、サブジェクト・ライブラリアンが 付与したやや詳細なメタデータがCC BY-NC-NDで公開されています。(欧州の文化機関から公開されているメタデータですがCC0ではない という点も留意していただきたいところです。)

このメタデータは、TEI (Text Encoding Initiative) ガイドライン(本家英語版日本語解説版)に準拠して作成されており、用意された情報に関しては機械可読性がかなり高いものと なっております。当初はケンブリッジ大学図書館日本司書の小山さん等、当該図書館の人達がメタデータをつけていたような感じがしますが(この点、間違えていたら ご教示ください)、途中から立命館大学アートリサーチセンターの方々が参入してがんばってくださったようで、日本文化資料だけで463件が画像(IIIF対応)と ともに公開されています。

このTEIガイドラインに準拠したメタデータには、いくつかの特徴がありまして、特に興味深いのは、来歴情報、provenanceが割とよく書いてあり、 そこに登場する人物を同定できるようにしている、という点です。そうすると、この書誌情報データを一通り取得すれば、たとえば以下のような ことができます。

f:id:digitalnagasaki:20210220131545p:plain

これは、「ケンブリッジ大学デジタル図書館における日本資料の入手に関わった人の 貢献の割合をTEI ガイドライン形式の書誌情報データから取得・表示」したものです。 日本資料のTEI/XMLデータを一通りダウンロードしたあと、それをPythonでささっと処理してデータを数えて、 それをエクセルに入れてグラフにしたというものです。

さらに、この情報と、本の刊行年を組み合わせると、以下のようなものを作れます。こちらは、資料を入手した人ごとにわけて、それぞれの刊行年をタイムライン上に表示したものです。 なお、このインターフェイスはこちらでぐりぐり動かせます。

f:id:digitalnagasaki:20210220131809p:plain

f:id:digitalnagasaki:20210220131828p:plain

各資料名をクリックするとケンブリッジ大学デジタル図書館のその資料のページに飛ぶようになっています。

これはあくまでも一例ですが、TEIガイドラインは書誌情報記述のために色々な細かなルールを用意していて、これらを活用することで、上記のようなものだけでなく、様々な視覚化や分析が可能となります。

さて、これを実際にどういう風にやればいいのか…というあたりは、今度、そのうちまた書かせていただきたいと思います。とにかく、詳しい書誌情報をきちんと機械可読に書くことができれば、 資料についての分析方法がとても多角的になるということと、西洋中世写本ではこういうことがすでにかなり広く行われているようである、ということで、今回はここまでとさせていただきます。