Europeanaを実際に使ってみました。

最近、Europeana がすごいということで各方面が大変賑わっているのですが、プロジェクトや政策としてのすごさはよく伝わってくる割に、内容についての話があんまり聞こえてこないので、実際にどれくらいのところに来ているのか、試してみました。

といっても、残念ながら、筆者は、Europeanaが得意とする(であろう?)ミュージアム関係のことはよくわからず、そもそも欧米の文物の研究というのも専門的に扱う能力はないので、(たとえば「Hamlet」で検索したりするとすごいことになるのでこれがどれくらいすごいのか専門的に理解できないというのはとても残念ですが)、仏典がどうなっているか確認してみることにしました。念頭にあるのは、大英図書館やフランス国立図書館のWebサイトで大規模に公開されていることをすでに把握している敦煌文書です。やはりここはメジャー路線ということで、ちょっと法華経妙法蓮華経)について検索してみました。その顛末が以下の通りです。

まず、日本人ですので、普通に使う漢字で検索してみました。
妙法蓮華経 0件

でした。あれれ…と思って、「経」の字を「經」にして検索してみました。すると、

>妙法蓮華經 1件

となりました。これもなんだかちょっと違う感じがしますので、漢字をアルファベット表記にしてみました。そうすると…

>miao fa lian hua jing 241件

となりました!

さて、ファセットがついているのでこれを使って確認してみると、

236件はフランスからとなっていて、全部サムネイルで見ただけですが、見慣れた感じの形式なので、多分、これらがフランス国立図書館で公開されているペリオコレクションからのものなのではないかと思いました。

あと5件はドイツの図書館からでした。

さては…と思って、「妙 法 蓮 華 經」と、文字間にスペースを入れると、210件ヒット。これはフランス国立図書館メタデータでそのようになっているためのようでした。

大英図書館のものはヒットに至りませんでした。まだ登録されていないのか、検索の仕方がわるいのか、ちょっとよくわかりません。


ちなみに、サンスクリット名で探してみると、

>saddharmapuṇḍarīka sūtraで4件、
>saddharmapundarika sutraで1件。

この二種類は、上記の漢字アルファベット検索でヒットしたものと同じ、ドイツの図書館から、ということでした。

ということで、現時点での課題は色々と浮かび上がってきます。とりあえず検索システム側としては、「經⇒経」などの異体字・互換漢字等の一括検索ができるといいですね、と思いました。この漢字がこうなっているということは、同種の問題は他にも色々あるでしょう。また、アルファベットに関しても、「ī⇒i」など、ダイヤクリティカルマーク付とマークなしを一括検索できるようにするとよさそうな感じはします。それから、大英図書館敦煌文書画像データベースもうまくヒットできるようになれば、あるいは、入れていただけたらなあ、というところです。

一方、各デジタルアーカイブ側としては、フランス国立図書館メタデータで、漢字タイトルは文字間のスペースをなくしてくださるとありがたいですね。ドイツの図書館では、サンスクリット語のローマ字表記に関して、ダイアクリティカルマークをつけるかつけないか、ポリシーを統一するというか、全部きちんとつけてもらえるとありがたいですね。

ということで、アジア系の資料についてはまだまだ課題が多いような感じがしました。

それから、ちょっと気になったこととして、結局元のWebサイトに行かないとあんまりうまく情報を得られないような印象を持ちまして(具体的にどこがどうか明示しろ、と言われると困るのですが、細々と色々と…)、これは、我国の文化資料統合検索サイトの一つであるnihuINTとちょっと似ている感じがしました。nihuINTも志は高いのですが(現在440万件ほどのコンテンツがあるそうです)、個人的な印象としては、色々統合しすぎて個別の情報が見えにくくなっており、結局、目当ての資料がたくさん集まっていそうなWebデータベースを見付けたらそこに行って個別に詳しく探す、という使い方になってしまっています。Europeanaでも結局そういう風になってしまいました。

また、たとえば新約聖書のパピルス画像がWikipediaでリストされていたりしますが、統合検索サイトを使って同じような情報を得ようとするとおそらくかなり大変です。目的がはっきりしている場合には統合検索よりもむしろ個別の専門サイトの方が便利な場合があることも確かです。

とはいえ、このようにして曲がりなりにも一括検索できることはとてもありがたいことですし、さらに、これを通じて、各組織が抱える課題も明らかになるので、それを共有して、それぞれに、コンテンツの価値をより高め、より意義のある仕事に取り組んでいくためにも、とても有益なのではないかと思ったところでした。(仕事が増えそうだ、と尻込みするのはナシですよ!)また、専門サイトの構築と運営、特にデータの更新にあたっては、統合検索サイトはとても有益でしょう。この場合、専門サイトの運営者が一度データを確認して自サイトに蓄積したら統合検索サイトの役割は(そのワークフローの中では)終わりということになりますので、統合検索サイトのアクセス数はそれ以降は伸びないということになりますが、その1アクセスの意義がとても大きい、ということになるでしょう。この意義をどう評価するかということも今後は課題になっていくかもしれません。(その点についてはこちらに書いたことと関係してくるでしょう。)

やや蛇足気味ですが、ちなみに、仏典のデジタル画像をあちこちの画像データベースから集めてURLを集積するという作業を、しばらく前から時々一人でやっております。各地の画像データベースの使い勝手を確認してみるという意味合いもあるので、面倒ではありつつも割と有益な感じなのですが、たとえば、上記の法華経だとこんな感じです。「SAT page」というリンクをクリックすると、断片写本の場合には、その写本の開始位置のSATテクストデータの頁が表示されるようになっています。法華経の場合、SATテクストデータベース側では英訳とも文章単位でリンクされているので、2枚画面で見れば英訳を読みながら閲覧できるようになってます。フランス国立図書館敦煌文書画像は多すぎでまだほんの一部しか蓄積できておらず、忸怩たるものがありますが、まあ、このような感じでお経画像統合検索的な感じのものをぼちぼち作っていきたいと思っております。(ボランティアも募集中です!が、ちょっと要求水準が高いのでご注意ください。)

 もちろん、このデータは、こちらのSAT2012版の方から簡単に引けるようにしています。具体的には、「tool」タブで「Link to Buddhist Canons Research Database (Experimental!)」のダイアログをopenしておけば、そのダイアログ上に、「今見ているお経」についてのデジタル画像リンクが表示されます。

さて、最後になりますが、やはり、Europeanaは、西洋美術研究や欧州の文学研究等の、Europeana のコアなコンテンツを対象として研究や教育などをしておられる方にレビューをしていただけたらありがたいなあと思っているところです。