「デジタルアーカイブ」に関わる技術について、このブログでは主に扱ってきている。基本的に目指しているのは、そういう情報をきちんと共有して、「車輪の再発明」を避けつつ、無駄な投資も避けて、「デジタルアーカイブ」が適切な歩みを進めていくことに少しでも役立てばと思って、ブログだけでなく、呼ばれれば世界中どこでも参上して情報提供してきている。できれば交通費は出していただけるとありがたいが、大きな波及効果が見込まれる重要な会合なのにどうしても交通費を出せなければこちらの負担でおうかがいすることもやぶさかではない。
しかしながら、なぜ、自分がそういうことをしているのか、それによって何を目指しているのか、ということについてはあまり書いたことがなかったので、2ちゃんねる用語で言うところのチラ裏になってしまう上に、やや断片的になってしまうが、特に、最近重点的に考えていることを少しだけ書いておきたい。
明治維新を通じて、日本は色々なことが変わりつつ、変わらないところはそのままに、さらにその後の2度の大戦を経て現在に至っている。明治維新から2度の大戦の間に何が起きていたのかについては、わかっているようでわかっていないこともあり、国立国会図書館の近代デジタルライブラリーの登場と、その後の国立国会図書館デジタルコレクション(国デコ)の充実によって、それでも断片的とは言え、極めて多くの資料がデジタルで容易に入手できるようになり、いつでも参照できるようになってきた。筆者の専門に近いところでも、細かな情報が入手しやすくなったりして、戦前の専門分野の状況がやや立体的に見えてきたところがある。さらにそれが、どういう世界観、科学観の下で行われてきたのか、ということも断片的ながら見えてきて、現代と対比する面白さとともに、当時の人々に見えていた世界を、これまでよりも少し容易に、少し深く垣間見ることができるようになって、そのこと自体が興味深い体験となっている。それほど重要でない情報も含めた大量の資料に容易にアクセスできるようになることは、ややもすればメジャーな資料に偏ってしまいがちな認識から、世界・社会が常に多様性であってきて、色々な方向に進む可能性を常にはらみながら現在に至っているということを具体的に認識する契機になっている。これは健全な思考を形成する上で重要なことだと筆者は思っているので、そういう多様な全体を認識するための支援装置としての「デジタルアーカイブ」には深く期待している。また、そういう文脈からは、とにかく一定基準で大規模にデジタル化公開してしまう国デコのような在り方の重要性とともに、たとえば高橋晴子先生が長年続けておられる身装関連のデータベース群、特に「近代日本の身装文化」データベースのような、特定のテーマに絞り込みつつ研究者だけでなく専門家でない人にも理解しやすい情報を得られるようなものの有益さも忘れてはならない。そういったものが、Wikipediaにつながっていったり、あるいはまた、色々な人の様々な理解につながっていったりするような、多層的なつながりを形成し、それによって色々な時代の世界観や社会の多様性が共有されるようになっていくといいなあと思っている。
さらに期待しているのは、それよりも前、つまり、明治維新より前の世界観や社会の理解をより広げ、深めていくことである。たとえば、我々の「江戸」のイメージは、人にもよるが、わりと貧困であるように思われる。「江戸しぐさ」などというものが出てくるとなんとなく広まってしまって政府も一時は乗り出しそうになってしまったりして、そんなものはなかったと専門家が一生懸命否定する羽目になってしまったり、そうかと思えば「原発がなくなったら江戸時代に戻ってしまう」などとやたらと否定的なイメージで語られたり、あるいは、識字率が世界的にも極めて高かった、などといった断片的な良いイメージもある。さらに言えば、文明開化・和魂洋才といった形で、それ以前からの精神面は肯定しつつも技術面はとりあえず西洋のものを持ってきて接ぎ木しようとしたり、その一方で、廃仏毀釈によってその精神面もある種の分断が行われようとしたりしたようでもある。筆者が不勉強なこともあり、そこら辺の流れの正確なところはわからないのだが、敢えて言うなら、江戸時代、そしてそれ以前の「日本」(近代国家としてのそれではないにせよ)は、現代の我々から見ると、精神のみが断片的に受け継がれ、それ以外の部分は、なんとも座りの悪いまま「忘れてしまってもよい過去のお話」になってしまっているような感じがしているのである。
このことに関して、少し前に経験したことがあったので書いておくと、フランスの人達とオープンデータとオープンアクセス、というか、日本で言うところの「デジタルアーカイブ」の話をしていた時に、会合に参加していた日本人から「文化の資料はそういう風に色々やっているが科学に関してはどうなのか」というような質問がでた。これに対する(いわゆる理系の)フランス人の回答が「これは科学の歴史なんだけど?」というものであった。ここで筆者が感じたのは、日本のアイデンティティの分散、というか、分断、であった。日本人にとっては、古い歴史の資料は科学とは関係ないものなのだが、フランス人にとっては歴史は文化社会の歴史であるとともに科学を発展させてきた基盤でもあるのだ。確かに江戸時代までの我々は、西洋から移入した科学とは少々異なる趣で自然の摂理を理解していた以上、そこにある種の分断があるのは仕方がないことではある。しかし、だからといって、我々がかつて自然を、そして世界をどう理解していたか、ということまで遠ざける必要はない。それぞれの時代の文化をうまく理解しようとするなら、どういう世界観・自然観の中で形成されているのか、ということを踏まえた上であってしかるべきだろう。また、そのようにして、我々が世界をどう理解してきたか、ということを知ることは、やや不安定化しつつある世界の中で、上記のように接ぎ木状態になってしまっているかのようにも思える日本のアイデンティティを多様なものの総体として適切に取り戻していく上で、大変重要になってくるのではないか、と思っている。たとえば、大蔵経(仏典の大規模叢書)には雨を降らせる方法を書いたお経、などというものがいくつも(1, 2, 3, 4, 5)入っていて、迷信と言ってしまえばそれまでだが、13世紀に高麗で刊行された木版大蔵経に残っていることが「デジタルアーカイブ」の高精細画像で確認できる状態のものもあり、空海がこの手法を用いていたとされているようなので、日本でも1000年以上前から受容されていた手法であり、さらに、Webでも公開されている古いお経の目録によれば、随・唐の頃にサンスクリットから漢訳されたものだということである。これらの一連のお経の文献学的な解説もWebで論文を読めるようになっている。(これはやや専門的なのでちょっと難しいかもしれないが)。こういったものが自然の摂理として受容され世界観の一部を形成してきた、ということを、こうしたWeb上の資料を通じて多少なりとも垣間見ることができる。その意味で、これもまた、日本のアイデンティティを多様な総体として取り戻していくことに資するものだと言える。ただ、お経となると、どうしても、そのまま皆が読んでいたかと言えばおそらくそうでもなく、むしろ、それが一般にどう受容されていたか、ということも含めた周辺状況が見えないことにはなかなか理解は難しい。
そこで筆者が大いに注目かつ期待しているのは国文学研究資料館の「日本語の歴史的典籍の国際共同研究ネットワーク構築計画」(歴史的典籍NW事業)である。これまでにも日本の古典籍の「デジタルアーカイブ」は早稲田大学や立命館大学をはじめ、各地で大規模に取り組まれており、その成果と貢献には多大なものがあるが、この歴史的典籍NW事業では、30万点の古典籍をデジタル化して公開し、研究に大いに活用できるようにするとしており、さらに、国文学だけでなく異分野との連携・融合を旗印に、総合的な日本の歴史的典籍の研究を推進していくことを目指しているようである。実際の所、味の素食の文化センターとの連携により、江戸時代の食文化に関わる資料を公開することになったり、古典籍中のオーロラに関する記述を探すイベントを開催したり(PDF5枚目の右側に記事が掲載されています)、さらには、医学関連書や本草学、和算等にも取り組んでいるということである。つまり、江戸時代以前を文学研究からとらえるのみでなく、当時の生活や自然の摂理も含めた総体として把握していこうとする取組みが、おそらくは、多様な古典籍の画像の公開とともに進められ、それらの成果も公開されていくのではないかと期待される。もちろん、さらに、画像へのタグ付けも組織的に進めていこうとしているということが先日の人文科学とコンピュータ研究会で発表されていたりもしたので、今後は、そういったタグを通じてアクセスしやすくなったり、解説もついたり、ということも、勝手ながら期待されるところである。今までも研究としてはそういう取組みが色々行われてきていて、本もたくさん出ているが、実際に当時の人々が読んでいたもの、見ていたものを比較的高精細な画像で参照しつつ読んだり理解したりしていく、ということができるようになるとしたら、これまでとはまったく違う状況が生まれてくるだろう。(もちろん、本そのものを手にとって見ているわけではないのでその点が不十分であることを忘れてはならないが)。くずし字が読めないとしても、挿絵が用意されている本も少なくない。たとえば、「閻魔(大)王」という言葉で理解するか、それとも下記の国文研オープンデータセットの画像の「閻魔(大)王」を見たり、さらに閻魔大王の筆記用具や従者の持物等に注目して拡大してみたりしながら理解するか、というのでは、ずいぶん理解の仕方が違ってくるだろう。
さらに言えば、くずし字学習アプリのようなものも出てきていて、すでに万単位でのダウンロードが行われたようであり、今後くずし字コンテンツがどんどん増えていくであろうことを想定すると、全体としてくずし字リテラシーがあがっていって、割と多くの人が読めるようになってしまうのではないか、という期待もしてしまう。
また、上記の画像の例は、単に物語への理解が深まるだけだと思われるかもしれないが、これは『仏鬼軍』という絵巻物語の一部であり、当時の信仰世界を当時の人々にとって理解しやすい形で提示したものであり、その意味では、当時の世界観の一部がここで垣間見えると言うことができるだろう。まだ十分に整理されたものではなく、筆者としても現在取り組んでいることの一つだが、これもまた「デジタルアーカイブ」のなせる技であり、また、IIIF Image APIによってこのようなことが極めて容易に可能となっているという点も強調しておきたい。
さらに、歴史的典籍NW事業がある程度予定通りにいけば、かつての日本での自然の摂理への理解の仕方を含む様々な世界観の断片が、比較的高精細な画像を伴って理解できるような成果物としての「デジタルアーカイブ」として出来上がってくることが期待されるが、おそらくはそれだけでなく、様々な人が様々な関心と立場からかつての多様な世界観の断片を総体として再構築することができる環境としての「デジタルアーカイブ」もまた整備されることになると想定される。これらの「デジタルアーカイブ」こそ、「西洋」の導入によって我々のアイデンティティの中に生じた断絶をつなぎあわせて再びまとまった総体としての「日本」のアイデンティティを取り戻すための一つの大きな力になるのではないか、そして、そのようなアイデンティティこそが、日本社会が現代の様々な課題に向かっていくための揺るぎない足場になるのではないかと、筆者としては大いに期待するところである。
さて、筆者は、実は「グローバル化」のような話に割と入れ込んでいるのだが、このような話と、「グローバル化」の話をどのように折り合わせるかということについては、色々な観点がある。基本的には、ローカルなくしてグローバルはない、と考えているので、グローバルには常に意識を向けておく一方で、ローカルとは何か、ということを常に意識しておきたいと思っている。そして、実用的な問題としては、技術をグローバル化して、コンテンツはローカルのものをきちんとローカルとして提示する、さらに、グローバルな技術に対しても、ローカルを適切に対応させられないものはグローバル側に変わってもらう、ということが重要だと思っており、そのための交渉からプログラミングまで色々取り組んでいる。IIIF対応ビューワMiradorのページ遷移の方向を逆にする改良を行ったのはまさにそのような文脈からであり、この改良を報告したところ、ヘブライ語資料を扱っている人から喜びの声をいただくということもあった。黙ってグローバルを受け入れるとただ譲歩しただけで終わりになってしまうが、ただ文句を言うだけでなくこちらからアクションを起こせば色々な展開があり得る。TEIコンソーシアムに日本語SIGが設立されることになったのもこの文脈からのことで、ただ受容しようとしてうまくいかないから終わり、ではなく、グローバル側に対してローカルの要求をきちんとした手続きを経て提示していくことが肝要であると思っている。それは、ローカルにとってのメリットだけでなく、グローバルの価値を高めることにもつながり、結果としてローカルも含めた全体の価値が高まっていくことにもなる。それを理解しているグローバルなコミュニティには、積極的に参加し、協力し、連携していくことが、ローカルのためにも、つまり筆者の場合には、日本のためにも大きな糧になると思っている。
…というのは技術のグローバル化の話だが、一方で、コンテンツローカルの話として、海外機関で所蔵されている日本資料をうまく統合していくという話がある。海外機関で所蔵されている日本資料が日本から適切に利用できるようになるためには、現在のようにIIIFが急速に普及しつつある状況では、海外の機関がそれぞれに自分のWebサイトから日本資料の画像を公開することになることが想定される。この場合、上述のようなグローバル技術へのローカルの組み込みが重要になってくる。ビューワでのページ遷移の方向などは典型的な話だが、縦書きの表記もそうだ。現状では、いずれもIIIFの問題ではなく、ビューワでなんとかすればよいという話なのだが(それで筆者はMiradorの改造を行ったのだが)、画像を共有するための枠組みであるIIIFは、今後さらに利便性を高めるべく、規格をより深化させてくるかもしれない。その過程で、日本資料に関する事柄がもし抜けてしまっていたら、海外機関で公開される日本資料が適切に扱えなくなってしまうかもしれない。そのようなことにならないように、引き続き規格の進展には注目し続ける必要があるだろう。
具体的な実践として、そのようなことに取り組んできたのだが、そうしてみると、やはりどうしても「日本」に行き着いてしまい、それをどうとらえるか、という問題に突き当たってしまうのである。DNAやらゴーストなどがささやいてくれるとよいのだが、そういうわけにもいかず、色々な状況に接しながらあれこれ考えていると、どうしてもアイデンティティが断片化してしまっているような感覚になってしまって、これをなんとかできるといいのだが、と思ってしまうのである。
というようなことを、漠然と考えながら「デジタルアーカイブ」に取り組んでいる昨今である。まだまだ力不足・勉強不足なことも多く、上述のことも色々修正したり撤回したりすることがあるかもしれないが、基本的には、そのような観点から皆様のお手伝いを続けていけたらと思っている。