「データベースやデジタルリソースが研究者にとって役立つかどうか」という話は少し整理してみてから考えてみるといいかもしれません。

先日、「じんもんそん」というイベントがありまして、人文学のデータを通じて何か面白いことが出来ないかどうかということを皆で話し合ってみるという面白い会合でした。参加費も無料で、主催者の皆様には大感謝だったのですが、そこで出ていた色々な話のうち、特に気になったことについて。

「データベースやデジタルリソースが研究者にとって役立つかどうか」という話なのですが、「研究者」と「資料」の関係というのは結構多様で、整理して考えないとなかなか話がうまく見えないということがあります。基本的に、インターフェイスがひどすぎず、内容がそこそこまともなものであれば、研究者にとって全然役立たないということはないと思います。ただ、「これはあなたの研究にとって役立ちますか」と研究者が聞かれると、「研究」の範囲とか「役立つ」の意味がはっきりしていなかったりして、ううーん、となってしまうことが少なくないのです。あるいは、「この資料をあなたの研究の役立つようにデジタル化しますのでアドバイスをください」というと、その人の研究にしか役に立たないようなものになってしまうこともあります。(かつてはそういうことが結構多かったと上の方の世代の方々からおうかがいしたことがありました。)また、「他人が作ったものは一切信用しない」というラディカルな先生もたまにおられますが、そういう先生はかなり少数ですので、レアケースにあたった幸運を喜んで、それが意味するところをぜひ詳しく聞いてみてください。

さて、具体的な例を挙げてみながら考える、ということで、前回のブログにも出てきた漢文の『妙法蓮華経』。これは、本格的に研究している研究者の方々であれば、世界中から写本や木版本をかき集めてきちんと差分を確認してその差分の意味するところも含めて内容を読み込まないと、それについてきちんとしたことは言えないと考えている方々が多いと思います(Aさん)。そして、写本や木版本もそれぞれに内容だけでなく紙質や墨の具合まで確認しなければいけない、と思う人(Bさん)もいらっしゃるでしょう。(もちろん、『妙法蓮華経』は漢文だけでなく元のサンスクリット語のものやチベット語訳なども残っておりますので、きちんと専門的に研究する上ではそういったものも見ていく必要がありますが、今回はそれはちょっと置いておきます。)

 しかし一方で、全然違う仏典を研究していて、たまたま『妙法蓮華経』が引用されているのでその箇所をちょっと確認しなければならない、というような具合で参照される方もおられます。そのような場合には、とりあえず、誰かが世界中から写本や木版本などをかき集めて作ってくれた(こういう仕事を「テクスト校訂」などと言うことがあります)研究成果としての「妥当な『妙法蓮華経』」というのがあれば、一々写本や木版本を全部集めてくるのは大変なので、とりあえずその研究成果を参照させていただく(Cさん)、ということになる場合もあろうかと思います。

 あるいは、国文学を研究していて、扱っている文学作品の中に『妙法蓮華経』が出てきたとしましょう。国文学研究者の中には仏典の扱いにとても通じておられる方々もおられますが、それほど通じておられない方々もいらっしゃいます。前者の場合と後者の場合でまた色々違ってくると思いますが、前者の場合には上記のAさん、後者の場合には上記のCさん、という感じになるでしょうか。

 また、色々な文化圏の思想を比較してみるような研究というのもなかなか興味深いのですが、そういった研究をしている方々の中でも、往事と違って、最近は、漢文を読むのは苦手、という方々も少なくないでしょう。あるいは、漢字文化圏の出身でなければ、そもそも漢字を読むだけでも大変かもしれません。そのような場合には、むしろ、現代語訳されていたり、あるいは、英訳が提供されたりしてれば、そういったものを読んで考えてみるという風になるかもしれません。(Dさん)

 さて、ここで研究者と資料という関係でみた場合、4つのタイプが出てきました。

Aさん⇒一次資料を見る
Bさん⇒一次資料の現物を見る
Cさん⇒一次資料は見なくていいけど校訂テクストを見る
Dさん⇒とりあえず現代語訳or英訳を見る

いずれも、研究者であるとは言えると思いますが、資料との距離が全然違います。これを、実際の『妙法蓮華経』のWebデータベースの現状にあてはめてみましょう。

Aさん
国立国会図書館大英図書館、フランス国立図書館等の画像データベースが役立つ

Bさん
⇒そもそもネット上のものというだけでダメだが、上記の画像データベースは所在確認に極めて有用。(目録を頼りに現地まで行ってみたら目当てのものと違っていてその出張の全てが無駄になった、などという悲劇が起きにくくなりますので)

Cさん
⇒「大蔵経データベース」で検索して、テキストをコピーすることもできますしテキストデータが不安ならページ画像も同時に確認できます。

Dさん
⇒「大蔵経データベース」では『妙法蓮華経』の英訳を、本文ドラッグで表示できるようになっていますし、そもそも財団法人仏教伝道協会が作成しPDFでWeb公開している「英訳大蔵経」に『妙法蓮華経』が含まれていますのでそちらを参照することもできますし、これをテキスト検索できるようにしたサイトも提供されています(というか私が作りました)。

このようなことで、CさんやDさんのような資料との距離の場合には、それなりに作り込まれたデータベースは役立つことが多いのです。しかし、Aさん、Bさんのような場合には、かなり手の込んだものでなければ役に立ちません。たとえば、古い漢文仏典写本の代表的なものの一つである敦煌文書の写真画像というのは超レアな一点物です。技術というよりはむしろライセンスの問題が大きいとは言え、資料との距離がそのようになっている状況をデータベースで埋めて「研究の役に立つデータベースだ」と言っていただこうと思ったら、相当大変なことになるのは間違いないでしょう。

ということで、「研究者にとって役立つデータベースかどうか」という問いは、「どのようなレベルで役立ててるか」ということを整理しながら考えてみると意外と「役立っている」という答えが多く返ってくるのではないかと思いますし、データベースを作る際の指針も作りやすくなるのではないかと思います。

実は、このような話は、2007年に、「じんもんこんシンポジウム」で発表したことがあります。以下でオープンアクセスになっておりますのでよかったらご参照くださいませ。

「人文科学のためのデジタル・アーカイブにおけるステイクホルダー−仏教文献デジタル・アーカイブを手掛かりとして−」
http://id.nii.ac.jp/1001/00100614/

また、これに関連する大きな問題として、「どう役立ったか」をどうやって調べるか、という問題があります。「使いました」と原稿の片隅にでも書いていただけるのが一番ありがたいのですが、より抜本的な対策として「データジャーナル」というものを作って参考文献一覧に掲載したりサイテーションインデックスで引いたりできるようにしよう、という動きもあるようです。それはそれで魅力的な話ですが、皆さんが乗ってくださらないと意味がないので、徐々に取り組んでいくのがいいのだろうかと思ったりしながら半分様子見姿勢です。