「デジタルアーカイブ研究」の観点?

今度、「第 7 回定例研究会:ジャパンサーチの課題と展望」というところでお話をさせていただくことになりました。 ここしばらくのジャパンサーチ試用は、そのご依頼を果たすための準備だったのですが、今回のご依頼は、実は使い勝手の 話ではなくて「 仕組み・社会的位置づけの観点から」ということでしたので、使い勝手の話は二の次です。 ここまでの試用を踏まえつつ、「 仕組み・社会的位置づけの観点から」の議論を組み立てようと思っております。 そこで、今回の研究会の紹介文を見てみますと、

第 7 回定例研究会:ジャパンサーチの課題と展望 (2019/9/24) | デジタルアーカイブ学会

試行版の評価や2020年に運用開始が予定されている正式版への期待・改善点の指摘などの議論を、デジタルアーカイブ研究の 観点から実施する。

という風になっており、ここには「デジタルアーカイブ研究の観点」という言葉が出てきます。しかしながら、 私はどちらかと言えばデジタルアーカイブの実践者であり、それを利用した研究やその基礎となる事についての研究はしておりますが、 デジタルアーカイブそのものの研究はあんまりしたことがないので、やや遠い立場ではありますが、少し気になっている点を整理してみたいと思います。

これまで、デジタルアーカイブに関わる研究集会としては、それをテーマとして長年掲げてきた じんもんこん(人文科学とコンピュータ)シンポジウムにずっと参加しておりましたので、 人文学向けのデジタル技術の応用という観点からのデジタルアーカイブについてはある程度議論ができるつもりでおりました。

しかしながら、デジタルアーカイブ学会の大会やデジタルアーカイブサミットに一般参加者として(一度、座長不在で急遽代理で座長を やる羽目になったことはありますが)ちょろちょろ参加させていただく中で、 議論が結構難しいということに気がつきました。たとえば、データの永続アクセスを保証しなければ、という 話をしようとすると、データを削除できなければコミュニティアーカイブでは問題だ、という話になり、 オープンアクセスの実現という話をしようとすると、有料でもアクセスできるならオープンアクセスだ(これは決して間違いではない)、 という話になり、定義に関する議論が大変なので、とりあえずは、とにかくデジタルコンテンツを集約した ものをデジタルアーカイブと呼ぼう、と言えば、コンテンツを持たない横断検索サイトもデジタルアーカイブに入れるべきだ、という 話がでてきたりして、「永続アクセスを保証するにはどうすれば」「無料で皆が自由にアクセスできるようにするには どうすれば」等の話に具体的に取りかかることが難しいことがあります。もちろん、「デジタルアーカイブ」全般について 考える際にコミュニティアーカイブのことを放置するなど話になりませんし、たとえ有料であっても門外不出の秘宝などを オープンにしていただけたのであればとてもありがたいことです。

そういうわけで、ここのところ、そういう状況を整理しながら議論する方法が 必要なのではないかと思っておりまして、そこで、議論を始める際に、以下のような見取り図を作ってみることを考えてみました。

f:id:digitalnagasaki:20190909030013p:plain

何か議論するときに、それぞれの項目について、どういう範囲を想定しているのか、ということを明示しながら話をすれば、 今は議論の対象になっていないだけで、論点を無視されているわけではないということが理解されやすくなって、 議論が多少進めやすくなるのではないかと思ったのです。これに従えば、たとえば、ユネスコ世界記憶遺産にも選ばれたかの有名な デジタルアーカイブは以下のようになると思います。(間違ってたらすみません)。

f:id:digitalnagasaki:20190909030353p:plain

あるいは、30万点の日本の歴史的典籍のデジタル化を目指す国文学研究資料館が有する巨大古典籍データベース、 日本古典籍総合目録データベースの場合、大体以下のような感じになるのではないかと思います。古典籍の中には 江戸時代の木版本もかなり含まれており、その中には、1点1点、刷りごとに微妙に異なるとは言え、 版が同じ複製本とも言えるようなものが含まれているので、複製物に少しシフトします。

f:id:digitalnagasaki:20190909030524p:plain

国立国会図書館デジタルコレクションの場合には、活版印刷本もたくさん入っているので複製物が 多いと考えることができます。永続アクセスが求められていて、著作権切れ資料はそのまま パブリックドメイン資料として公開していますが、一部に公開できないものもデジタル化してしまっていますので、 ちょっと飛んで「公開不可」にも丸がつきます。インターフェイスとしては一般向けを志向している面もあろうかと思います。 ということで、以下のような感じにしてみています。

f:id:digitalnagasaki:20190909030559p:plain

国宝をデジタル化したものを高精細画像で公開してくださっている貴重なサイト、e国宝だと以下のような感じでしょうか。

f:id:digitalnagasaki:20190909031005p:plain

一方、国立国会図書館東日本大震災アーカイブ(ひなぎく)の連携先の一番上に掲載されている「青森震災アーカイブ」を採り上げてみますと、おそらく 以下のように記述できるだろうかと思います。

f:id:digitalnagasaki:20190909031642p:plain

あるいは、今回の研究会を主宰する福島幸宏氏らが先週末のCode4Libジャパン2019で発表していた 「アーカイブズ構築のスリムモデル」であれば、大体以下のような感じに なるでしょうか。

f:id:digitalnagasaki:20190909032221p:plain

さて、ここでジャパンサーチの議論に戻りましょう。ジャパンサーチは統合検索を志向していますので、最終的には、こういった諸々のものをすべて 対象とした検索になるのだろうと想像されます。ですので、ジャパンサーチについて「どういうものをどう検索したいか」ということを 議論するのであれば、このような振れ幅を持つ色々な事項について議論することになると思われますので、お互いに、どの部分を前提として 議論しているのか、を時々確認しながら議論するとよいのではないかと思っております(が、いかがでしょうか?)。

なお、項目としては、他にも、

  • 「デジタルアーカイブ自体の位置づけ」:実験系⇔実装系

  • 「あるべき運営主体」:個人系⇔組織系

といったものも入れてみてもいいかもしれません。他にももしあればご提案いただけますと幸いです。