#本棚の中のニッポンの会 個人的なまとめ

本棚の中のニッポンの会の第一回会合を個人的にまとめてみる。

比較的クローズな会という位置づけだったようなのだが、
ツィートをしてもよかったようで、まとめが作られている。そこで、差し支えのない範囲で思ったことを書いてみた。

発端は、Summonというディスカバリーサービスを利用したとある米国の図書館の人が、日本語資料がほとんど出てこなかったからなんとかしなければと思った、ということだったそうだ。そのときは枕草子を検索しても韓国で作られたデータベースがヒットしたのだとか。その問題自体はその後、ディスカバリーサービスに詳しい人に聞いて設定を変更したことである程度解決したようだが、全体としてそのようなサポートが著しく弱く、一方で、中国韓国は大変手厚い政府の保護の下、大量のデータがヒットしていたので日本もなんとかしなければいけないのではないか、というようなことだったと記憶している。

この話だけで色々な問題は一通り出ていると思うのだが、一つずつ採り上げていくと、まず、枕草子がヒットしないという問題については、純粋に、そのソフトウェアの設定の問題だろう。青空文庫英語圏の人がいじるのは難しいかもしれないが、ヴァージニア大学日本語テキスト・イニシアティブでも公開されているので、それを取り込んでいないという点では、そのソフトウェアを作っている会社のやる気が少し足りないのではという気がする。あるいは、すでにデータとしては検索対象となっていたにも関わらず、検索機能がうまく日本語対応していなかった可能性もある。(このあたりで気になってくるのは、JATSの日本語対応にからんで、少し前に米国の某社の人と話した際に東アジアの人たちがご無体なことをおっしゃって大変だ、ということを言われたのだが、あれは現在どうなっているのだろうか?)いずれにしても、この件については、日本語発信の問題ではあるが、日本語資料に関わる人たち自身の責任というよりは、むしろ、米国のソフトウェア会社の力不足のためであって、誰かがそれをフォローするようなことをしなければならないように思われる。

もし、ソフトウェア会社が適切な日本語資料を見つけられないことが問題なのであれば、誰かがその情報を直接ソフトウェア会社に適宜、あるいは定期的に伝える役割を担う必要があるのかもしれない。日本語でしか説明がない資料については英語で解説を加える必要があるので場合によっては少々手間がかかる可能性もある。あるいは、あくまでもユーザ側に立って、「日本語資料のためのディスカバリーサービスの設定方法」のような講習会を世界各地で展開していくという手もあるかもしれない。

検索機能がうまく動いていないという場合には、誰かが検索機能をチェック&場合によっては修正のお手伝いなどをする必要があるかもしれない。もちろん、普通にSolr等を設定すれば使えるはずではあるのだが、日本語ができてその種のソフトウェアの挙動に詳しい人がソフトウェア会社のスタッフの中にいない場合、正しく動作しているかどうかを判定することが難しいので、これは、どこかの大学のどこかの研究室等と提携してもらうとよいのかもしれない。あるいは開発力のある大学図書館等。ユーザレベルでもまめに不具合報告をすることでなんとかなるかもしれないが。

ということで、日本語情報の海外への発信は、単にコンテンツの少なさだけでなく、それ以前の問題として、米国での情報共有の文脈にうまくのせられていないという問題があり、現在のコンテンツ量が問題とされているとは必ずしも言えないのかもしれないということ、そして、ただコンテンツを増やすだけではどうにもならないということを改めて感じたところであった。この大筋はすでに江上さんの本でご指摘されている枠の中の話だろう。

また、中国韓国に比べて海外への情報発信に政府としてリソースをかけなさすぎではないかという件については、概ねその通りだと思うが、一方で、日本では情報を作り出す際のあらゆるコストが高すぎるという面がある。(以前に台湾の某大規模テキストデータベースの関係者に話を聞いた時には、「全部手入力だけど大陸に頼んだから安くで済んだ」とにこにこしながら言われたことがあって…)さらに、人件費だけでなく、色々な面で商慣習や権利者といった枠組みが割と強固に形成されており、それを乗り越えるだけでもかなりのコストを必要としそうである。また、近年は、クールジャパンということで、様々な種類のコンテンツの発信に力を入れようとしているが、ディスカバリーサービスでヒットしそうな学術情報群に比べると、明らかに作成・発信・権利処理のいずれについてもコストが著しく高くなってしまいそうなところに突っ込んでいってしまっているような感じがするので、その余波ということもあるのかもしれない。

もちろん、こうしたことに問題意識をもってきちんと対処していくことが必要なのだが、それだけのリソースがどこかにあるのかというとなかなか難しい。それこそ、ARG が主導してやってくださると良いのではと思うのだが、膨大な「やるべき仕事」の中で優先順位をどうつけるかという問題なので、期待しつつもなかなか難しいところである。また、そもそもディスカバリーサービス自体それほど古いものではなく、どれくらい続くものなのかも判然とせず、さらに、ディスカバリーサービスに対応させたい日本語情報資源の増減も見通しが立つような状況ではないため、それに取り組むためのリソースを準備することが少々難しい。

私自身は、90年代半ばから2000年代半ばにかけて、日本の哲学思想関連Webサイトのリンク集を作っていた。今、あのようなものがきちんとした形で継続されていれば、ディスカバリーサービスに対して有益な情報提供となったのかもしれない。そのようなことは90年代は色々な分野で取り組まれていたのだが、あのような営みを、今回の新たな問題意識で以て改めて開始してみるのもいいのかもしれない。

ただ、いずれにしても、今のところ、何をすれば最短の道なのかが見えてこない。ディスカバリーサービスはメジャーなものが4つもあるそうで、一つに注力するのは好ましいことではない。4つにそれぞれ働きかけるのだとすると、それぞれにシステム設定の柔軟性といったところからして色々相違点があるかもしれず、いちいちそれも調べなければならなくなりそうである。それは結構な手間であり、交渉を一つに集約するような工夫が必要かもしれない。ディスカバリーサービスの先進国で、すでにそのようなコンソーシアム的なものを作っていてくれるとありがたいのだが。

少し長い目で考えるなら、日本語での情報発信を表彰したりといったことに取り組めば徐々に効果が出てくるだろう。

また、情報発信という意味では、会場で指摘されていたことを少しかみ砕くと、ディスカバリーサービスが情報の作成発信のコストを隠蔽してしまってコスト意識を減じてしまい、結果的に情報の作成発信への予算が削減され、ますます情報発信が弱くなるかもしれないという危惧が提起されていた。この点は概ね同感であり、何らかの建設的な対策が必要であると感じたところであった。

眠くなってしまったのでとりあえずこれくらいにしておく。何かまた思い出したら続きを書くかもしれない。

追記1:
飯野さんの論考によれば、すでに飯野さんが日本語検索の改善に貢献してくださった模様。また、ディスカバリーサービス(Summon)では横断検索がないため、やはりディスカバリーサービスに乗せてしまったデータは本家サーバ(があったとしたら)での検索件数はかなり減ってしまう可能性があるのかもしれない。