ジャパンサーチ(BETA)を探検 その4 鯰?ナマズ?

ジャパンサーチで古地図を探してみたり仏像を調べて見たりしました。こういった文化的なものとは別に、ジャパンサーチでは生物関係の資料も豊富のようです。個人的には、魚や両生類は少々好きなので、少しそういう方面からの検索もしてみます。

というわけで、また、ジャパンサーチのサイトにアクセスして右上の虫眼鏡アイコンにカーソルを持って行って・・・(と、何度も同じ事を書いていてうっとうしいと思われる人もそろそろおられると思いますが、実際にその操作を毎回している私にはもっとうっとうしくて、やや苦痛になってきています。もし、このデザインを維持することが至上命題なのであれば、非タッチパネル利用者に向けて、せめてタブキー押し下げで検索窓が開いてフォーカスが入るようにしていただきたいです)・・・まずは「鯰」で検索してみます。そうすると、1,454件見つかるのですが、浮世絵っぽいものがたくさんヒットしています。ファセットの「データベース」を見ても、国立国会図書館デジタルコレクションとかARC浮世絵ポータルデータベースなどが大量にヒットしています。これだと文化資料っぽい感じです。そこで、今度はカタカナで「ナマズ」で検索してみます。そうすると、ヒット数は3,472件になる上に、データベースの項目の一番上に「サイエンスミュージアムネット 2792」がリストされています。これですね。カテゴリーの項目にも「自然史・理工学 2851」となっています。試しに一番上にヒットしているアイテムをクリックしてみると、「魚類写真資料データベース」へのリンクが表示され、ボタンをクリックすると少し大きな写真画像が表示されます。利用条件については、ちょっとわかりにくいですね。教育利用・商用利用・非商用利用のいずれも「-」となっていて、OKかダメなのかよくわかりません。「収録されているデータベース」の「魚類写真資料データベース」のリンクをクリックすると詳しい情報が表示されますが、そこには「個々の写真の著作権は神奈川県立生命の星・地球博物館または撮影者に帰属します」というような記述があります。「または」となっているので、利用の確認は、まず神奈川県立生命の星・地球博物館のお手を患わせなければならないような感じで、なかなか大変そうですね。メタデータについてはCC0となっていますので、これを使って何かできると面白いのかもしれません。メタデータに含まれる撮影者の名前で検索してみると非常にたくさんの写真を撮ってらっしゃる人であることがわかります。

サイエンスミュージアムネットの方も見てみましょう。これについては、まずは公式サイトの方をみると大体概要がつかめそうな感じです。これによると、「標本情報」と「採集に関する情報」が入っているようですので、ジャパンサーチでヒットしているものこれらの情報なのでしょう。メタデータを見てみると、 採集した場所とおぼしき地名も出てきます。おそらくは、こういうものを地図上にマッピングしたり最終日時を年表上に載せてみたりなど、こういったデータを使って色々やっている人もおられるのではないかと想像されるデータの整備状況です。ただ、メタデータの利用条件は、こちらにアクセスしてみると「データセットによりCC0あるいはCC BYあるいはCC BY-NC。詳細は利用規定参照。」という風になっていて、この業界の外の人間だとちょっとよくわからないですね。(複数のデータセットの組み合わせであることがこの利用条件からは推測できますがジャパンサーチのサイトでみているだけだとよくわかりません。)

このあたりは、利用条件の整備と、やはり、出典情報として記載すべき内容のわかりやすい表示があるとありがたいですね。

それから、まったくの素人なので的外れなことを気にしているかもしれないのですが、メタデータとして記載されている生物の分類は、時々変更されて、データとしても書き換える必要がでてくるのではないかということが少し気になっています。もしそうであるなら、ジャパンサーチ上のメタデータとの同期をどういうワークフローで行うか、によって、ジャパンサーチのデータの信頼性やそれに基づく扱い方に違いが出てくるのではないかというような想像をしております。一度ダウンロードしたデータはずっと使って大丈夫なのか、あるいは、時々同期をとって更新した方がいいのか、そうだとすると、更新頻度やタイミングはどうすればいいのか、といったあたりが、門外漢としてデータを扱ってみようとする場合に、どうしても気になるところです。特に、オープン・サイエンスやシティズン・サイエンスといった枠組みを意識するのであれば、そういう情報にアクセスしやすくしておくことも有益かと思われます。

なお、素人的な感想で恐縮ですが、「ナマズ」と「鯰」でヒットするものが全然違うというのは実に面白いですね。通常、シソーラス検索的な機能を導入することで、「鯰」でも「ナマズ」でも同じものがヒットするようにしてしまうものなのですが、ベータ版だからなのか、敢えてそうしているのかはわかりませんが、カタカナと漢字が資料を扱う立場の違いを明瞭に表す典型例のように思えました。こうなってくると、「鯰」と「ナマズ」に限らず、漢字とカタカナの検索を区別できる機能用意しておくことで利用者の「発見」を促すことができたりして、面白さが増すかもしれませんね。