国デコ(国立国会図書館デジタルコレクション)の使用感を今更ながら…

国デコ(国立国会図書館デジタルコレクション)を常日頃大変活用させていただいており、国立国会図書館の中の人達が色々努力と工夫を重ねてきておられるということはよく認識しております。その上での話なのですが、ここしばらく、国デコをかたっぱしから見ていくという作業をしていたので、そこでちょっと気になった点をいくつかメモしておきます。

 

すでに多くの人が感じていることであり、ほとんど(あるいはすべて)中の人も認識しておられることだろうと思うのですが、次回のシステム更改の際などにご検討いただけますと幸いです。

 

1. 出版(刊行)年の取り方がどうもよくわからない…?

 issued:W3CDTFのデータをみると、西暦で出版年を取ることができます。しかし、0で終わっているものの場合、その年代で詳細が不明な場合、issuedを見ると[18--]などとなっており、その-をissued:W3CDTFでは0に変換しているようです。これの典型的な例は1000年で、インターネット公開資料だけで6021件もあるようなのですが、実際、1000年を見てみると、江戸時代のものとしか思えない大変きれいな浮世絵のようなものも表示されたりします。これはissuedを見ると[1---]となっており、2千年紀であること以外わからない場合につけられている場合があるような雰囲気です。しかしながら、issuedには必ずしも西暦が入っているとは限らず、ここは色々な書き方がなされているようでもあります。検索APIで500件までとれるのでちょっと見てみたところ、以下のような感じです。それぞれの書き方に対して登場件数もつけてみています。

 

なし?: 100
乾隆: 15
乾隆刊: 3
元刊: 1
光緒: 4
光緒刊: 8
光緒寫: 2
光緒石印: 12
古寫: 1
嘉慶刊: 55
奈良室町寫: 1
奈良寫: 1
宣統刊: 1
室町刊: 2
室町寫: 5
弘治12序刊萬暦補刊: 8
明刊: 7
明寫: 8
朝鮮刊: 3
朝鮮刊補配活字印: 1
民國: 1
江戸: 1
江戸刊(鹿角山房藏版): 14
江戸刊: 9
江戸初期寫: 5
江戸寫: 29
江戸木活字印: 3
江戸活字印: 1
清刊: 20
清初刊: 6
清寫: 4
清寫,附江戸寫: 23
萬暦刊: 3
道光光緒刊: 8
道光刊(世楷堂藏版): 1
鎌倉中期刊: 1
鎌倉刊: 8
[1---] [写]: 157
[1---] [寫]: 7
[1---]: 47
[室町-明治時代] [写]: 1
室町時代] [写]: 2
室町時代]: 1
[平安-室町時代] [寫]: 2
[康煕]: 1
[明刊]: 2
[江戸時代] [写]: 2
[江戸時代]: 1
鎌倉時代] [写]: 1
[高麗]刊: 1
 

こうして見てみますと、せっかくこういう情報を書いていただいているので、ここから「範囲」の情報などを入れていただくとか(というのはちょっと大変過ぎるかもしれませんが)、あるいは、書き方をある程度統一してみていただくとか、表示結果が統合されているようにラッパー的なものをかましていただくとか、何かしていただけるとありがたいなあ、と思ったところでした。(おまえがやれ、と言われそうでもありますが…)しかし一方で、納税者としては、ここにあまりお金をかけすぎても困るとも思っておりますので、何か良い案配の対策を見つけていただけたらと思っております。あと、少なくとも、ここにどういう語彙が用いられているのか、というリストもあるとありがたいなあ、などと思ったりもしております。ぱっとみて気になるのは、たとえば、

>江戸寫: 29

>[江戸時代] [写]: 2

>明刊: 7

>[明刊]: 2

あたりでしょうか。少なくとも2系統あるような感じとも言えるでしょうか。入力時期の違いによるのかもしれませんね。検索APIの制約で500件しか採れてないので、残りの5500件程がどうなっているかわからないのですが…

 いずれにしましても、ここら辺を、私のようなDIYプログラマにも使いやすいように整備していただくのは、NDLのデータが幅広く活用されるようになっていく上でもとても重要なことかと思いますので、ぜひ前向きにご検討いただけたらと思います。

 

2. 読み進める方向とカーソルキーやサムネイルの並びが?

 おそらくは近代デジタルライブラリー由来であろう書籍資料は、サムネイル一覧を表示したときに左から右にサムネイルが並びます。さらに、ページを繰っていく時も、「⇒を押すと次ページ」です。縦書き資料の場合、カーソルキーと読んでいく方向が逆になってしまうので、ちょっとわかりにくい感じになってしまっています。カーソルキーに関しては、「古典籍資料」でも同様です。特に古典籍資料の場合は、縦書きがきわめて多いので、「⇐を押すと次ページ」という風になっているといいのかなと、さらに言えば、縦書き横書きのフラグをたてるなり自動認識を試みてみるなどして、縦書きと横書きで方向を変えられるといいのではなかろうかと思っております。

 そして、これに関連した困った問題として、サムネイル一覧の表示については、古典籍資料はちゃんと右から左に並んでいて、しかし、上述のように、古典籍資料でないものは左から右、という風になっています。近デジ/古典籍資料で対応が別れているのかもしれませんが、実際には、一つの検索語で検索して色々な時代の資料がヒットしたりすると混在するものを見ていくことになるので、これはなかなか頭の切り替えが難しいです(年のせいかもしれませんが)。この点でも、やはり、読んでいく方向に全体的にあわせる、といったような対応が期待されるところです。

 

3. 「著作権保護期間満了」と「文化庁長官裁定」を区別して検索できない(ような?)

 教材やその他、再利用を前提として国デコ資料を探す機会は結構あると思うのですが、文化庁長官裁定により公開されている資料だと、再利用に結構な制限がかかるのではないかと思います。ですので、検索の時点で除外してもらえるとありがたいのですが、私の使い方だと(見落としているだけだといいのですがもしそうなら見落としにくいようにわかりやすくしていただけるとありがたいです)、「インターネット公開資料」以上の絞込ができないので、各資料のページを開いてからいちいち確認していますがたまに見落としてしまって、あれれ、という風になります。

 なお、先日中の人におうかがいした際に、「APIでは区別できるようになっている」とおうかがいしたのですが、検索APIでの区別の仕方をうまく見つけられずにおります(というか、インターネット公開か館内限定か、というフラグもうまく見つけられておりません)。各資料のURLにアクセスすると、dcterms:rightsとかdcterms:accessRightsなどでアクセスできるようなのですが、検索APIでの500件上限という制約もありますので検索APIで絞込みできるとありがたいなあと思っているところなのです。いずれにしても、まだ自分では最新版のAPIを確認しきれていないのですが、できるなら、ぜひ確認して適用したいと思っております。また、一方で、国デコ検索ページでも、保護期間満了と裁定を区別できるように(あるいはそれがわかりやすいように)していただけるとありがたいです。

 

4. サムネイル一覧はもうちょっとたくさん出てくれるとありがたいです。

 これについては、これ以上申し上げることはありません。

 

他にもいくつかあったような気がするのですが、今夜飛び込みで入った仕事に注力していたら忘れてしまいました…。

 

それから、2.や4.に関しては、 このブログで何度かご紹介しているIIIFを導入していただければ基本的には解決できますので、その意味でもぜひご検討いただけたらと思っております。導入だけなら無料でできますので、ぜひともよろしくお願いいたします。