Mirador 3が正式リリース:IIIF対応ビューワが新しくなりました

IIIF対応ビューワの代表格の一つ、Miradorの新バージョンが、ついに正式リリースとなりました。バージョン2の反省を踏まえつつ、一方で、バージョン2を通じて一気に広がった開発者コミュニティのパワーを活かして、バージョン2よりも圧倒的に便利そうな雰囲気のものができあがってきました。

f:id:digitalnagasaki:20201113011727p:plain

開発の中心になったのはスタンフォード大学図書館の面々です。開発に着手するときは、インターフェイスの専門家に担当してもらって片っ端からインタビューを行なって可能な限りニーズに対応したものを作るべく徹底的に取り組んだようです。私にまでZoomインタビューをしてきたほどですので、その調査範囲はかなりのものだったのだろうと思います。一方で、バージョン2ではなしえなかった、音声や動画、3Dなどへの対応も、レイヤー構造にすることで拡張可能な形で対応していきたい、と、中心メンバーであるStuart Snydmanさんが強調しておられましたが、これも、正式リリース直前に、音声動画対応機能が正式に組み込まれたようで、おそらくはレイヤー構造的に色々なメディアコーデックを取り込めるようになったのだろうと思います。開発の向けての盛り上がりの様子は、Githubの状況をみていただいても想像できるだろうと思います。

元々、IIIFは、アノテーションの連鎖によってあらゆるコンテンツを表現しようとするセマンティックWebの賜物ですので、アノテーションの連鎖の先にOpenSeadragonなり、音声や動画のコーデックや3Dのレンダリングライブラリ(?)などがあれば、それらもつなぎあわせて連鎖からなる情報空間を創り出していきます。言うは易し、で、実際にそれを実現できるソフトウェアを開発するのはそう簡単ではなく、バージョン3にしてようやく、一つの形になったと言えるのだろうと思います。少し前に、IIIF Presentation API もバージョン3にアップデートされたことで、時間軸でのアノテーションも共通仕様として可能になりましたので、タイミング的にもちょうどよい感じです。

Miradorは元々、複数コンテンツの並列表示やレイヤー表示に特徴を持つビューワでしたが、それが画像以外のマルチメディアコンテンツにも対応できるようになったことで、今後、その連鎖の網の目が一気に広がるのだろうと思います。これをうまく活かせるコンテンツが世界各地から、世界中のIIIFを活用しつつ現れてくるのだろうと思うと、わくわくしてきますね。

残念ながら、筆者はまだ充実したマルチメディアコンテンツのようなものは持ち合わせていないのですが、さっそく、これまでMiradorを組み込んでいたSAT大正蔵図像DBのものを最新版にアップデートしてみました。

youtu.be

ここで驚いたのは、他のシステムに組み込む方法や、複数画面をならべて表示させるためのプログラムの書き方がかなり簡単になっていたことです。これまで以上に広く活用されるであろうことが想像されます。それから、一つ感動したのは、使い方に関するこちらの質問に即応していただけたことです。マニュアルがまだそんなに整備されていないので、一生懸命ソースコードを読もうとしてみるのですが、今回、MiradorはReactをベースとして開発している一方で、筆者は最近、同種のもので周囲の人が比較的よく使っているVue.jsを勉強し始めてしまったために、そもそも何がなんだかよくわからない…(?_?)という状態になってしまっておりました。バージョン2の時は、筆者も常用していたjQueryをベースにしていたので、ソースコードを読めるどころか、修正コードを提供したりもしていたのですが、バージョン3では今のところまったく歯が立たない状況です。そこで、SlackのMiradorチャンネルに「こういう使い方をしてみたいんですが…」と問い合わせてみたところ、即、お返事をいただくどころか、FAQに追記していただきました。「ウインドウを開いた後に、外部のJavascriptから画像にズームインする」という機能だったのですが、書いていただいた事例でまさにぴったりできました。それを組み込んだことで、上記の動画のように、複数ウインドウを開いた後にそれぞれのウインドウで該当箇所にズームイン、というところまでできました。ご教示してくださったJack Reedさんには深く感謝いたしております。

ご覧いただけばわかると思いますが、Mirador3は、「ここがすごい」というところは今のところそんなにないのですが、インターフェイスが洗練されていて、プラグインを組み込む場合でもバージョン2よりもかなり統一感のある形で組み込めそうな感じです。組み込み方や各種設定方法など、こちらの頁で徐々に紹介されていくと思いますので、ぜひ注目して置いていただければと思います。自分で作れなくても「こういうのをいつか誰かに作って欲しい」ということでURLと使い方をメモしておけば、それがやがて、デジタルアーカイブのインターフェイスをリッチにして使いやすいものにしていくことに何らかの形でつながることになると思いますので、ぜひ色々試したりメモしたりしてみてください。

デジタルアーカイブ学会賞授賞を機に『日本の文化をデジタル世界に伝える』を改めてご紹介

昨秋、『日本の文化をデジタル世界に伝える』という著書を刊行した。このブログでは刊行の経緯について触れたことがあり、また、大学院生の方々による紹介記事を掲載したことがあったが、内容について、自分ではあまり触れなかった。この本が、ありがたくもデジタルアーカイブ学会の賞をいただくことになり、最近、そのための挨拶文を書くという機会があり、また、少し前に、ありがたいレビューをいただいたこともあり、改めてこの本が伝えようとしていることについてちょっと記しておきたい。

本書は、端的に言えば、文化資料デジタルアーカイブの構築・運用を扱うものである。そして、技術的な事柄を基礎として、そこから立ち上げってくる種々の課題に ついて解説したものである。近年デジタルアーカイブにおいて中核的なものとなってきているWeb技術は日進月歩だが、同時に、常にその技術的制約によって 提供者・利用者ができることが変わり続けている。理論的には何でもできるはずだが、コモディティ化した技術でなければ実質的には使えないのと 同じであり、そのレベルでもたらされる制約を把握しておくことによってはじめて、大きな飛躍の可能性を想定し、準備することができる。 それでは、技術のコモディティ化はどのようにしてもたらされるのか。そして、それとどう付き合えばいいのか。本書が狙いとしたのは その点を明らかにすることで技術的制約にどのようにして取り組んでいけばよいのかを示そうとしたのであり、さらに、それによって、 デジタルアーカイブの技術的な持続可能性のみならず社会の中での持続可能性を高めていくことができると提示しようとしたのであった。

特に強調したかった点の一つを挙げるなら、コモディティ化のプロセスにおける技術・規格の標準化と普及は、デジタルアーカイブを構築・利用する我々であっても 関与できる事柄であり、むしろ必要に応じてそこに関与することによって自らの取り組みを広く世界に浸透させ、その意義をより深めることが できるという(実は当たり前の)事柄である。実際にそれをするかどうかはともかく、日本に保存されてきた文化資料のデジタルアーカイブに取り組む人々がそのことも視野に入れながらデジタル世界に伝えるべきことを 考えていくなら、そのような主体的な態度で臨むことによって、デジタルアーカイブの持続可能性の要である標準技術への 準拠という、外野からは簡単そうに見えながら現場ではしばしば困難な課題に建設的に取り組んでいけるようになるのではないか、 そしてさらに、目の前のデジタルアーカイブに取り組むという孤独な営みが世界のともがらと様々な形でつながっていることを実感する契機になる のではないか、そのような願いを込めたつもりである。日本の写本のデジタルアーカイブで取り組んでいる課題は多くの場合西洋中世写本にも同様の課題があり、 日本の木版本の課題はインキュナブラに似た課題を見いだせることもある。異なる点も様々にあるが、似たところを見つけることで 自分(達)が孤独ではないという気持ちを持てることはプラスに働くこともあるだろうし、 それによって発想が広がることもあるだろう。そして、そもそも混淆的な文化である日本の文化資料に 取り組むことは、そのまま世界とつながることでもある。そのことは、文化資料の次元でもデジタルの次元でも 様々にあり得るのである。

そのようなことで、本書は、個別の技術をかなり多く採り上げているものの、話としては比較的長く通用するような内容としたつもりである。 目前の大切な資料を相手に、デジタルアーカイブをどのように作っていけばいいか、そしてそれをどう維持していけばいいか、と考えている方々のお役に立つことがあれば幸いである。 また、そのような営みである文化資料デジタルアーカイブというものを、デジタル情報知識基盤に関わろうとする様々な立場の方にも理解していただくことができれば、なお幸いである。

日本学術会議の提言を読んでみる:学術情報流通の現在と未来【総集編】

ここのところ、9回にわたり、日本学術会議の提言「学術情報流通の現在と未来」を読んできました。 このところ、日本学術会議が話題になることが多く、そもそも研究者の間であまり知られていなかったということも広く認識されました。 そこで、日本学術会議がもっと知られるべきだ、という話もあちこちで聞くようになったのですが、 「日本学術会議とは何か」という話が多いような気がしまして、しかし、そういう話だけではなくて、 では実際にどういう提言を行なっているか、ということについて広く知ってもらうことも、 認知や理解を広める上では重要なのではないかと思うところです。

このシリーズの第一回冒頭に書いているように、このブログ記事シリーズはそこまで大きなことを考えていた わけではなかったのですが、「提言」のなかには、少なくとも関連分野の人は皆知っていた方がいい ようなものも結構あります。いわば、研究者コミュニティというギルドから社会に発信している情報ということに なりますので、そういう意味でも知っておくべきところかとも思います。 そのようなことで、「提言」の内容について議論するような場がもう少しあちこちにできて くれるとありがたいと思います。そうなれば、研究者コミュニティが社会との接点を意識する 機会も増えていって…それがよいことなのかどうか自信がありませんが、少なくとも社会のなかでの 居場所をもう少し明確にしていくきっかけになるのではなかろうか、とは思います。また、 民主的に選ばれてない人達が勝手に一方的な提言を作っている、というような批判は研究者サイドからも 散見されますが、そういう状況を改善する意味でも、各自が関連のある「提言」について 広く議論できるような場が形成されていくとよいのではないかと思うところです。

というわけで、雑駁な話ばかりで恐縮ですが、9回に分けて「提言」を読んでみたブログ記事を以下にリストしておきます。

digitalnagasaki.hatenablog.com

digitalnagasaki.hatenablog.com

digitalnagasaki.hatenablog.com

digitalnagasaki.hatenablog.com

digitalnagasaki.hatenablog.com

digitalnagasaki.hatenablog.com

digitalnagasaki.hatenablog.com

digitalnagasaki.hatenablog.com

digitalnagasaki.hatenablog.com

日本学術会議の提言を読んでみる:学術情報流通の現在と未来 9/n

少し間があいてしまいましたが、いよいよ、第三章「提言」に入ります。

http://www.scj.go.jp/ja/info/kohyo/pdf/kohyo-24-t297-6.pdf#page=24

ここは、今まで読んできたことのまとめのようなもののようですので、筆者の関心から 斜め読みしつつ気がついた点をメモしていきたいと思います。

まず、喫緊の課題として

学術情報環境のスクラップアンドビルドによる再構築、機能再生と国際競争力強化

が挙げられます。これをどのように実現すべきかということについては

現在分散して交付されている政府補助金を再構成するとともに適正な受益者負担により、新たな経費の発生を最小限に抑えた新しいシステムの構築を目指すべき

とのことです。やはり「政府補助金の再構成」がこの件の肝ですね。本来研究に回すべき費用のいくぶんかが電子ジャーナル会社に不必要に多く回ってしまう、という 状況のようですので、これをなんとかすることは普通に考えるととても重要なことのように思えます。

とはいえ、研究者個人のレベルでメリットを感じにくいようだと、話を進めるのはなかなか難しいようにも思われます。 今は競争的態度を奨励する向きも強いので、全体が減っても自分の研究費さえ多く確保できれば実際の問題は あまり生じなさそうです。それほど長くない研究に費やせる人生の時間を少しでも大事にしようと思った時に 全体のために面倒なことを少々でも引き受けるのか、それともひたすら自分の研究環境の向上のみに邁進するのか、 と考えると、後者を選ぶ人を責める気にはなれません。ですので、負担を引き受けてもらうにしても、 最小限に、そして、できれば、何か目に見えるようなメリットを提供するということは重要かと思います。

人文系の場合には、これもやはり分野によって様々だとは思いますが、J-Stageに個々の研究者が論文を掲載できる 仕組み(Webで成績入力できるくらいの情報リテラシーがあれば対応できる)は用意されているので、少し手間を かける気になれば、オープンアクセスの電子ジャーナルは割と簡単に実現できるのですが、しかし、やはり その少しの手間をかける(=そのために本来の研究にかける時間をこれまで以上にもう少しだけ減らす) 気になれる人がどれくらいいるかという問題は残ります。

さて、続けますと、次は

(1)学術誌購読費用と APC の急増に対応する国家的な一括契約運営組織の創設

です。電子ジャーナルの購入・管理のための法人を立ち上げて、 最初は研究機能が強力な大学や研究機関による一括購読契約を行い、 雑誌を幅広く読めるようにしつつ経費を節減しようということです。 さらに、いずれはAPCの費用も集約するとのことです。これはかなり 多額のお金が動くことになるようですが、それに見合う力を持った 人を少なくとも数人は貼り付けないといけないように思えます。 その当たりで、これは果たして大丈夫なのだろうか、と、やや 不安です。組織がやることは基本的には契約の管理のようですので、 ここでの仕事が研究成果のような形になるのはちょっと難しそうです。 そのあたりを踏まえた上での人材確保がうまくできるとよいのですが…。 人文系で強い研究機関と言えば人間文化研究機構に属する各機関が思い浮かび ますが、そういったところが主に購読しているのは、いわゆる大手の海外電子 ジャーナル会社ではないところにようにも思われます。そうすると、 人文系がここに参加するメリットがどれくらいあるのか、ということも もしかしたら検討の俎上にのせねばならないのかもしれません。

さて、次に、

(2)トップジャーナル刊行を核とする学術情報発信の機能強化と国際競争力向上

ですが、この節はさらに細分化されます。

① 理学工学系の国際的トップジャーナルの刊行

こちらに関しては、できるとよいだろうとは思うのですが、とにかく、 多く引用されるような論文を書いてくれる著者が投稿してくれるという 状況を作る必要があり、これはなかなか難しそうではあります。むしろ、 日本文化に関する人文系の国際的ジャーナルを出すことができれば、それは 日本が出すものがトップジャーナルになれる可能性は高いようにも 思います。実績の数字が必要なのであれば、むしろそちらも並行して 進めるとよいかもしれないとも思います。

② 電子ジャーナルの編集・出版サービスのための法人組織

ジャーナル出版サービスを提供する法人を立ち上げるべし、とのことです。 これもやはり人材確保の問題がちょっと難しいようにも思われます。 また、国際水準のジャーナル出版は、繰り返しになりますが、 引用数の多い論文を書いてくれる研究者に、虎の子の論文を投稿して もらえるかどうかということに尽きますので、そういう意味での 営業力も重要かと思われます。国際的にみて強力な編集委員会を用意できるような 人脈を持つ人にこの仕事を本気でやってもらえるようにする必要がありそう ですが、そうするとどういう人材をどういう風に配置するとうまくいきそう でしょうかね。実はすでに当たりを付けてある分野があって、お金さえつけば 人材も編集委員会もなんとかなる、ということでしたらいいですね。 実際のところ、どうなんでしょうね。

③ ピアレビューを経ない出版への対応

この件については、特に新しい指針はなさそうですが、一方、 ハゲタカジャーナルに関しては対応を強化すべきとのことです。 研究不正では世界でもトップクラスの我が国としては、 そのあたりのことは組織的にきちんと取り組んでいく必要があるのでしょう。

④ 和文誌の被引用インデックスの充実

これはまったく賛成です。ぜひ頑張っていただきたいところですが、 「学術情報流通統計センター(仮称)」の設立が提唱されてまして、 しかしこの件はわざわざ組織を設立するほどのボリューム感のある 仕事にできるのかどうか、ちょっと気になります。受益者負担も 謳われていますが、受益者というのが引用データを作ってもらう(?)側なのか 使う側なのかよくわかりませんが、引用データを作ってもらうのに 多額の費用が必要で、しかしそれを頼まないと研究評価指標に のせてもらえない、というような事態にならないようにして いただけるとありがたいと思ってしまうところです。その当たり、 ちょっと心配性になっております。

⑤ AI 技術を利用した編集・出版支援システムの実現

AI技術の活用は、今はできる人は引っ張りだこで、できる人を引っ張るには 面白くてお金になる仕事にすることが重要かと思うのですが、しかし、 上述のように、論文を刊行するのにあまり多額の費用がかかってしまう ようだと困りますので、どのようにしてそれほど費用をかけずに可能か、ということは色々検討してみて いただけるとありがたいところです。

そして、オープンデータ/オープンサイエンスの話に移ります。

(3)理学工学系におけるオープンデータ/オープンサイエンスの進展

研究データ公開は外国出版社に頼らずに自国ですべし、とのことです。 「このために高い問題処理能力を持った人材の育成と活躍の 場が必要になるため、必要な人材育成のためのプログラムを早急に検討するべきである。」 とのことですが、特に工学系だと特許とか営業秘密などもあるでしょうから、 そのようななかで、オープンデータ・オープンサイエンスをどのように 位置づけているか、というのは個人的にはまだよくわかっていません。 その当たりのことも含めて対応できる高度な人材育成をしよう、ということなの だろうとは思いますが、これもなかなかハードルが高そうです。

人文系の場合、オープンデータの流れに乗って、紙媒体資料をデジタル撮影した ものをオープンデータとして公開する例が増えてきていますが、売れば お金になりそうなものはオープン化しないことも多く、まだまだ、まだらな 感じです。研究データにあたるもの、つまり、資料を基に研究者が作成した 様々な種類のデータに関しては、どこかが集約して管理してくれると ありがたいところです。また、ソフトウェアに関しては、欧米発の人文学向けソフトウェアは 助成金団体の縛りもあって、オープンソースで開発・公開されるものが 非常に多くなっています。

そしていよいよ最後になりますが、

(4)学協会の機能強化

こちらもさらに二つの項目にわかれます。

① 学協会が発行する学術誌の編集・出版を集約した学術出版の高度化

学術出版に関して、学協会が共同することでスケールメリットを 出せるようにしつつ、共同で高度化していこう、ということのようです。 システムの共同開発・運用も謳われていますが、できれば、一からの 開発よりも既存のものをうまく活用するような形にしていただければと 思っております。というのは、自前で独自開発すると、特にユーザ側からの 書き込みが入るようなシステムはメンテナンスもセキュリティ対応も大変で、 結局、依拠しているミドルウェアやフレームワークのメジャーバージョンアップの 時に動かなくなって、しかし、動くように改良するには費用がかかりすぎるので… ということがいかにも発生しそうですので、たとえばOpen Journal Systemを 利用するとか、何かそういう感じにしていただけるとよいのではないかと思うところです。 また、かつて学術雑誌刊行として手当てされていた科研費の研究成果公開促進費は、 今はまさにそういう動きをサポートするような条件になっているので、その流れを 維持していけばよい、ということでしょうか。ただ、あの件は、すでに 協働することが決まっているところに助成をするということであり、 そこに至るまでの諸々の交渉などについてサポートしてくれるわけではないので、 それはやはり大変なところです。

② 連携・連合・統合を推進するための仕組み作り

最後に、少子高齢化を見据えて学協会の協働・統合を推進する仕組み作りが 提要され、日本学術会議としてもこれに注力すべきであるとしています。 それもまったくごもっともな話です。学会事務機能の維持が困難になる 学会が今後増えていくでしょうから、それはなんとかしなければならない 状況かと思います。

それから、「学術法人」を実現すべしという話も出てきます。公益法人のような 税制優遇措置が可能な制度を作るということでしょうか。夢があってよさそうな 話ですが、ハゲタカジャーナルならぬハゲタカ学会の乱立させる誘引にも なりかねなさそうなので、認可に結構手間がかかるような制度になりそうな 気もします。そのあたりは法律に詳しい方々のお仕事になるでしょうから、 よい案配の落としどころをみつけていただきたいところです。

ということで、日本学術会議の提言「学術情報流通の現在と未来」を読んでみる 企画はこれで終了です。ずいぶん長くなりましたが、 なかなか読み応えのある「提言」でした。機会があれば、また別の提言も 検討してみたいと思います。

日本学術会議の提言を読んでみる:学術情報流通の現在と未来 8/n

前回に続いて、日本学術会議の提言「学術情報流通の現在と未来」を読むシリーズです。 8回目です。

今回は、学協会の機能強化という話になるようです。

(4)学協会の機能強化に向けて

① 我が国の学協会の現状と将来予測

http://www.scj.go.jp/ja/info/kohyo/pdf/kohyo-24-t297-6.pdf#page=19

冒頭からいきなり、深く肯かざるをえない状況説明があります。

我が国では小規模で狭い専門分野の学協会が乱立し、手弁当での運営を余儀なくさ れているとともに、その多くは会員の減少に苦しんでいる (中略) 今後さらに少子高齢化による会員減少が加速化すると、いずれは海外の学協会や隣接した分野間での会員獲 得競争が始まり、一部の学協会では活動が立ちゆかなくなる事態も想定される。

人文系もまさにその通りになっています。そもそも大学院進学者が減っているようで、 学会の「若手」も減る一方、というところが少なくないような感じです。私が 大学院生だった頃と異なり、非常に厳しく指導してそれでもついてくる人だけを 相手にする、とか、だめな点だけを指摘しておけば解決策も自力で考えるし メンタル的にも問題は生じない、とか、将来は大変だけどそれでも大丈夫か と念を押して、それでも進学する人が結構いる、とか、そういう時代ではなくなって しまっていますが、そういう状況にあわせて学会の在り方から雰囲気まで作り替えていく というのはなかなか難しいようです。特に、周囲の環境の変化も大きいところです。 私が院生の頃、1990年代半ば、指導教員に言われたのは「同期が課長になって子育てもしている頃、 予備校の先生でもいいですか」ということでしたが、今振り返ってみると、 予備校の先生でいられたらかなりいい方です。その頃は塾講師のアルバイト代も 今よりはずっと高かったように思いますし、教育産業が基本的に華やかでした。 その後の少子化によってシュリンクしていくことはなんとなく見えていましたが、 まだ持ち直すかもしれないという期待感も少しありました。そのようなことで、 大学院に進むにあたっても、セイフティネットのようなものが教育産業 の中で自然と形成されていたような感じでした。現在は、少子化により教育産業もかなり 厳しい状態になっているようで、院生がどこかで勝手に食い扶持を見つけて きてくれるので研究指導さえしていればよい、という状況ではなくなって しまっているような気がします。そのような状況で学会が院生や若手の集う 場になろうとするためには、むしろ若手のプロモーションを真剣に考え、 彼らが知的充実感を得られるような場を提供していく必要があるでしょう。 そういう方向に進むことのできている学会もあると思いますが(その意味で 情報処理学会には学ぶべきものが多いと思っています。)、困難に 陥っている学会も少なくないと仄聞しています。

次の段落では、海外の学会の大規模化と収益構造の話が出ています。会員の規模だけでなく、 出版やデータベース販売などの営利事業からの収入もあるのだそうです。 確かに、海外だと、学会の会場がシェラトンホテルとかマリオットホテルの貸し切りだったりと、 日本だと理工系の裕福な分野でなければなかなか想像できないような学会が人文系の学会でも あります。ただ、学会の参加費も相当高額なので、何かもう少し、常識のレベルで異なる事象が あるのではないかとも思うのですが、それはそれとして次にいきましょう。

…と、この先もしばらく、日本の学会の先行きが暗いという話が続きます。 「資格認証や検査事業等の営利事業収入がある工学系学協会」は潤沢だが、 会員2000人以下の学会は基本的に下降線であり、一方で学会活動維持の 負担が若手に集中してしまうことが問題視されています。これもまったく おっしゃるとおりで、ぐうの音も出ません。私もいくつかの学会で結構な 仕事を負担をしていて、ある年、さらに一つ増やしたら完全にダブルブッキングしてしまって 全然仕事ができなかったので翌年度は委員を外されたということがありました。 先方にもご迷惑をおかけして、それまでの学会の仕事も精度を下げてしまった ので、ひたすら反省するしかなかったのですが、まあそんな感じでどこも 厳しい状況なのだろうと思います。

 提言の方では、やや厳しく、中小学会の盲目的な継続による弊害を問題視しています。 後ろ向きな理由だけでなく、「新領域を開拓し学際領域へ拡大することによって当該分野の発展を先導し、 国際競争力を維持強化するという本来の学協会機能を発揮するためにも」とのことですので、 そのような高い志をもって学会の連合や統合を検討していくことは今後(すでに今も、ですが) 重要であろうと思います。

 なお、人文系や人文情報系でも、そういう風にした方がいいのではないかと思われるものは いくつかあるのですが、話を聞いてみるとそれなりに色々理由があって、 今の主導者が生きている間はなんとかして続けるのだろう、という話になってしまうことが多いです。 実際のところ、学会の場での議論の性質が全然違う場合もあり、簡単に統合してしまってうまくいく わけでもないということもありそうですので、まだちょっと時間がかかりそうな事柄です。 自分が関心を持たない議論に接した時に「そんな議論に何の意味があるのか」ということを言わない人が増えるといいのかもしれない、とは 思うのですが…。その当たりのメンタルというか発言様式のようなものも少し変えていく必要が あるのかもしれません。

さて、次に、いよいよ学術出版の持続可能性の方に話が進みます。

② 我が国の学協会による学術出版の持続可能性

これまでの話の流れを受けて、小規模学会による零細出版の問題と、大規模化の必要性が ひたすら主張されます。概ねおっしゃるとおりですが、国内人文系学会の場合、 一つ大きく状況が違うように思われるのは、 「会費を投入して多くの被引用数ゼロの論文を出版する意義がどこにあるかという批判」 という点でしょうか。被引用インデックスを作っていないのでなんとも言えない面も ありますが、基本的に、極めてオリジナリティの高い内容のものが多く、 引用云々というより、続く研究の礎として、すぐにではなくても数年後、 十数年後、数十年後にさらに大きく華開くようなものも少なくありません。 そこまでいかずとも、引用が全然行なわれないような論文は少ないように 思われます。(私が知らないところにはそういうものもたくさんあるのかも しれませんが…)。

とはいえ、零細出版が持続しないであろうことはまったくその通りです。 ここでは編集・出版の集約化を行なうことでスケールメリットを出していく ことが提起されていますが、それも一つの選択肢だろうと思います。 ただ、編集・査読体制をうまく整理しないと、ダメな論文がするっと 掲載されてしまったり、良い論文なのに査読者のスタンスの違いで 掲載されなかったり、といった事が、下手をすると分野単位で生じてしまい かねないので、とにかく、やるならうまくやっていただきたいところです。 ただ、「外部の出版法人組織としてベンチャー化するなどの将来展開」 あたりになると、ちょっと広げすぎかなという気もしないでもないです…

というわけで、次は学協会の連携・連合・統合化の話に入るようです。

③ 学協会の連携・連合・統合化による活動強化に向けて

これまでも連携・連合・統合化は提言されてきたそうですが、 実のところ「連携・連合体による事業の共同運営には、強い法人会計上の制約」 がネックの一つになっているようです。たしかに、会計的な難しさがあちこちに 顔を出すであろうことは、小さな一般財団法人に属している身としては なんとなく想像つきます。とはいえ、

「統合以外にオプションがないという追い込まれた状況での合併は失敗する」が、「余力がある内に未来志向で行った合併は成功する確率が高い」

ということが米国における大学統合でみられたようですし、それはもっともなことだと思います。

とにかく学会活動はスケールメリットが大きく、なるべく大型化した方がよいと 強調されます。 そして、統合体が難しいとしても連合体なら可能なのではないかということで、 地球惑星科学分野における「公益社団法人日本地球惑星科学連合」の事例が紹介されます。

個人的な経験からしますと、組織が大型化するとコンセンサスの形成が大変になって、 上が取り回す新しい動きはある程度できるとしても末端からの新しい動きがしにくくなってしまう 面があるように思ってまして、新たに小さなものができていくこと自体はかまわない が、いずれそれが大きな連合体に属していくような、そういう流れならよいのかもしれない と思ったりもしました。

そして、学術会議が連携・連合に向けてあまり機能できなかったことを 反省しつつ、今後、なんとかして推進していくことを検討すべきであるとしています。

そしていよいよ、最後の章の提言に入ります…が、今夜はこれくらいにしておきたいと思います。

第三章 提言

日本学術会議の提言を読んでみる:学術情報流通の現在と未来 7/n

さて、またまた前回の続きです。このあたりから、より具体的に方策を検討していくようです。

http://www.scj.go.jp/ja/info/kohyo/pdf/kohyo-24-t297-6.pdf#page=18

(3)オープンデータ/オープンサイエンス

② オープンデータ/オープンサイエンス時代の知財リテラシーと必要な人材

タイトルの通り、知財リテラシーと必要な人材、という、これがなくては本格的な仕事ができないという 話に踏み込んでいきます。 「オープン化」は、自由な再利用と再配布を含意するようになってきているが、研究者の側に その理解が十分に広まっておらず、OD/OAジャーナルへの投稿に際してはこういった知財管理的なことに ついて特に留意すべきであるとしています。また、研究データに関しては、知財の観点だけでなく、 データの検証性を確保して公正性を担保するという文脈もあります。一方で失敗した実験データの 管理も求められることになります。こういった条項を踏まえつつ日本の研究を適切に 発信していくためには「研究データマネージャー」のような職種を設ける必要が あるとしています。

人文系の場合、分野によって色々あると思いますが、知財リテラシーという観点では、 (1) 一次資料の所有権、(2) そこから作成したノートやカード等の著作権、(3) 成果物の著作権といったあたりが 出てくるでしょうか。研究者側では(2)と(3)が主に関わってきますが、(2)に 関しては、前回のブログ記事での「二次研究データ」にあたるものと考えてよい だろうと思いますが、個人的に作成されたものの多くは基本的に公開を前提として作っているものではなく、 ごく一部の大家のものをのぞきほとんどはやがて死蔵され存在を忘れ去られていくことが多いものだろうと思われます。 また、協働で作成する目録等の場合には公開を前提として作成される場合もあるようです。そのような感じです ので、もし理工系のOD/OAジャーナルのようにデータ公開を求めてくる流れになるのであれば、 やはり同様に知財リテラシーが必要になっていくことでしょう。 一方、(3)に関しては、OD/OAジャーナルであればオープン化されることになりますが、 これをどのようなレベルでオープン化するか、という判断をすることになると、やはりある程度の リテラシーはあった方がよさそうです。これまでは著書出版であれば出版社があれこれ やってくれて、いつのまにか国立国会図書館で永久保存されているというものであり、 ジャーナルへの論文掲載であれば、学会やジャーナル発行会社が面倒をみてくれて、 あとは同様にであったように思われます。基本的に、かつては研究者があまり研究以外のことを 考えなくて済むような仕組みが形成されてきていたように思われるのですが、そこのところが 予算を削減されつつの変革期である上に人数が全体として減ってきているといことで、研究者が 色んなことに自ら配慮しなければならないという、なんとも厳しい状況に 陥っているところもあるようです。

そのようなわけで、こういったことを扱いつつ、人文学のデータに固有の状況も 把握して全体に反映させられるような「研究データマネージャー」人材は、人文学としても 今後重要になっていくと想像されます。

さて、この箇所は短く、もう終わってしまいました。 次は「(4)学協会の機能強化に向けて」となっておりますが、実はもう眠くなってしまって おりまして、続きはまた次回ということでお願いいたします。

日本学術会議の提言を読んでみる:学術情報流通の現在と未来 6/n

さて、前回記事の続きです。

いよいよオープンデータ/オープンサイエンスの話に突入です。 この節の番号が前と同じになってしまっているのは、学術会議の提言の オーサリングシステムがXML化されていれば大丈夫だった可能性が高いのに…、という、 論文XML化の件と同じような構造の話になっていて、やや興味深い ところです。もちろん、LaTeXでもよいのですが、要するに章・節の ナンバリングを完全に自動化するかワードのように部分的に手動で 頑張ってしまうか、という違いが現れているところです。 こういったこともあるので、論文本文のXML化をしておくとよい、 というこの提言の内容につながるわけですね。

さて、冒頭がちょっと冗長になってしまいましたが、続けます。

http://www.scj.go.jp/ja/info/kohyo/pdf/kohyo-24-t297-6.pdf#page=17

(3)オープンデータ/オープンサイエンス

① オープンデータ/オープンサイエンス時代の研究データ管理

まずは研究データ管理の話です。2016年の提言ですでに指摘している そうですが、個別分野においても大学等でも、研究データの 運用に関する取り組みが進んできているようです。研究倫理や 公正の観点からもデータ管理は重要であり、文科省から 10年保存の通達も出ているところです。なかでも、 オープンデータ化は、研究の再現性の検証とデータ再利用による イノベーションの触発に寄与するとのことです。これは人文系においても 割と重要なことで、論文の査読をしろと言われて、論文内で参照されている原本(写本など) を確認しようとしても、原本は門外不出で時間をかけない交渉をしない とみせてもらえない、ということもあります。このような場合に、 デジタル情報が公開されていれば、そこで再現されている限りにおいては 確認ができますが、そうでないとお手上げ、ということもあります。 また、資料のデータや、研究に際して作成したデータが公開されているのであれば、 それのみで新しい発見をすることは難しくとも、他のデータと 組み合わせることで新たな文脈を見出したりといったことも あり得るでしょう。これも、デジタルデータになっていなければ、 機械可読性云々の前に、そもそも資料が出会ってもらえる機会も なかなか得られないことでしょう。

これに関連して最近気になっていることの一つに、人文系の研究データと言った場合に、 その内実が少なくとも二つに分けられるようだ、ということがあります。一つは 資料をデジタル撮影したりデジタル翻刻したりした、いわば、研究対象資料の デジタル代替物、もう一つは、そういったものから何らかの知識を抽出した データ、です。後者は、カードだったり、ノートだったり、目録だったり、 色々なものがあり得ます。また、語彙集や索引などもこれに含むと 考えたいところです。研究者による知的な判断が比較的大きく含まれるもの、 という風にみておきたいところです。もちろん、デジタル翻刻もまたかなりの 知的判断を要するものではありますが、一方で、デジタル翻刻は、 基礎的な資料として利用されるようにするために、 なるべく研究者の主観が含まれないようにすることを志向するため、 そこから知識としての情報を取り出すという行為とは方向性に 大きな違いがあるように思われます。そこで、そのような基礎的な資料 という方向性を強くもった研究データと、これもまた客観性を 持つことを志向するのではありますが、しかしながらより積極的な 判断が加えられるものとしての二次的な研究データ、という風に分けて 考えると色々話を進めやすくなるのではないかと思っております。 最近、社会調査データの話にお付き合いすることがあるのですが、 この社会調査データは、人文学における研究データとしてはどの 部分にあたるのだろうか…とあれこれ検討するなかで出てきたのが この分け方です。現在、国文学研究資料館を中心に、全国で古典籍の デジタル撮影が大がかりに進められていますが、これを研究に活かそうと するなら、社会調査データのようなレベルでの機械可読性とはかなり 縁遠い状況です。一方、たとえば国立国語研究所が公開している 日本誤の歴史コーパスのように、資料からデジタル翻刻をした上で、さらに 一定の観点から詳細な注記(この場合は各単語に対する品詞情報など)が行なわれていると、 社会調査データのように機械可読性が高いものであると言えるのではないかと 思います。これらを仮に「一次研究データ」、「二次研究データ」として 区別するとしたら、現在国文学研究資料館を中心に大規模に推進され蓄積されている データの多くはあくまでも一次研究データであり、人文学における二次研究データは まだあまり蓄積されていない、という風にみることができそうです。 では社会調査データが用いられる世界における「一次研究データ」とは 何か、ということも考えてみたいところですが、ちょっと(かなり)長くなりそうです ので、それはまた別の機会に述べることにしたいと思います。

さて、提言に戻りますと、次は学術情報出版におけるデータの扱いが説明されます。 ここではデータポリシーの制定が重要であり、 最近は日本からも投稿が増えているオープンアクセスジャーナルでは、 論文の根拠となるデータのオープンな公開を求めるポリシーを採用している とのことです。ただ、必ずしもジャーナル運営側がデータを引き受けるとは 限らず、FAIR原則に従うデータリポジトリに掲載することを求めることもあるようです。 すでにいくつか著名なデータリポジトリも存在するようですが、我が国にはまだ そういうサイトは存在しないようです。

このような場合、人文学では、上述の二分類のうちの「一次研究データ」に ついては、いわゆるデジタルアーカイブとして公開されているものが 多いと思いますが、データ公開機関側ですでに公開されているため、その参照URL等を 書いておけばよいということになりそうですが、FAIR原則に準拠している ようなものがどれくらいあるか、自分が扱うデータがそれに準拠しているかどうか、 というのは確認・検討してみる必要がありそうです。それが再利用・再配布可能な 条件で公開されている場合には、むしろ論文と一緒に提出した方が、論文投稿後 のデータ消失といった憂き目にはあわずにすむかもしれません。 あるいはまた、上述の二分類のうちの「二次研究データ」の方は、 またちょっと状況が変わってきそうですが、最近はGitHubを用いる例が見られるようになって きています。たとえば、日本の古辞書を研究しているグループでは、 古辞書を翻刻し、一定の方針を立ててデータベース化した上でGithub上に公開しつつ、これを元に 着々と研究発表を行なってきています。海外に目を向けてみると、たとえば ドイツでは人文学のためのタグ付きコーパス(主にTEI準拠) を共有する仕組みとしてTextGridが提供されて シボレス認証にも対応していたりして、なかなか重厚な感じです。 欧州全体としては、CLARINというプロジェクトで、タグ付きコーパスを集約しているようです。 CLARINは、欧州の研究インフラ事業ERICの一環として運用されているもののようで、 デジタル研究インフラのなかに人文学の「二次研究データ」がしっかりと位置づけられているようですね。 我が国もそろそろこういったところを目指さねばならないだろうと思ってきているところです。

さて、また提言の方に戻りますと、我が国の学術情報流通もこのような方向に沿っていくべきであり、 そうでなければ大きなリスクを抱えていく可能性があることが指摘されます。しかし、それを 実現するのは国内の小さな学会では難しいので、共同利用できるリポジトリを核とするサービスの 構築を日本でも行なうべきであるとしています。この点は、NIIの方で何かやっているとか やろうとしているとか聞いたことがあるような気もしますが、提言の先の方にそういう話が 出てくるのかもしれませんね…。人文学だと、人文学オープンデータ共同利用センター(CODH) があって、今のところ独自作成のデータの公開が主であるように見えますが、今後、「二次研究データ」の データリポジトリの方向も持っていくような感じになっていただけるとありがたいと個人的には思っております。

また提言に戻りますと、研究助成団体による「オープン化縛り」が強くなるのにあわせて、 今後はオープン化しているかどうかが差別化の一つの重要な基準になっていくであろうことが 強調されます。それを解決するためには、新しい法人組織が必要であることが改めて提起されます。 そして、博士人材にこれを手がけさせることできちんとした専門家を育成していくべきであると指摘して、 この項を締めくくります。ここで興味深いのは、「理工学分野の博士の学位を有するとともにデータ管理の 専門的な知識を有する専門家が必要であり…」というところです。当たり前と言われればその通りですが、 研究データ管理にあたっては、研究データ管理そのものについての知識だけでなく、 特定分野の知識が博士レベルで必要であるとしている点です。つまり、もし人文系のデータも 蓄積していくということになれば、やはり人文系の博士号を持つ人材が必要になるということです。 人文系と言っても内容は非常に幅広いので、一人ですべてカバーするのは難しく、一人が数分野を 担当する感じで少なくとも数人は必要になるはずです。そこで博士人材が活かされることがあれば ありがたいと思います。

ということで、今夜もそろそろ限界ですのでここまでとしたいと思います。1頁しか進みませんでしたが、 内容が内容だけに、ブログの方はちょっと長くなってしまいました…。