IIIFで動画:『あつまれ動物の森』にSAT図像DBのIIIF画像を取り込む方法をIIIF動画で紹介してみる

しばらく前に実装したのですが、なかなか紹介するタイミングが作れなかったので、IIIFの動画コンテンツの扱い方の紹介にあわせて、SAT図像DBのIIIF画像を『あつまれ動物の森』に取り込む方法をご紹介したいと思います。

ちなみに「あつまれ動物の森」は、以下のツィッタアカウントにもみられるように、デジタル人文学(DH)界でも新たなコミュニケーションツールとして活用されるようになっており、先日のバーチャル国際学術大会 でも知る限り少なくとも2本のセッションが「あつまれ動物の森」を用いて開催されたようでした。

twitter.com

さて、話を戻しますと、IIIFのPresentation APIがバージョン3.oになったことにより、IIIFでは動画をうまく扱えるようになります。と言っても、これはビューワが対応しなければ何もできないのと同じことですので、ビューワ側での対応を待たねばなりません。これまで、Universal Viewerが動画の表示もできるということで、動画はそちらの独壇場だった感がありますが、もう一つのメジャーなビューワ、Miradorも、バージョン3のリリースにより、正式に動画を扱えることになりました。これで、最新API+最新ビューワの組み合わせで動画表示ができるようになります。といっても、まだそんなに複雑なことはできないようで、たとえば、以下のように、動画を複数ならべてみたり、さらに別のウインドウには通常の画像表示をしてみたり、といったところです。

https://candra.dhii.jp/nagasaki/mirador3/mirador/video.html

IIIFで動画表示
IIIFで動画

上のリンクにて表示される3つの動画のうちの2つは『あつまれ動物の森』に曼荼羅の画像を取り込んだ状態を紹介しています。そして、残る1つの動画は、 『あつまれ動物の森』にSAT図像DBのIIIF画像を取り込む方法の解説です。このブログ記事の冒頭では「ご紹介したいと思います」と書いてしまっておりますが、 この動画をごらんいただけば大丈夫かと思いますので、ご興味がおありのかたは、ぜひ一度ご覧になってみてください。

さて、残念ながら、動画上に静止画像や別の動画等を載せたりするといった、IIIF Presentation API 3.0が実現しようとしている機能はまだ実装されていないとのことなのですが、 しかし、1つのブラウザウインドウ内で画像も動画も扱えるというのは、使い方によっては割と面白いことになるのではないかとも思います。発想力の高い人のヒントになればと思って、まだ 生煮えですがご紹介しておきます。今のところ、YouTubeに対する優位性は?と聞かれても、まだ具体的な機能としては特に見当たらないと言わざるをえませんが、 IIIF Presentation API 3.0の仕様が約束してくれる内容がある程度実装されれば、ある面ではかなり圧倒的な優位性が出てくると思います。

ちなみに、Mirador3で上記のようなことをするための設定ファイルの書き方は、上記のURLのHTMLソースをごらんいただければOKかと思います。 そんなに難しいことはなく、Mirador2よりもかなり洗練されました。Windowsの中の配列として、動画でも画像でもManifestIdを並べていけば それにあわせてウインドウが表示される、というかなり楽な感じになりました。

Mirador3で動画を表示させるためには、IIIF Presentation API 3.0に準拠したManifestファイルを用意しなければなりません。これは実は、最近IIIF協会が力を入れている 「レシピ」の中にVideo用の簡単なサンプルが掲載されています。 動画配信は、配信サーバは使わずに単にmp4のファイルをサーバに置いているだけですが、最近はWebブラウザが賢くなったせいか、それだけでもそこそこ使えるような感じになって います。

というわけで、基本的には、今後のさらなる実装の発展に期待したいところですが、Mirador v3はプラグイン機能が充実しているそうですので、 どなたか、動画アノテーション用のプラグインなど作ってくださるとよいかと思います。腕に覚えのある方や、旅費が使えなくて予算の使い道に 困っている方々など、ぜひ、Mirador v3のプラグイン作成に取り組んでみていただければと思っております。ちなみに、Mirador v3は、Reactという Facebookがオープンソースで開発公開しているJavascriptライブラリを用いて開発されており、個人的にはReactでないものを常用しているため、 今のところ、自分自身ではMirador v3の開発には手を出せないでおります。どなたか、Reactに通じておられる方がいらっしゃったら、ぜひ…

「デジタル人文学」以前の日本の人文系デジタルテキスト研究を探訪してみる

本日、日本デジタル・ヒューマニティーズ学会(JADH)の年次国際学術大会JADH2020が終了しました。リアル開催の予定だったものがバーチャルに途中で変更になり、日程も少し後ろに動かして、それでもなんとかきちんと開催でき、それほど人数は多くないながらも意義のある議論が展開され、相互に認識を深められるとても良い学会になったと思いました。開催を引き受けてくださった大阪大学言語文化研究科の田畑智司先生、ホドシチェク・ボル先生には感謝すること至極です。また、キーノートスピーチを引き受けてくださった東国大学のKim Youngmin先生、IIT インドールのNirmala Menon先生、それから、休日を返上して参加してくださった発表者・参加者の方々のおかげで会も盛り上がりました。大変ありがたく思っております。JADHは、国際デジタル・ヒューマニティーズ連合(Alliance of Digital Humanities Organizations, ADHO)の構成組織として活動をはじめてからもう8年が経っており、行きがかり上、筆者は現在JADH代表としてこのADHOの運営委員会にも参加しておりますが、今や、韓国やインドのDH学会など、新興グループを受け入れる側になっています。

そんなデジタル人文学(DH)ですが、この「言葉」が使われ始めたのは2004-2005年くらいのことで、それ以前はHumanities Computingなどと呼ばれていたようで、学会名としても欧州では Association for Literary and Linguistic Computing (ALLC)、米国では Association for Computers and Humanities (ACH)と呼ばれていました。Digital Humanitiesの語が使われるようになったのと同時期にこの二つが連携して作られたのがADHOで、それ以来、学術大会としてもデジタル人文学/Digital Humanitiesを正式に用いるようになったようです。

私は基本的にこの業界には新参者というか、あとから一人でひょこひょこ入っていったので、それ以前にこういった流れが日本とどういう関係を持っていたのかよく知らないまま活動して、当時、ジョン・バロウズ先生の薫陶を受け英語コーパス研究の文脈でALLCの運営委員をつとめておられた大阪大学の田畑智司先生と知り合い、その頃からお手伝いをしていたSAT大蔵経テキスト・データベース研究会代表の下田正弘先生も意気投合されて、日本にこの流れをきちんと持ってきて定着させねばということで、当時日本のDH的研究の中心であった情報処理学会人文科学とコンピュータ研究会のみなさまとともに、JADHを立ち上げ、2011年にADHOに正式加盟し、晴れて、国際的なDHの公式な日本の窓口を設定することができたのでした。

同様に、今一番力を入れているText Encoding Initiative (TEI)に関しても、一人でひょこひょこ国際会議に入っていって、鶴見大学の大矢一志先生は比較的よく参加していたのでお知り合いになることができましたが、それ以外の日本人にはあまり会うことがないまま、英語は苦手ながら中心メンバーの方々と一緒にご飯を食べに行ったりあれこれ議論を重ねるなかで徐々に雰囲気に馴染んでいったということがありました。もちろん、中心メンバーの半分くらいはADHOと重なっていたので、JADH/ ADHO関連での会合とあわせて仲良くなったということもありました。そういう流れもあってTEI協会の理事も1期だけですが務めることになり、TEI会議を日本に持ってきたり、それまでには認められていなかった特定言語文化圏のためのSpecial Interest Groupの設立に至ったり、ということにもなりました。

ついでに言えば、日本のこの業界にも一人でひょこひょこ、特に後ろ盾もないままに入っていたので、後から考えると何か空気の読めない困ったヤツだったのかもしれませんが、まあとにかく、科研の若手研究Bがとれたことで少し旅費が自由に使えるようになったので、当時は「日本一周研究会開催」という壮大な(当時きわめて交通の便の悪い地方大学につとめていた自分にとっては非常に大変な)プランを進行中だった情報処理学会人文科学とコンピュータ研究会(SIG-CH)にも継続的に参加しはじめて、とにかく自分がやっていることをこまめに発表してみるというところから始めて、そこから今に至っているのでした。

ということで、時期的に言えば、私は「デジタル人文学」が登場するころにこの分野に力を入れ始めたので、それ以前にこの分野が日本でどういう風に展開されていたのか、とくに、TEIをはじめとするテキストエンコーディングがどういう状況だったのか、ということについては、多少調べてはいたものの、基本的にあまりつながりのない状態でやってきていたようなのでした。日頃色々とお世話になっているCHISEで有名な守岡知彦先生にいただいたコンピュータ雑誌の記事を通じて、かつて長瀬真理先生が源氏物語のTEIエンコーディングに取り組んでいたという話を把握していたり、ポスドク時代にお世話になった豊島正之先生がSGMLのTEIやXMLに批判的な記事を書いておられたことは知っていたのですが、断片的な情報で、それらを集めつつ基本的な情報処理についての知識を総合するだけで、2008年くらいまでは日本語でTEIのエンコーディングをするのは高コスト過ぎて、もしやるならかなり周到かつ大規模な計画が必要だっただろうということは判断できたので、全体の文脈を追いかけるところまではやっていなかったのでした。

ところが最近、岡田一祐氏とやりとりをするなかで、情報知識学会のニューズレター等の刊行物のバックナンバーをざっと読む機会を得まして、そこで長瀬真理先生がニューズレターの編集長をするなどしてかなりいろいろな記事を書いておられ、TEIやテキスト・データベースにどういう風に関わっていたかという情報を得ることができました。情報知識学会の過去の刊行物をデジタル化公開してくださった方々には大感謝です。また、ここで、ある時期の長瀬先生のお仕事もかなり把握することができただけでなく、他にどういう人が関わっていたのか、ということも若干ですが見えてきました。

といっても、得られた情報を狭い知識で切り貼りするしかないので、当時の状況をご存じのかたが色々ご教示くださるとありがたいのですが、どうも、かつて、JALLC日本支部と、JACH(テキスト・データベース研究会)というのがあったようです。欧州のALLC⇒JALLC、で、米国のACH⇒JACH、ということだったようで、内実はともかく、名称はそれぞれ引き継いでいたようです。いずれにしても、テキストデータベースを作ろうという動きがそれなりに活発で、当時私でも聞いたことがあったヘーゲルデータベースやフッサールデータベースなどの哲学系の日本発の著名なテキストデータベースもそういう流れとリンクしていた面があったようです。自分が忘れているだけで、もしかしたら、情報処理学会人文科学とコンピュータ研究会の過去の研究報告や『人文学と情報処理』などにも書いてあったのかもしれませんが(特にイベント情報などがあったかもしれませんが)、ようやくそういった点と点が頭の中でつながってきたということかもしれません。ALLCやACHの仕事をする前にJALLC日本支部やJACHと言われてもそんなに関心を持てなかったかもしれないとも思います。

それはともかく、情報知識学会のニューズレターの1988年設立記念号には、なんと千葉大時代の坂井昭宏先生が、「コンピュータのなかの古典」という記事で、当時のJACH(テキスト・データベース研究会)の活動を紹介しておられます。これを見ると、当時千葉大でヘーゲルデータベースを作っておられた加藤尚武先生を中心として、千葉大の哲学系はテキスト・データベース構築の拠点の一つであったようにも想像されます。当時、哲学研究はテキスト・データベース構築をリードする存在であったこともこの記事からはうかがえます。また、後に人工知能学会会長を務められる堀浩一先生のお名前が見えるのもなかなか貴重です。もちろん、我らが塚本先生もコンピュータ梵語仏典研究ネタで名前を連ねておられます。この記事から想像するに、JACHは海外系、JALLCは日本語系だったのかもしれない…ということも想像されます。とにかく、第一号からいきなり盛りだくさんな感じでびっくりでした。

一連のニューズレターのなかではテキスト・データベースに関する情報とともにTEIの話もちょこちょこでてきます。特にTEIに関することが大きく採り上げられるのは、1991年10月の長瀬真理先生による「TEIの活動と今後の展望」です。この時には、長尾真先生が中心になってTEIの受け皿作りが検討されていたことがあったようで、なんともすごい話だったようです。前出のJACHとSIG-CH等が組んで当時TEIのチェアをしていた Susan Hockey先生を日本に招待されたことも書いてあります。守岡先生にいただいたコンピュータ雑誌の記事もこの時のものだったようで、長尾先生も出てくるような話ですので、かなり多くの人に注目されていたのかもしれません。もちろん、今の技術水準から考えると、当時、SGMLで日本語の人文学テキスト資料をあれこれするのはかなり高コストで、ちょっと難しかっただろうし、あまりうまくいかなくても仕方がないだろうな…と思わざるを得ませんが、当時、いろいろな可能性があったことは想像されます。

TEIに注目してみていくと、1992年4月の記事では、三木邦弘先生による「JACH第14回研究会に参加して」という記事のなかで、土屋俊先生がTEIの現状報告をしておられたこともうかがえます。なお、この記事では、JACH研究会が初めて東大大型計算機センターを離れて仙台で開催され、それにあたって尽力されたのが塚本先生であったことも書いてあり、これもなかなか興味深いところです。

しかしながら、このあたりから、TEIの話はちょっと見えなくなってきます。ベルゲン大学のヴィトゲンシュタインのDBの記事で長瀬先生がTEIの拡張的な利用に言及されますが、その後はちょっとうまく見つけられませんでした。ちなみにベルゲン大学でこのDBを担当していたEspen Oreさんは、その後2010年に日本に来てTEIのレクチャーをしてくださったことがあり、短い時間の中でTEIガイドラインのカスタマイズの仕方までやっておられたので、この記事をみて、ああ、なるほど、Espenさんは筋金入りなんだな…と思ったところでした。

さて、ここら辺である程度検索キーワードが見えてきますので、改めてちょこちょこググってみますと、なんと1994年3月の国立国語研究所によるアンケート調査報告「海外のテキスト・アーカイヴにおける管理・運営上の問題点について」のなかで「TEIを知っているか」「使うつもりはあるか」等の質問項目があります。まあ、94年3月だと、まだSGMLだし、そんなにのめり込んでいるところは多くないですよね…というところでした。さすがに、オックスフォードは前のめりのようでしたが。

その後、90年代後半~2006年くらいまで、TEIに関する日本語の記事は全般的にあまり見つかりません。1999年の人工知能学会誌に土屋俊先生が第一著者として「音声対話コーパスの共有化へ向けて」という論文を載せておられますが、この段階ではSGMLのTEI ガイドラインP3を使用していて、脚注のなかで当時W3Cで策定中のXMLについての記述が見られ、やはりSGMLでかつUnicodeも十分に使えない状況だと大変だっただろうな…という印象が先に立ってしまいます。

一方、この調子で、徐々に過去の様々な資料がWebで簡単に探索できるようになっていけば、もう少しそういったかつての実情も確認しやすくなっていくのではないかとも思っております。もしかしたら、他にも踏み込んで取り組んだ方々が日本におられたかもしれません。とはいえ、個人的な印象としては、この頃、このような草の根的なテキストデータベース的なものが下火になっていったように思っております。取り組む人たちの世代的にもちょっと隙間が空いているような感じがしています。

いずれにしても、TEIガイドラインがXMLの特性を大幅に活かしたバージョンであるP5をリリースし(2007年)、かつ、Unicodeがそこら辺のパソコンでも普通に使えるようになってくれないことには、日本語資料での利用はかなり難しかったのではないかと想像されます。

ところで、この件であれこれググっていたら、1997年の長瀬先生による「人文・芸術系のデータベース -今そしてこれから-:5. 文学データベース -急がれる総合的な環境整備-」という論考を発見しました。ここに今でも通じる大変示唆的な一文を発見したので引用させていただきます。

今後、日本でもハイパーテキストの開発が進むと思われるが、その場合、ぜひとも文学や古典の専門家、それも複数の研究者の協力を得て付加価値の高いハイパーテキストの作成を心がけて欲しい。とくにソフト開発者に希望することは、やはり現場の研究者や利用者の意見の尊重である。技術系主導で作られたデータベースは汎用性を考慮するあまり、小回りがきかず、実際の研究では役に立たないことが多い。また既存の技術から応用発想することが多く、冒険的、実験的、個別的・特殊なテーマへの挑戦を嫌う。予算の問題もあろうが、貴重な題材がただ切り刻まれて、どこにもでもある無難なできで留まってしまうのは非常に残念なことである。また、せっかくよいソフトやデータベースを作っても、開発が終わると、一件落着といわんばかりにテキストに対する興味を失ってしまう開発者が多い。古典作品の研究に終わりはないと同様、データベース開発にも終わりはない。

…(略)…またネットワークにより国際的な協同作業がやりやすくなると同時に、複数の研究者間の意見調整も難しくなる。少しずつ公開されるたびに、参加する研究者の数も増えてくる。こうしてハイパーテキストは新しい解釈を生み出しながらネットワーク上にシェアを広げていく。こうなるとサポートや技術支援は作品の研究と同様に永遠に続くかもしれない。こういった事情を考慮して長期の協力体制を組んでいただきたい。

これは、デジタル人文学のみならず、現在でいうところのデジタルアーカイブの課題そのものでもあり、さらに言えば、ここで要求されているレベルのことが、むしろ文学や古典の専門家の側でできているのかという反省も含めて受け止めていきたい文章です。このような見通しをお持ちだった長瀬先生が2002年に夭折されたことは、返す返すも残念なことでした。

技術は進展しても、それを扱う人間の側はそんなにすぐには変わりませんので、少しずつでも着実に、ということで、これからも進んでいければと思っております。TEIガイドラインへのルビの提案は9月末にようやくできたところですので、それがよい手がかりになればと思っております。

LMSに教材をアップできればJ-Stageでオンライン論文公開はできるはず

このところ、J-Stageにかかりきりです。あまりお金のない学会の論文誌の編集作業を引き受けてしまっていて、それでいながらちょっと面倒なことに手を出してしまったためなのですが、ちょうどいい機会なので、表題の件について書いておきたいと思います。

「LMSに教材をアップできればJ-Stageでオンライン論文公開はできるはず」

です。

このコロナ禍で、オンライン論文のありがたみが身にしみている人が多いと思います。そして、自分の学会の論文も、もうオンライン公開してしまってよいのではないかと 思っている人も極めて多いのではないかと思います。では、どうすればいいのか。お金もかかりそうだし時間もかかりそうだし…。と考え始めたら、まずは J-Stageを検討してみるのが今のところは極めて重要です。J-Stageは、学会活動をきちんと行っているところが申し込み手続きをすれば、 無料で論文公開をさせてくれます。バックナンバーの登載もさせてくれるようですので、何らかの方法でPDF化して書誌情報を用意できれば、あとはなんとかなります…が、 とりあえず、表題の件に戻りまして、

自分で書いた論文をオンライン公開する場合です。もちろん、編集管理の権限は学会単位で付与されますので、普通は編集担当者しか 論文公開はしませんし、ページ番号を連番にしたければ、やはり公開は担当者に任せるのが安全です…が、敢えて、表題の件を考えて みたいと思います。

J-Stageでは、学会に対して付与された雑誌管理者アカウントを用いて、編集搭載者のアカウントを作成することができます。 もしかしたらアカウント数に上限があるかもしれませんが、それはおいおい確認するとして、とりあえず表題のことをする ためには、著者に編集登載用アカウントを発行してしまうという手があります。そして、著者に対して「論文登載してね」 というわけです。ページ番号連番にならないよ!?という話がありますが、これには、情報処理学会研究報告方式(と私が 呼んでいるもの)がありまして、雑誌につけられる巻(Vol.)号(No.)のうち、号(No.)の方を1論文単位で付与して しまうのです。そうすると、一つの巻に載っている論文が8本あったら、Vol.1 No.1~Vol.1 No.8ということになります。 これにより、すべての論文は1ページ目から数えられることになるわけです。紙で出す雑誌だとええっ!?となりそう ですが、電子媒体ならそんなに気にしなくても大丈夫です。あるいは、すでに紙で出したものをPDF化して出すだけ、 ということであれば、そもそもページ番号もすでについているはずですので、むしろ話は簡単になりそうです。

さて、そうすると、たくさんのアカウントができて大変なのでは、とか、いつまでもやらない人が出てくるのでは、 などと運用上の課題が色々気になってきますが、J-Stageの賢いところの一つに、 アカウントの有効期限が設定できるようになっているという点がありまして、しめきりを設定してそれまでに 論文登載しなかったら終了、ということもできるようです。

というわけで、雑誌編集担当者が、巻(Vol.)号(No.)を設定して、各著者のアカウントを設定し、 「みなさんそれぞれ巻号を割り当てますので、そこに自分の論文をアップしてください」とお願いしたとすると… あとは、表題の通り、今年度に入ってみなさん急にガンガン使うようになったLMS、あそこに教材を アップロードする話とほとんど同じです。アップロード用Webサイトにアクセスしてログインして、 あとは、タイトルつけて、著者名つけて、検索しやすいようにする キーワードは面倒ならつけなくてもよくて、概要をつけるのは自分で書いたものなのでそんなに 難しくないですね。参考文献リストも載せろと言われますが、実は載せなくても論文の アップロードはできてしまいます。とはいえ、自分がお世話になった論文の価値を高めることに つながりますので、参考文献リストはできれば載せた方がよいです。で、あとは論文PDF ファイルを選択して、ポチっとすると、まあ大体OKです。公開日設定もする必要がありますが、 それくらいは、雑誌編集担当者に頼んでもそんなに大変な仕事ではないでしょう。

これでできあがりです。同じ雑誌に載せるみんなが載せてくれればまとめて公開できてありがたいですが、 ここでも、巻号を別にしている上に「早期公開」機能もあるので、作業をいつまでもしてくれない 人がいたら、その人は残して先に公開してしまってもよいのです。

もしかしたら、J-Stageとしては、各著者にアカウントを発行するようなやり方は推奨してないかも しれませんが(もしそうだったら申し訳ありません…)、それほど状況は身近なところに来ているし、 わざわざ予算を取りに行く必要もない、むしろ、それにかかる時間と手間があればアップロードは 終わってしまうこともありそうです、 ということで、ちょっとご紹介してみた次第です。

なお、大量のバックナンバーを公開したいとか、大量の論文を事務局で引き受けてアップロードしたい、 あるいは、高度な全文検索もできるようにしたい、などの状況がある場合には、そういうファンドを なんとかして調達した後に、企業にご相談するのが 早道です。現在、學術雑誌を印刷刊行してくれる印刷会社の多くが「 学術情報XML推進協議会 - XSPA 」という ものを結成してJ-Stageに対応したり大量一括処理したりするためのノウハウを蓄積共有している ようですので、ここのリストにあがっている印刷会社に相談すれば、あとは予算確保をするのみ、 という感じになろうかと思います。

しかしながら、それを自分(たち)でやりたい、あるいはやらざるを得ない、という場合には、 またいろいろな道が出てきます。次回(あるいはそのうち)、元気があれば、私がかかりきりになってしまっている、 高度な全文検索ができるようなアップロードの仕方の話も書いてみたいと思います。

Mirador 3が正式リリース:IIIF対応ビューワが新しくなりました

IIIF対応ビューワの代表格の一つ、Miradorの新バージョンが、ついに正式リリースとなりました。バージョン2の反省を踏まえつつ、一方で、バージョン2を通じて一気に広がった開発者コミュニティのパワーを活かして、バージョン2よりも圧倒的に便利そうな雰囲気のものができあがってきました。

f:id:digitalnagasaki:20201113011727p:plain

開発の中心になったのはスタンフォード大学図書館の面々です。開発に着手するときは、インターフェイスの専門家に担当してもらって片っ端からインタビューを行なって可能な限りニーズに対応したものを作るべく徹底的に取り組んだようです。私にまでZoomインタビューをしてきたほどですので、その調査範囲はかなりのものだったのだろうと思います。一方で、バージョン2ではなしえなかった、音声や動画、3Dなどへの対応も、レイヤー構造にすることで拡張可能な形で対応していきたい、と、中心メンバーであるStuart Snydmanさんが強調しておられましたが、これも、正式リリース直前に、音声動画対応機能が正式に組み込まれたようで、おそらくはレイヤー構造的に色々なメディアコーデックを取り込めるようになったのだろうと思います。開発の向けての盛り上がりの様子は、Githubの状況をみていただいても想像できるだろうと思います。

元々、IIIFは、アノテーションの連鎖によってあらゆるコンテンツを表現しようとするセマンティックWebの賜物ですので、アノテーションの連鎖の先にOpenSeadragonなり、音声や動画のコーデックや3Dのレンダリングライブラリ(?)などがあれば、それらもつなぎあわせて連鎖からなる情報空間を創り出していきます。言うは易し、で、実際にそれを実現できるソフトウェアを開発するのはそう簡単ではなく、バージョン3にしてようやく、一つの形になったと言えるのだろうと思います。少し前に、IIIF Presentation API もバージョン3にアップデートされたことで、時間軸でのアノテーションも共通仕様として可能になりましたので、タイミング的にもちょうどよい感じです。

Miradorは元々、複数コンテンツの並列表示やレイヤー表示に特徴を持つビューワでしたが、それが画像以外のマルチメディアコンテンツにも対応できるようになったことで、今後、その連鎖の網の目が一気に広がるのだろうと思います。これをうまく活かせるコンテンツが世界各地から、世界中のIIIFを活用しつつ現れてくるのだろうと思うと、わくわくしてきますね。

残念ながら、筆者はまだ充実したマルチメディアコンテンツのようなものは持ち合わせていないのですが、さっそく、これまでMiradorを組み込んでいたSAT大正蔵図像DBのものを最新版にアップデートしてみました。

youtu.be

ここで驚いたのは、他のシステムに組み込む方法や、複数画面をならべて表示させるためのプログラムの書き方がかなり簡単になっていたことです。これまで以上に広く活用されるであろうことが想像されます。それから、一つ感動したのは、使い方に関するこちらの質問に即応していただけたことです。マニュアルがまだそんなに整備されていないので、一生懸命ソースコードを読もうとしてみるのですが、今回、MiradorはReactをベースとして開発している一方で、筆者は最近、同種のもので周囲の人が比較的よく使っているVue.jsを勉強し始めてしまったために、そもそも何がなんだかよくわからない…(?_?)という状態になってしまっておりました。バージョン2の時は、筆者も常用していたjQueryをベースにしていたので、ソースコードを読めるどころか、修正コードを提供したりもしていたのですが、バージョン3では今のところまったく歯が立たない状況です。そこで、SlackのMiradorチャンネルに「こういう使い方をしてみたいんですが…」と問い合わせてみたところ、即、お返事をいただくどころか、FAQに追記していただきました。「ウインドウを開いた後に、外部のJavascriptから画像にズームインする」という機能だったのですが、書いていただいた事例でまさにぴったりできました。それを組み込んだことで、上記の動画のように、複数ウインドウを開いた後にそれぞれのウインドウで該当箇所にズームイン、というところまでできました。ご教示してくださったJack Reedさんには深く感謝いたしております。

ご覧いただけばわかると思いますが、Mirador3は、「ここがすごい」というところは今のところそんなにないのですが、インターフェイスが洗練されていて、プラグインを組み込む場合でもバージョン2よりもかなり統一感のある形で組み込めそうな感じです。組み込み方や各種設定方法など、こちらの頁で徐々に紹介されていくと思いますので、ぜひ注目して置いていただければと思います。自分で作れなくても「こういうのをいつか誰かに作って欲しい」ということでURLと使い方をメモしておけば、それがやがて、デジタルアーカイブのインターフェイスをリッチにして使いやすいものにしていくことに何らかの形でつながることになると思いますので、ぜひ色々試したりメモしたりしてみてください。

デジタルアーカイブ学会賞授賞を機に『日本の文化をデジタル世界に伝える』を改めてご紹介

昨秋、『日本の文化をデジタル世界に伝える』という著書を刊行した。このブログでは刊行の経緯について触れたことがあり、また、大学院生の方々による紹介記事を掲載したことがあったが、内容について、自分ではあまり触れなかった。この本が、ありがたくもデジタルアーカイブ学会の賞をいただくことになり、最近、そのための挨拶文を書くという機会があり、また、少し前に、ありがたいレビューをいただいたこともあり、改めてこの本が伝えようとしていることについてちょっと記しておきたい。

本書は、端的に言えば、文化資料デジタルアーカイブの構築・運用を扱うものである。そして、技術的な事柄を基礎として、そこから立ち上げってくる種々の課題に ついて解説したものである。近年デジタルアーカイブにおいて中核的なものとなってきているWeb技術は日進月歩だが、同時に、常にその技術的制約によって 提供者・利用者ができることが変わり続けている。理論的には何でもできるはずだが、コモディティ化した技術でなければ実質的には使えないのと 同じであり、そのレベルでもたらされる制約を把握しておくことによってはじめて、大きな飛躍の可能性を想定し、準備することができる。 それでは、技術のコモディティ化はどのようにしてもたらされるのか。そして、それとどう付き合えばいいのか。本書が狙いとしたのは その点を明らかにすることで技術的制約にどのようにして取り組んでいけばよいのかを示そうとしたのであり、さらに、それによって、 デジタルアーカイブの技術的な持続可能性のみならず社会の中での持続可能性を高めていくことができると提示しようとしたのであった。

特に強調したかった点の一つを挙げるなら、コモディティ化のプロセスにおける技術・規格の標準化と普及は、デジタルアーカイブを構築・利用する我々であっても 関与できる事柄であり、むしろ必要に応じてそこに関与することによって自らの取り組みを広く世界に浸透させ、その意義をより深めることが できるという(実は当たり前の)事柄である。実際にそれをするかどうかはともかく、日本に保存されてきた文化資料のデジタルアーカイブに取り組む人々がそのことも視野に入れながらデジタル世界に伝えるべきことを 考えていくなら、そのような主体的な態度で臨むことによって、デジタルアーカイブの持続可能性の要である標準技術への 準拠という、外野からは簡単そうに見えながら現場ではしばしば困難な課題に建設的に取り組んでいけるようになるのではないか、 そしてさらに、目の前のデジタルアーカイブに取り組むという孤独な営みが世界のともがらと様々な形でつながっていることを実感する契機になる のではないか、そのような願いを込めたつもりである。日本の写本のデジタルアーカイブで取り組んでいる課題は多くの場合西洋中世写本にも同様の課題があり、 日本の木版本の課題はインキュナブラに似た課題を見いだせることもある。異なる点も様々にあるが、似たところを見つけることで 自分(達)が孤独ではないという気持ちを持てることはプラスに働くこともあるだろうし、 それによって発想が広がることもあるだろう。そして、そもそも混淆的な文化である日本の文化資料に 取り組むことは、そのまま世界とつながることでもある。そのことは、文化資料の次元でもデジタルの次元でも 様々にあり得るのである。

そのようなことで、本書は、個別の技術をかなり多く採り上げているものの、話としては比較的長く通用するような内容としたつもりである。 目前の大切な資料を相手に、デジタルアーカイブをどのように作っていけばいいか、そしてそれをどう維持していけばいいか、と考えている方々のお役に立つことがあれば幸いである。 また、そのような営みである文化資料デジタルアーカイブというものを、デジタル情報知識基盤に関わろうとする様々な立場の方にも理解していただくことができれば、なお幸いである。

日本学術会議の提言を読んでみる:学術情報流通の現在と未来【総集編】

ここのところ、9回にわたり、日本学術会議の提言「学術情報流通の現在と未来」を読んできました。 このところ、日本学術会議が話題になることが多く、そもそも研究者の間であまり知られていなかったということも広く認識されました。 そこで、日本学術会議がもっと知られるべきだ、という話もあちこちで聞くようになったのですが、 「日本学術会議とは何か」という話が多いような気がしまして、しかし、そういう話だけではなくて、 では実際にどういう提言を行なっているか、ということについて広く知ってもらうことも、 認知や理解を広める上では重要なのではないかと思うところです。

このシリーズの第一回冒頭に書いているように、このブログ記事シリーズはそこまで大きなことを考えていた わけではなかったのですが、「提言」のなかには、少なくとも関連分野の人は皆知っていた方がいい ようなものも結構あります。いわば、研究者コミュニティというギルドから社会に発信している情報ということに なりますので、そういう意味でも知っておくべきところかとも思います。 そのようなことで、「提言」の内容について議論するような場がもう少しあちこちにできて くれるとありがたいと思います。そうなれば、研究者コミュニティが社会との接点を意識する 機会も増えていって…それがよいことなのかどうか自信がありませんが、少なくとも社会のなかでの 居場所をもう少し明確にしていくきっかけになるのではなかろうか、とは思います。また、 民主的に選ばれてない人達が勝手に一方的な提言を作っている、というような批判は研究者サイドからも 散見されますが、そういう状況を改善する意味でも、各自が関連のある「提言」について 広く議論できるような場が形成されていくとよいのではないかと思うところです。

というわけで、雑駁な話ばかりで恐縮ですが、9回に分けて「提言」を読んでみたブログ記事を以下にリストしておきます。

digitalnagasaki.hatenablog.com

digitalnagasaki.hatenablog.com

digitalnagasaki.hatenablog.com

digitalnagasaki.hatenablog.com

digitalnagasaki.hatenablog.com

digitalnagasaki.hatenablog.com

digitalnagasaki.hatenablog.com

digitalnagasaki.hatenablog.com

digitalnagasaki.hatenablog.com

日本学術会議の提言を読んでみる:学術情報流通の現在と未来 9/n

少し間があいてしまいましたが、いよいよ、第三章「提言」に入ります。

http://www.scj.go.jp/ja/info/kohyo/pdf/kohyo-24-t297-6.pdf#page=24

ここは、今まで読んできたことのまとめのようなもののようですので、筆者の関心から 斜め読みしつつ気がついた点をメモしていきたいと思います。

まず、喫緊の課題として

学術情報環境のスクラップアンドビルドによる再構築、機能再生と国際競争力強化

が挙げられます。これをどのように実現すべきかということについては

現在分散して交付されている政府補助金を再構成するとともに適正な受益者負担により、新たな経費の発生を最小限に抑えた新しいシステムの構築を目指すべき

とのことです。やはり「政府補助金の再構成」がこの件の肝ですね。本来研究に回すべき費用のいくぶんかが電子ジャーナル会社に不必要に多く回ってしまう、という 状況のようですので、これをなんとかすることは普通に考えるととても重要なことのように思えます。

とはいえ、研究者個人のレベルでメリットを感じにくいようだと、話を進めるのはなかなか難しいようにも思われます。 今は競争的態度を奨励する向きも強いので、全体が減っても自分の研究費さえ多く確保できれば実際の問題は あまり生じなさそうです。それほど長くない研究に費やせる人生の時間を少しでも大事にしようと思った時に 全体のために面倒なことを少々でも引き受けるのか、それともひたすら自分の研究環境の向上のみに邁進するのか、 と考えると、後者を選ぶ人を責める気にはなれません。ですので、負担を引き受けてもらうにしても、 最小限に、そして、できれば、何か目に見えるようなメリットを提供するということは重要かと思います。

人文系の場合には、これもやはり分野によって様々だとは思いますが、J-Stageに個々の研究者が論文を掲載できる 仕組み(Webで成績入力できるくらいの情報リテラシーがあれば対応できる)は用意されているので、少し手間を かける気になれば、オープンアクセスの電子ジャーナルは割と簡単に実現できるのですが、しかし、やはり その少しの手間をかける(=そのために本来の研究にかける時間をこれまで以上にもう少しだけ減らす) 気になれる人がどれくらいいるかという問題は残ります。

さて、続けますと、次は

(1)学術誌購読費用と APC の急増に対応する国家的な一括契約運営組織の創設

です。電子ジャーナルの購入・管理のための法人を立ち上げて、 最初は研究機能が強力な大学や研究機関による一括購読契約を行い、 雑誌を幅広く読めるようにしつつ経費を節減しようということです。 さらに、いずれはAPCの費用も集約するとのことです。これはかなり 多額のお金が動くことになるようですが、それに見合う力を持った 人を少なくとも数人は貼り付けないといけないように思えます。 その当たりで、これは果たして大丈夫なのだろうか、と、やや 不安です。組織がやることは基本的には契約の管理のようですので、 ここでの仕事が研究成果のような形になるのはちょっと難しそうです。 そのあたりを踏まえた上での人材確保がうまくできるとよいのですが…。 人文系で強い研究機関と言えば人間文化研究機構に属する各機関が思い浮かび ますが、そういったところが主に購読しているのは、いわゆる大手の海外電子 ジャーナル会社ではないところにようにも思われます。そうすると、 人文系がここに参加するメリットがどれくらいあるのか、ということも もしかしたら検討の俎上にのせねばならないのかもしれません。

さて、次に、

(2)トップジャーナル刊行を核とする学術情報発信の機能強化と国際競争力向上

ですが、この節はさらに細分化されます。

① 理学工学系の国際的トップジャーナルの刊行

こちらに関しては、できるとよいだろうとは思うのですが、とにかく、 多く引用されるような論文を書いてくれる著者が投稿してくれるという 状況を作る必要があり、これはなかなか難しそうではあります。むしろ、 日本文化に関する人文系の国際的ジャーナルを出すことができれば、それは 日本が出すものがトップジャーナルになれる可能性は高いようにも 思います。実績の数字が必要なのであれば、むしろそちらも並行して 進めるとよいかもしれないとも思います。

② 電子ジャーナルの編集・出版サービスのための法人組織

ジャーナル出版サービスを提供する法人を立ち上げるべし、とのことです。 これもやはり人材確保の問題がちょっと難しいようにも思われます。 また、国際水準のジャーナル出版は、繰り返しになりますが、 引用数の多い論文を書いてくれる研究者に、虎の子の論文を投稿して もらえるかどうかということに尽きますので、そういう意味での 営業力も重要かと思われます。国際的にみて強力な編集委員会を用意できるような 人脈を持つ人にこの仕事を本気でやってもらえるようにする必要がありそう ですが、そうするとどういう人材をどういう風に配置するとうまくいきそう でしょうかね。実はすでに当たりを付けてある分野があって、お金さえつけば 人材も編集委員会もなんとかなる、ということでしたらいいですね。 実際のところ、どうなんでしょうね。

③ ピアレビューを経ない出版への対応

この件については、特に新しい指針はなさそうですが、一方、 ハゲタカジャーナルに関しては対応を強化すべきとのことです。 研究不正では世界でもトップクラスの我が国としては、 そのあたりのことは組織的にきちんと取り組んでいく必要があるのでしょう。

④ 和文誌の被引用インデックスの充実

これはまったく賛成です。ぜひ頑張っていただきたいところですが、 「学術情報流通統計センター(仮称)」の設立が提唱されてまして、 しかしこの件はわざわざ組織を設立するほどのボリューム感のある 仕事にできるのかどうか、ちょっと気になります。受益者負担も 謳われていますが、受益者というのが引用データを作ってもらう(?)側なのか 使う側なのかよくわかりませんが、引用データを作ってもらうのに 多額の費用が必要で、しかしそれを頼まないと研究評価指標に のせてもらえない、というような事態にならないようにして いただけるとありがたいと思ってしまうところです。その当たり、 ちょっと心配性になっております。

⑤ AI 技術を利用した編集・出版支援システムの実現

AI技術の活用は、今はできる人は引っ張りだこで、できる人を引っ張るには 面白くてお金になる仕事にすることが重要かと思うのですが、しかし、 上述のように、論文を刊行するのにあまり多額の費用がかかってしまう ようだと困りますので、どのようにしてそれほど費用をかけずに可能か、ということは色々検討してみて いただけるとありがたいところです。

そして、オープンデータ/オープンサイエンスの話に移ります。

(3)理学工学系におけるオープンデータ/オープンサイエンスの進展

研究データ公開は外国出版社に頼らずに自国ですべし、とのことです。 「このために高い問題処理能力を持った人材の育成と活躍の 場が必要になるため、必要な人材育成のためのプログラムを早急に検討するべきである。」 とのことですが、特に工学系だと特許とか営業秘密などもあるでしょうから、 そのようななかで、オープンデータ・オープンサイエンスをどのように 位置づけているか、というのは個人的にはまだよくわかっていません。 その当たりのことも含めて対応できる高度な人材育成をしよう、ということなの だろうとは思いますが、これもなかなかハードルが高そうです。

人文系の場合、オープンデータの流れに乗って、紙媒体資料をデジタル撮影した ものをオープンデータとして公開する例が増えてきていますが、売れば お金になりそうなものはオープン化しないことも多く、まだまだ、まだらな 感じです。研究データにあたるもの、つまり、資料を基に研究者が作成した 様々な種類のデータに関しては、どこかが集約して管理してくれると ありがたいところです。また、ソフトウェアに関しては、欧米発の人文学向けソフトウェアは 助成金団体の縛りもあって、オープンソースで開発・公開されるものが 非常に多くなっています。

そしていよいよ最後になりますが、

(4)学協会の機能強化

こちらもさらに二つの項目にわかれます。

① 学協会が発行する学術誌の編集・出版を集約した学術出版の高度化

学術出版に関して、学協会が共同することでスケールメリットを 出せるようにしつつ、共同で高度化していこう、ということのようです。 システムの共同開発・運用も謳われていますが、できれば、一からの 開発よりも既存のものをうまく活用するような形にしていただければと 思っております。というのは、自前で独自開発すると、特にユーザ側からの 書き込みが入るようなシステムはメンテナンスもセキュリティ対応も大変で、 結局、依拠しているミドルウェアやフレームワークのメジャーバージョンアップの 時に動かなくなって、しかし、動くように改良するには費用がかかりすぎるので… ということがいかにも発生しそうですので、たとえばOpen Journal Systemを 利用するとか、何かそういう感じにしていただけるとよいのではないかと思うところです。 また、かつて学術雑誌刊行として手当てされていた科研費の研究成果公開促進費は、 今はまさにそういう動きをサポートするような条件になっているので、その流れを 維持していけばよい、ということでしょうか。ただ、あの件は、すでに 協働することが決まっているところに助成をするということであり、 そこに至るまでの諸々の交渉などについてサポートしてくれるわけではないので、 それはやはり大変なところです。

② 連携・連合・統合を推進するための仕組み作り

最後に、少子高齢化を見据えて学協会の協働・統合を推進する仕組み作りが 提要され、日本学術会議としてもこれに注力すべきであるとしています。 それもまったくごもっともな話です。学会事務機能の維持が困難になる 学会が今後増えていくでしょうから、それはなんとかしなければならない 状況かと思います。

それから、「学術法人」を実現すべしという話も出てきます。公益法人のような 税制優遇措置が可能な制度を作るということでしょうか。夢があってよさそうな 話ですが、ハゲタカジャーナルならぬハゲタカ学会の乱立させる誘引にも なりかねなさそうなので、認可に結構手間がかかるような制度になりそうな 気もします。そのあたりは法律に詳しい方々のお仕事になるでしょうから、 よい案配の落としどころをみつけていただきたいところです。

ということで、日本学術会議の提言「学術情報流通の現在と未来」を読んでみる 企画はこれで終了です。ずいぶん長くなりましたが、 なかなか読み応えのある「提言」でした。機会があれば、また別の提言も 検討してみたいと思います。