3Dミーティングツール? Hubs Cloud がすごすぎて呆然

最近、バーチャルオンライン会議について色んな人と話をするのですが、リアルでもバーチャルでも比較的よく会う米国人の友人が、昨日、もうバーチャル会議飽きたからこういうのどうだ、と言ってきたのが Hubs Cloud でした。

hubs.mozilla.com

ググったらこんな風に紹介されたりもしていたのですが、

www.moguravr.com

いや、あの、もじらさん、金なくてライバルのはずのぐーぐるさんに出資してもらってなかったっけ、何やってんの…と思ったのですが、 何かもしかしたら結構すごいものになっているのかもしれないとも思い、どうも自分のところでサーバ(というか バーチャルルーム?)を立てられるようだったので、たまには人柱になってみるかと思ってちょっと試してみたのでした。

まずはインストール!と思って色々みてみましたが、設定箇所が多そうである一方、AWSで割と簡単に設定できるようだったので AWSにてインストールしてみました。ついでにドメインもとった方が設定しやすそうだったのでドメインもAWSで 取得して…最近はすごく簡単に複雑な設定ができるようになったんだなと思いながら…、とにかく、英語ですが、 マニュアル通りに手順を踏んでいけば、AWSなら確実に誰でもインストール&設定できる程度の親切さになっていました。

インストール後は、アバターとかシーンなどの後付けデータを追加して…Google Chromeでアクセスしてみました。最初はちょっと わかりにくかったのですが(これは多分私がもうこういう新しいインターフェイスに習熟しにくくなってしまって いるためだと思います)、何かこう、えらく色んなことができるようだということがわかってきて驚愕してきました。 いや、VRやってる人にとっては技術的には当たり前だと思うのですが、しかし、これがどうやらオープンソースソフトウェアで できるようになっていて、誰でも割と簡単に自分のサイトにセットアップできるようであるということに圧倒されてきたのです。

とりあえず何にそんなに驚いているかというと、

f:id:digitalnagasaki:20200507014323p:plain
Hubs Could

最近、動画をあれこれいじるようになってきたので、どういう動画がとれるのかなと思って少し試してみたのですが、まずは上の動画をみてください。 室内にカメラを登場させて、室内のアバターの動きを撮影することができるのです。上の動画は、すでに撮影した動画をカメラの横に置いて、さらに もう一つ動画を撮ろうとしているところです。

では、このカメラで今度は何をとってみたのかと言えば、以下の動画です。

youtu.be

アバターと一緒に、おっさんが映っている画像がありますが、これ、PCのカメラ映像を室内に表示させて、さらにそれを室内のカメラから動画撮影できるんですね。 アバターもおっさんも動いてますが、つまり、そういうことです。これができると、色んな事が一気にやりやすくなりそうです。(操作も少しだけ複雑でちょっとだけハードルがあがってしまいますが)

もちろん、手持ちの画像を室内にアップロードすることもできます。たとえば、以下のような感じですね。

f:id:digitalnagasaki:20200507020732p:plain
hubs could 自分の写真アップ

アバターとして色んな人が参加して、それぞれに色々コンテンツをアップして見せ合ったり、チャットしたり対話したりできるような感じですし、 バーチャルミュージアム的なものも作れそうですね。 最近、任天堂スイッチの『あつまれ 動物の森』で美術館等のデジタルアーカイブコンテンツをIIIF経由で取り込めます、ということが話題になってましたが、 これなら、任天堂スイッチを買いそびれた人でも楽しめそうですね(『あつまれ 動物の森』とは意義は全然異なるわけですが、まあそこは置いておきまして)。

automaton-media.com

今回は一人でインストールしただけなので、この後、他の人が参加するとどういう風になるのか色々試してみたいところですので、今度の週末にでも、 どなたかご協力をいたけますと大変ありがたく存じます。スケーラビリティ的なことも確認してみたいなと思っておりますので。

いや、しかし、しばらくフォローしてない間に、ほんとに変わっていくんですね。着々と開発を続けられた開発者&関係者のみなさまに深く感謝しつつ、 どういう風に(学会に)使えるか、色々検討してみたいと思います。もちろん、授業とか簡単な研究会、オンライン飲み会なんかにも幅広く使えそうですね。

Zoomで参加者リストやチャットも録画する

Zoomにはレコーディング機能がついていて、保存したらすぐにmp4で保存してくれるということで、この利便性は筆舌に尽くしがたいものがあります。一度レコーディングしながらオンライン授業を実施すれば、あとはそれをどこかに載せておいて受講生から見られるようにしておくだけでオンデマンド配信の教材になります。…というのはちょっと安直すぎることもあるかもしれませんが、色々な操作をZoomの「画面共有」でやってみせて、それをあとから見られるようにしておけるというのは、オンライン会議システムとしての特徴がクローズアップされるZoomの、少し隠れた名機能ではないかと思っております。実際、かなり活用しています。

ただ、一つ難しいことがありまして、それは「Zoomの使い方をZoomで記録する」ことです。というのは、これまで試してみた限りでは、Zoomのレコーディング機能では「チャット」や「参加者リスト」も一緒に映し込んだ状態での録画ができないようなのです。そうしますと、「このタイミングで参加者リストにカーソルをあわせてこのようにミュートを解除してみましょう」というような操作の説明をZoomでは録画できない、ということになります。

しかし、なんとかして、録画したいというニーズはあるでしょう。筆者は今回、とある学会のオンライン開催のためにデモ動画を作ろうとして、この問題に突き当たったのでした。

そもそもZoomも画面も同様にデジタルなのですから、なんとかして録画できるはずです。実は筆者は、以前に東京大学人文情報学部門の大向一輝先生とともにZoomの使い方動画を撮ったときに すでにその問題を一度クリアしていたのですが、そのときはビデオミキサーを通すという大技を使いましたので、Zoomでの録画のような手軽さとはかけ離れたものであり、出先でちょっと 録画する、というようなことには使えなさそうな方法です。一応、後ほどそれについてももう少し説明しますが、やはりパソコンだけで完結する、なるべく簡単な方法を目指したいところです。

Windows10の現行版限定の方法なのですが(MacOSだともっと簡便な方法があるかもしれません)、まず、Zoomのウインドウを選択して前面に出しておいてから、Windowsキーを押しながら「G」を押すと、ゲームバーが開きます。ここで任意のウインドウの録画機能というのがありますので、録画ボタンを押すと録画が始まります。ただ、ここでマイクボタンにも注目しておいていただきたいのですが、この状態だとこのままですと自分の声が入らないので、

f:id:digitalnagasaki:20200502025822p:plain

以下のように、マイクボタンをクリックして、マイクをONにしてください。そうすると自分の声も録音されるようになります。(ただし、結構ノイズが多くて難儀しました。マイク等に工夫の余地があるかもしれません。)

f:id:digitalnagasaki:20200502025723p:plain

ここで自分のマイクの音のノイズに困ってくると、Zoomのノイズキャンセル機能の良さ(まあまあ良い)を実感することになるかもしれません。

が、それはともかく、ここで録画した動画は「ビデオ⇒キャプチャ」のフォルダにデフォルトでは保存されるようですので、そちらを開いていただけば、 録画されたものが見えるはずです。

もし、自分のマイクの音のノイズの解決がどうしても難しいという場合、もう一台のWindows10マシンをZoomミーティングに参加させて、そこで録画するという 方法もあります。ただ、参加者リストやチャットを操作しながらその画面を保存しつつ自分の声も…という場合には、パソコンを2台ならべて操作して、 操作と録画は片方で行いつつ、声だけはもう1台のZoomミーティング参加させたマシン経由で出す、という方法もあるかもしれません。あるいは、 顔も出したければ…といった案配で、2台目をうまくつかうと色々なことができるようになります。

苦労の成果…は非公開動画ですので、キャプチャ画面を出すのもちょっと、というところです。残念ながら。いずれ公開できるようになることがあればと思っております。

一方、ビデオミキサーを使った撮影の方は、Roland Pro A/V - VR-1HD | AV ストリーミング・ミキサー というのを用いました。ノートPCのHDMI出力から このビデオミキサーに画面を出力した上で、ビデオミキサーからさらに他のPCにUSB接続で映像を戻して、そちらのPCで録画する、ということになります。 ビデオミキサーは複数台のHDMI出力の機械を接続して切り替えたりpicture in pictureで表示することもできますので、夢は色々と広がります。 この場合、音声に関しては、また別のラインからとった方がいいかもしれません。このやり方の方は、まさにZoomでのオンライン講義のやり方、という ことで録画したものが公開されています。すでにご覧になった方もおられるかもしれませんが、 そういう機材を用いるとどのように撮影できるのか、という観点で見ていただくとよいかもしれません。

www.youtube.com

UTDHアンカンファレンスへのお誘い

学会・研究会の類がどんどん中止になっていき、一方で、オンラインでの開催も徐々に広がりつつあります。 そのようななかで、東京大学大学院人文社会系研究科人文情報学部門の大向一輝先生を中心に、 UTDHアンカンファレンス、というイベントが、今度の日曜日の午後(2020年4月26日(日)13:30より)にZoomにて開催 されることになりました。主なテーマは、人文情報学(デジタル・ヒューマニティーズ)、デジタルアーカイブ、といった感じに なります。

scrapbox.io

ご参加にあたっては、上記のサイトから参加申し込みをする必要があります。

今のところ、以下のようなセッションが予定されているようですが、その後もう少し入れ替えや増減があるかもしれません。

  • 財務記録史料の構造化記述に向けて
  • 文化庁メディア芸術データベース・ベータ版のデザイン
  • 大蔵経データベースの近未来
  • 自然科学記録のデジタルアーカイブ
  • 歴博・総合資料学から公開の新アーカイブ
  • IIIFによる3Dアノテーション
  • ビデオゲームのオンライン目録の開発

ご興味がおありの方は、ぜひお気軽にご参加ください。

オンライン授業をやってみた方々による実感のこもったツィートの数々

…を集めてみました。私自身は、運がいいのか悪いのか、まだ、今期のオンライン授業は一度もしておりません。 開始が後ろに順延しているところです。ですが、実際に今時の環境でやってみるとどうなのか、徐々に ツィッターにて体験者のみなさまのコメントが流れてきております。大変参考に なるものが多く、広く共有するとよいのではないかと思いまして、ブログ記事にしてみた次第です。 以下、一緒にみてみましょう。

ガイダンスでのご体験が連続ツィートされてました。

160人強の授業でのご体験も連続ツィートされてます。

トラブル対応の大変さについても少しコメントしておられました。

やはりフォローは大変なようです。

動画、課題提示&事後質問、というスタイルでしょうか?

manabaで配布した音声入りPPTと教科書によるレポート提出というスタイルで、140人が 受講&提出したようです。2スレッドありましたのでどちらも掲載させていただきます。

こちらもmanabaを利用されたようですが、少しほっとしますね。

manabaに関しては、立命館が人柱になってくださった形になってますので、みんなで感謝しましょう。

東大のUTASも大変だったみたいで、別のシステムを使った先生もおられたようです。

ライブ授業だとちょっと厳しいかも、という話も。

開始時にオープニングミュージックをつけてみたそうです。

文献購読の授業は割とうまくいったそうです。

うまいくった感じの例をもう少し…

レポートはちゃんと集まってくるようですが…

スマホ視聴が多かったようです。

他者視線恐怖という学生もいるようです。

操作が難しいということもあるようです。

長くなるとなかなか大変のようです。

目に付いたものだけをまとめましたので、まだまだ色々他にもあると思いますが、 とりあえず、やってみた方々のご感想、ということで集めてみました。 なかなかリアルで個人的には面白くかつ有益です。ツィートしてくださった 先生方に感謝です。

実際の所、学生のIT環境が不十分なのでオンライン授業は取りやめるというところも 出てきているようで、教務的に対応可能ならそれも有力な選択肢だろうと思います。 いずれにしても、非常に難しい舵取りを求められているようですね。

なお、ライブ授業についてZoomを使ったツィートがちょっと多いのは、おそらく、TeamsやWebex等を 使う場合は組織としてかなり準備してから臨もうとしているところが 多くてまだあまり開始されていないのかもしれないと想像しております。 一応、TeamsとWebexで少しツィート検索もしてみましたが、実際に授業をした というツィートがまだあまり見つかりませんでした…。 ですが、この1、2週間で、かなり使うところが増えてくるのではないかと思いますので、 皆様、ぜひご体験ツィートをよろしくお願いいたします。

デジタルアーカイブやデジタル文化資源をテーマに含むオンライン授業のための資料をご提供

背景事情のご説明

(この点に興味がない人は、下の方の「今回ご提供するもの」まで飛んでいただいてもかまいません)

オンライン授業をしなければということで、大学では教員も学生もみなさま大変な状況になっておられると思います。

なかでも問題の一つは、図書館を使えないことで、ネットで読めない資料を閲覧する手段がほとんどありません。

ちょうど、Maruzen eBook Libraryより、

「人社系主要6出版社の協力によりMaruzen eBook Libraryで購入されたタイトルについて同時アクセス数を大幅拡大いたします!」 https://kw.maruzen.co.jp/ln/ebl/ebl_doc/mel_notice_jinsha6access_expantion.pdf

というニュースが入ってきたところで、該当する本については同時アクセス数が50になるのだそうで、 ここで提供されている本については多少状況がマシになるだろうということで、大変ありがたいことです。 (私自身は非常勤講師ですので、図書館に入れないと見ることはできないようなのですが。) 他にも、色々な対応が各社で行われつつあるようです。

とはいえ、未対応の本・未対応の利用者がどうなるのか、というのは非常に気になるところです。 特に人文学で重要な学術書の中には、デジタル化されていないものもまだ相当数あるようで、 図書館が使えないのにそういう本を前提とした授業を展開するとなるとなかなか難しいものが あります。また、デジタルで入手できるものであっても、いちいち購入しなければ 読むことが難しいという状況はなかなか厳しいものがあります。

一方、授業で使うような本の著作権を持っているのは大学教員である場合も少なくなく、 こういう状況であれば、大学教員が著作権者として出版社と交渉して、 オンライン授業で使いやすい形で提供することもできるのではないかとも 思っているところです。

折しも、新著作権法第35条の早期施行、本年度は補償金もなし、という 話になっているところであり、オンデマンド配信も含むオンライン授業 において著作物の一定範囲の自由利用が可能になるようです。

https://sartras.or.jp/archives/20200406/

これについての詳しい解説は以下のサイトなどをご覧いただくと よいかと思います。

hon.jp

とはいえ、「著作権者等の利益を不当に害することのないよう」ということは 強く言われているようで、教科書丸ごとネットで共有して学生は購入しないで 済ませてしまう、というようなことはNGのようです。

おそらくは音楽や映像作品などを授業内で利用する場合にこの制度は 非常に活きてくるのではないかと思うのですが、本を部分的に利用するような場合にも、 この仕組みは便利なのではないか、ということが想定されます。

さて、本を部分的に利用するなら、電子書籍からのページ抽出はやりやすいものとやりにくい ものがあり、場合によっては画像としてキャプチャしてみたりすることもあるでしょうか。あるいは紙の本であれば 必要部分だけをスキャンしてPDFにして学生達に送信したり、ということになるでしょうか。 それもなかなか大変です。もし誰かがやってくれるならその方がありがたいし、 必要部分だけ入手できるならその方がありがたいと自分でも思うところです。

今回ご提供するもの

そこで、このたび、出版社である樹村房さんとご相談して、以下のようなものをご用意しました。 「教育機関での授業における利用に限り、下記の本の章のPDFファイルを半分までご提供する」というサービスです。 (これは暫定的なもので、ずっと続けるというものではありませんのでご注意ください。)

対象となるのは、『日本の文化をデジタル世界に伝える』という本です。 啓蒙書的な趣の強い本ですので、 デジタルアーカイブや文化資料のデジタル化をテーマとして授業内で扱う場合には副読資料等として使いやすい のではないかと思います。特に、IIIFについて説明をしなければならないような今時の図書館情報関係の授業等では、 とりあえず第五章を渡しておけばかなり楽ができるのではないかと思います。また、第七章の「評価の問題」は 色々な観点から議論できる内容かと思いますので、学生同士の議論の材料としてご利用いただくと面白いかもしれません。 そのようなことで、もしご利用してみようかと思われる場合には、ぜひ下記のGoogle Formから お申し込みください。ちなみに、本書の章立ては以下のようになっております。

  • 第1章 「デジタル世界に伝える」とは

文化資料デジタル化全般の概要(序文も含む)

  • 第2章 デジタル世界への入り口

文化資料をデジタル化するということについて

  • 第3章 利便性を高めるには?

デジタル化資料・デジタルアーカイブの利便性の向上とはどういうことか

  • 第4章 デジタル世界に移行した後,なるべく長持ちさせるには

持続可能性と長期保存の手法についての検討

  • 第5章 可用性を高めるための国際的な決まり事:IIIFとTEI

国際的なデファクト標準とそれへの関わり方。特に、IIIFの解説が詳しい。

  • 第6章 実際の公開にあたって

公開のための具体的な留意事項

  • 第7章 評価の問題

デジタルアーカイブに対する評価について

  • 第8章 研究者の取り組みへの評価の問題

研究者として取り組んだ場合の留意事項

  • おわりに/さらに深めたい人・アップデートしたい人に

全体のまとめとさらなる情報源

申し込み用Google Form

docs.google.com

本書の内容

本書の内容につきましては、読んでくださった大学院生の方々が紹介記事を書いてくださったことがありますので、そのうち2つを以下に掲載させていただきます。


===本書のご紹介1

小川 潤(東京大学大学院人文社会系研究科博士課程(当時))

本書は、技術者・研究者を問わず文化に携わり、いずれかの分野に精通する人間が、文化をデジタル世界に伝える、より具体的に言えば、史資料を中心とする文化資源をデジタル媒体として保存していくという活動に、いかに関わることができ、そのためには何を知っている必要があるかを示してくれるガイドラインである。ガイドラインと言っても、その記述は十分に精緻なものであり、長年に亘って種々のプロジェクトに関わってきた著者の知見に基づいて、デジタルの概念、デジタル資源構築の基本的な考え方から技術的な側面までが論じられている。 本書の全体的な構成としては、大きく3つの部分からなっていると考えることができる。すなわち、設計・管理を含むデジタル資源のインフラ面について、コンテンツとなるデータの設計と作成・編集について、そして、デジタル資源およびそれに関わる人材の評価についてである。

前半にあたる1~4章はデジタル資源のインフラ面を主に扱い、利便性とコストのバランス、使用する技術の採用基準や維持管理のための体制整備などについて、様々な事例や著者自身の経験も交えながら説明している。1~2章は導入ともなっており、デジタルの定義から、デジタル化する情報の粒度の問題、コスト、さらにはプロジェクトの時間的枠組みについてなど、デジタル資源構築の全体的な流れと戦略についての記述となっている。3章はデジタル資源の利便性を問題とし、ユーザーによる検索・閲覧、さらにはデータ利用といった面からのニーズと利便性の在り方について論じている。そして4章は持続性の問題について、運営体制・コミュニティの整備やシステム移行への対応、さらに利用条件の設定といった諸点から述べるとともに、デジタル資源構築のプロセス自体を保存することの重要性にも言及している。 この1~4章の記述は、実際に国内外の様々なプロジェクトやコミュニティに関わってきた著者の経験を踏まえたものであり、殊に、これからデジタル・プロジェクトに参加しようとする若手研究者等にとって有益な内容となっている。デジタル資源構築にあたって考慮しなければならない種々の問題、とくにコストの問題や運営体制の整備については、実際にプロジェクトを運営する経験がなければ現実的な問題として意識しにくい点であり、大いに参考になる。

 5~6章は主にコンテンツデータの作成と編集、より具体的に言えば、史資料をデジタル化し、これにタグやアノテーションを付して情報を付与するプロセスを扱っている。5章では、デジタル画像公開・共有のための国際規格であるIIIFと、デジタル史資料を構造的に記述するための規格であるTEIについて、豊富な事例を交えつつ解説している。5章が国際的な規格に基づくデジタル史資料編集の在り方の概要を述べるのに対し、6章では、実際の公開を念頭に、デジタル化の対象、撮影等の作業、メタデータ記述モデルの構築と付与、検索機能等を実装したうえでの公開の在り方を論じている。  この部分の記述は、前半部のインフラとは少し異なり、文化を知り、伝えるための史資料の扱いをどうするかという、非常に本質的な問題に関わるものである。冒頭で指摘したように本書が、文化に携わり、精通する人間を対象とするガイドラインとしての性格を有するとすれば、実際に彼らの知見をデジタル世界に伝え、公開するための考え方、手段について述べる5~6章は本書の核とも言える部分であり、デジタルとの関わり如何を問わず、文化を研究対象とする者にとって一読の価値があると思う。

 最後の7~8章は、評価に関する記述である。7章では、デジタル資源に対する資金確保の面などからも、一定の評価指標が要求される場合があることを前提としたうえで、どのような指標があり得るのか、また、デジタル資源を評価することがなぜ難しいのか、といった点を論じている。デジタル資源評価が困難であるという点に関して言えば、本書でも言及される技術的進歩に起因するものや、評価する側の知識の有無に起因するものがあろうが、そもそもデジタル資源の価値は研究の分野や方法論によってまちまちであり、何らかの統一的な指標を定めることは不可能に近いのではないかと思えてならない。それでも、何らかの指標が必要であるならば、著者も言うようにアクセス数などで安易に設定することなく、相当に慎重な検討が求められるだろう。  8章は、研究者個人の評価について述べられており、キャリア継続のためにもデジタル分野における実績を評価できることが求められるという。これに対して、日本、そして海外におけるデジタル・ヒューマニティーズ関連の各種学会、学術雑誌における成果発表と評価の機会は増してきていると述べられており、この点には同意できる。しかし、著者も述べているように、デジタル・ヒューマニティーズの外部、すなわち個々の研究者の専門分野におけるデジタル関連の活動に対する評価に関して言えば、、大学において学際研究が重視されるようになってきているとはいえ、分野によっては今しばらく時間がかかるように思われる。

 ここまで、本書の内容を大きく3つの部分に分けて、所感を述べた。本書は、すでにデジタル・プロジェクトに従事している者、これから関わろうとしている者、そして自身が関わることはないが何らかの形でデジタル資源を利用する者のいずれにとっても示唆に富むものである。また、その内容の幅広さを鑑みるに、通読することでデジタル資源構築についての包括的な知識を得られることはもちろん、それぞれの立場や状況に応じて特定の箇所を選択的に読むという利用方法もあるのではないかと感じた。例えば、デジタル資源の設計・管理に中心的な立場で関わるのならば通読すべきである一方、研究者としての立場で主にコンテンツの整備や作成に関わるのであれば5~6章を、あるいは専ら利用者として、デジタル資源およびそれを用いた自身の研究評価に関心があるならば、7~8章を重点的に読むといった具合である。「文化」に携わる個々人のデジタルとの関わりは千差万別であるが、本書はそうした様々なニーズに対応できる構成になっているように思う。

 最後に、本書の射程の広がりについて述べて結びとしたい。この評論の中で私は、専ら「文化」という語を用い、「日本文化」あるいは「日本の文化」といった語は用いていない。その理由は私が、本書の内容は必ずしも日本文化に限られるものではなく、より広い射程を持つと感じているからである。本書のタイトル、そして「はじめに」における著者の言からも本書が、「日本の文化」を未来に継承するためのデジタル環境整備を主題としていることは間違いない。しかし、その中で言及されるデジタル資源構築のための考え方、技術、事例はいずれも汎用性が高く、他分野においても適用可能なものである。それゆえ、日本に限られない様々な分野の研究に従事する人々にとって一読の価値がある内容となっており、タイトルにある「日本の文化」という一語に囚われることなく、広く手に取られて然るべき書籍であると言えるだろう。


===本書のご紹介2

村田祐菜(東京大学大学院人文社会系研究科修士課程(当時))

本書は「はじめに」で〈文化の専門家が、文化に関する資料をデジタルインフラに載せようとする時に、知っておくべきこと、知っておいた方がよいこと、についての基本的な考え方をまとめた上で、具体的な禁煙の情報技術に即してそれを深めて考えてみることをめざしたい〉(Pⅱ,L6)と述べられているように、デジタル技術に関して深い知識を持たない文化専門家を主な対象にしている。「何をどのくらい」知るべきなのかについては、もちろん個々の研究者/研究分野の中でのデジタル情報との接触の度合いによってそのスタンスは異なるであろうが、本書はその個々の立場を超えたところで現在一般的になりつつある、デジタル情報の公開・流通に関する国際的な規格や枠組みついて紹介している。具体的にはUnicodeやIIF、TEI、Creative Commons Licenseなどデジタル情報を公開する際に、今日一般に欠かすことのできない決まりごとについて詳述されており、これらの規格に関する知識を一読して得ることが出来る点で有用であり、巻末の「さらに深めたい人・アップデートしたい人に」(p225)に記載されている情報源と合わせると、所謂「人文情報学」における議論を一通り把握することができる。また、近年、資料のデジタル化とその公開が図書館や博物館を中心とした様々な機関において進められている中、それに伴ってデジタル資料が国文学研究においても基礎資料となりつつある(注:『新日本古典籍総合目録データベース』(国文学研究資料館)や『国立国会図書館デジタルコレクション』(国立国会図書館)などが挙げられる。)。またそれらが紙媒体における出版流通に代わるデジタル情報の流通における〈エコシステム〉となる可能性が高い以上、〈伝える〉立場の研究者だけではなく、デジタル資料を利用する立場の研究者にとってもそれらの知識は今後必須となることであろう。

本書の特徴として挙げたいのが、コストと成果への視点である(注:コストについての議論は特に第二章第二節~三節に詳しい。)。本書が持つ情報技術の一般的な理論書にとどまらないこの現実的な視点は、京都大学人文科学研究所共同研究班「人文研究資料にとってのWebの可能性を再探する(2013-2015年)」における議論を踏まえていることも大きいと考えられるが、それは例えば実際のプロジェクトにおいて制約となる時間と費用への目配りを忘れずに、〈適正なコストで現実的なことをするにはどうすればよいのか〉(P69,L7)について常に記述していくことにもあらわれていると感じた。もちろん、デジタル情報やそれを公開するためのプラットフォームが供えるべき要素は多々あり、情報公開における物理的な制約が低い以上、より詳細で精密な情報を付与すれば情報としての価値は上がる一方で、プロジェクト単位にせよ個人研究にせよその情報の付与にかかるコストを払う必要があるという視点を持っていなければならない。それを考える上でコストと希望の間で、具体的な成果物として何を目指すのか、を問うバランス感覚において本書は多くの示唆を与えてくれる。

さらに、本書全体をより広い視点から見渡してみると、国際性と固有性という二つの志向があることが看取できる。つまり、資料の利活用と保存・継承のために不可欠な、データの表現方法の国際化の流れと、個々の資料が持つ情報の固有性の間で生じる葛藤が本書を貫く問題の一つであると言える。国際規格への準拠により資料の利活用や保存、継承の可能性を担保していくことができるのは言うまでもないが、一方で本書が対象としているのは主に日本の資料であり、それに国際規格を当てはめようとすると、どうしても〈伝え〉きれない部分が常に出てきてしまう。これは、現物としての資料をデジタルにどのように落とし込むのかという際にデジタルの表現方法が限界として持つ問題と、それらの規格が西欧のコミュニティを中心として議論されてきたが故に、日本資料に固有の情報を表現するための方法が手薄であるという二重性において捉えられるだろう。具体的には前者が画像の解像度やXMLの文法に沿ったテキストのマークアップなどの問題、後者は異体字やルビ、訓点などが挙げられ、本書もこれらの問題に関するこれまでの議論に多くの紙幅を割いている。また、これは先述のコストの問題とも関わるが、個々の情報をより丁寧に表現することが出来るようになったとしても、その全ての情報を表現することは現実的に難しい以上、技術や規格の問題とは別にプロジェクトにおける〈伝える〉情報の取捨選択は避けられない。国際規格への準拠が進む中で浮き上がってくるのは、むしろ〈伝え〉きれない情報の方であるとも言える。

しかし、むしろこの点に日本資料固有の面白さや研究者個人の視点が生きてくるのではないか。〈何を、どのようにして、デジタルインフラに載せていけばよいのか、という点について、言い換えるなら、デジタル世界に何をどう伝えるのか、という課題に応えるのは、技術者だけでなく、文化に関わるもの、特に資料についての十分な知識を持った人でもある〉と著者が述べるように、人文学研究者とデジタル世界との接点はまさにここにある。それは、デジタル化に際して不可欠な議論である「何を伝え、何を落とすべきなのか」ということであり、そこに一次資料への専門的な知識を持った研究者の目が必要とされると共に、「この資料の魅力は何か」という根本的な問題を問うことと同義であろう。日本の資料をデジタル化することはそのような視線において資料を眺めることによって、日本語や日本の文化の魅力を捉え直し、デジタルという形式で表現するということでもある。

現在、一般的に人文学の領域では情報技術に関する知識の習得の問題などからデジタル化された資料を利用、享受する立場にとどまる場合が多く、筆者もまだその一人である。しかし、本書が述べているのは、〈伝える〉現場から疎外されることなく自分たちがデジタルなものと能動的に関わっていくために、人文学者が役割を果たしうる領域が確かにあるということであり、関わっていくべきなのだということである。その議論の為の基盤として本書は大いに活用されることであろう。


それから、デジタルアーカイブ学会誌に書評を掲載していただきましたので、そちらもご参考になろうかと思います。

なお、昨日からデジタル版も販売開始されたそうですので、全体を読みたい場合はご購入をお願いいたします。(といっても私には 印税は入らないのですが、こういう本を出してくださった出版社を支援するという気持ちでご購入いただけますと幸いです。)

ということで、みなさまの(そして私の)オンライン授業が少しでもよりよいものになるように、お互いにご協力していけたらと思っております。 今後ともよろしくお願いいたします。

聖徳太子御製『勝鬘經義疏』でText Encoding Initiativeを

このブログでは、長らくTEI (Text Encoding Initiative) ガイドラインについて扱ってきました。このたびは、 大正新脩大蔵経にNo. 2185として収録されている聖徳太子御製『勝鬘經義疏』をTEI(Text Encoding Initiative)ガイドラインに準拠してマークアップしてみたものを公開いたしましたので、 構造的な側面について少しご紹介させていただきます。

これを公開している頁は以下のURLになります。

https://21dzk.l.u-tokyo.ac.jp/SAT/sat_tei.html

TEIガイドラインでは、テキストを電子的な出版物ととらえて、それのみで流通しても通用することを目指しています。そこで、必ず ファイルには必ずヘッダを含めることになっています。ここには、その文書に関する様々な情報が入ります。 上記のTEI/XMLファイル中では <teiHeader> - </teiHeader> に囲まれた箇所になります。

この文書の場合、以下のようなものとして成立していますので、これらの情報がTEIガイドラインに沿ってteiHeaderの中に書き込まれています。

  1. 大正新脩大蔵経(という仏典叢書)所収のテキスト
  2. 聖徳太子が書いたとされる
  3. 四つの対校本を対校した校異本
  4. SAT大蔵経テキストデータベース研究会として作成公開したもの
  5. CC BY-SAライセンスで公開されている

次に、c. として挙げた校異本のうち2点は国立国会図書館からIIIF対応のデジタル画像が公開されています。 また、デジタル化の対象となった本の画像もSAT大蔵経テキストデータベース研究会から公開されています。 そういったデジタル画像の情報を記載しています。 上記のTEI/XMLファイル中では <facsimile> - </facsimile> に囲まれた箇所になります。 一つのfacsimileが一つのIIIF Manifest ファイルに対応し、一つのsurfaceが IIIF Canvas URIに 対応し、一つ一つの画像はgraphicに対応する、という形で記述されています。また、 テキスト本文と頁画像中の冒頭箇所を対応づけるために、各頁を示すsufaceタグにxml:idを付与しています。

そして、テキストデータの本文があり、本文は『勝鬘師子吼一乘大方便方廣經(勝鬘経)』の注釈書となっており、 一部には著者の意見が述べられています。ちなみに、この注釈対象となっている『勝鬘経』は、 舎衛国の波斯匿王の娘である勝鬘(シュリーマーラー)という(お坊さんではない) 一般信者の女性が大乗仏教の教えを仏陀の前で説くというもので、現代日本語訳がオープンデータとして公開されていますので、ぜひご一読ください。

この『勝鬘経』は、出家をしていない、いわゆる在家信者の、しかも女性が教えを説いたお経ということで注目をされたのかもしれませんが、 そのことを仏教の思想体系の中にどう位置づけるか、ということがこの注釈書『勝鬘經義疏』の注目ポイントです。

とはいえ、今回はTEIガイドラインの解説ですので、内容には踏み込まず、マークアップの方の解説に入ります。

テキスト本文(TEI/XMLファイル中では <text> - </text> に囲まれた箇所)の主な要素は、以下のようになっています。

  1. 『勝鬘經義疏』におけるいわゆる本文テキスト
  2. 『勝鬘経』から引用されたテキスト
  3. 固有表現(人名、地名、書名等)
  4. 割書
  5. 脚注(大部分は校異情報)
  6. 返り点
  7. 大正新脩大蔵経における行番号
  8. 大正新脩大蔵経における頁番号

そこで、それぞれについてTEIガイドラインの中から該当しそうなタグをチョイスしてマークアップしていきます。 マークアップは、テキストデータの状況次第ではかなりの部分を自動的にできます。上記のファイルを見て 「こりゃ無理だわ・・・」と思った人もおられると思いますが、難しい部分は大体自動的にタグ付けしてます。

1. 『勝鬘經義疏』におけるいわゆる本文テキスト

さて、1. に関しては、とりあえず章ごとに<div>、段落とおぼしきところは<p>でマークアップして、 さらに、構造的にリストになっているところは、<list> - <item><item> でリスト化しました。

2. 『勝鬘経』から引用されたテキスト

  1. に関しては、まず<quote>を用いた上で、@sourceでSAT DB 2018 の行番号・文字番号を記載しました。 (SAT DB 2018 の行番号・文字番号は、サイト上でテキストをドラッグすると取得できる機能があります。) たとえば以下のような感じです。
<quote source="T0353_.12.0217a07_12-0217a07_18">祇樹給孤獨園</quote>

ただし、文言が若干違うものの同定できると思われるものについては@corerspで参照しました。 これは、 矢印などで引用関係を示す際に矢印の色や形を示して提示したり、引用関係を統計的に処理して分析したり するときに役立つのではないかと思っております。また、興味深いことに、そのような事情で@corerspを 伏した引用関係の中には、大正新脩大蔵経において校異情報として記載されている甲本・乙本と一致する箇所が 結構ありました。このことから言える可能性は様々にありますが、興味深いテーマであると言えるでしょう。 (まだ調べてませんが、本書は敦煌文書の類似の本との関係が取り沙汰され研究されたことが ありますので、すでにこのことについてはその際に研究成果が出ているかもしれません。いつか 調べてみたいと思います。)

3. 固有表現(人名、地名、書名等)

  1. に関しては、たとえば仏陀は如來や釋迦、佛など、様々な名前で文中に登場する一方、「如來藏」 などの、直接には仏陀を指さない「如來」という文字列も含まれます。そうすると、仏陀を指し示す 表現のみを抽出しようと思ったなら、そこら辺を事前に人手で仕分けしておくとやりやすくなりそうです。 人が読んでいく過程では、どれが人名でそれはどの人を指しているのか、という判断をしながら 読んでいきますので、その際に「これは誰の人名か」ということをメモしていければ後々便利です。 それを、みんなで共通の「タグ」でやっておけば、しかも本文中に埋め込んでおけば、どこの ことかわかりやすくて便利ですよね、というのがここでのTEIガイドラインの役割です。 人名以外にも、地名や書名(経典名)も登場します。

それらの「同定」情報をどのように記述しておくかと言いますと、ここでは、TEIガイドラインではなく TEIガイドラインが現在依拠しているマークアップ言語であるXMLの機能に依拠することになります。 XMLでは、各エレメント(タグ)に、「id」をつけることができます。この「id」は、一つの 文書の中では必ずユニークでなければなりません。そこで、たとえば、仏陀なら「仏陀」 勝鬘なら「勝鬘」というidをつけておきます。そうすると、これらのidは、その文書内では、 それぞれ「#仏陀」「#勝鬘」という案配で「#」をつけることで固有のエレメント(タグ)として 参照できるようになります。さて、そうすると、「佛」と出てきても「如來」と出てきても とりあえずそれらに「#仏陀」とつけておけば、それらはすべて「仏陀」というidを持つ共通の 内容として扱うことができるようになります。同様に、たとえば「我が娘」という表現が 出てきた時に、それが勝鬘のことであれば「#勝鬘」とつけておけばよい、ということになります。 地名や書名についても同様です。たとえば以下のような感じです。

<rs corresp="#勝鬘">我子</rs>

さて、では、そのようにして、参照されるidがついたエレメント(タグ)をどこに置いておくか、 ということが次に出てきますが、これは</text> の次に出てくる<back> - </back> にて、listPerson、listPlace等の中に登場する、ということになります。そして、それぞれの 固有表現について、さらに詳しい情報を付与しておきたいときも、ここに記述してしまいます。 たとえば、経典名のところを見ていただくと、以下のように大正新脩大蔵経のテキスト番号が idnoタグで付けられているのがわかると思います。大正新脩大蔵経にリンクできれば、そこから さらに色んな情報を一気にたぐり寄せることができますので、ここでは単にそれだけ 記述していますが、目的次第では、ここにさらに様々な情報を 記述していくことになります。

            <bibl xml:id="法鼓經">
               <title>法鼓經</title>
               <idno type="Taisho">T0270</idno>
            </bibl>

4. 割書

割書は、このテキストには一カ所だけでてきます。ただし、割書は、改行が入った場合の扱いが独特です。 行頭まで戻らずに、その割書内の冒頭に戻ります。そこで、割書内の改行は、TEIガイドラインにおける 通常のlbタグではなく、milestoneタグを使って仮につけています。この点はTEIガイドラインの改訂すべき 点の一つとして検討しています。

5. 脚注(大部分は校異情報)

脚注のほとんどは校異情報ですので、TEIガイドラインではCritical Apparatusとして3種類の記述方法が用意されています。 ここでは、複雑な校異関係を持ったテキストの情報を記述するのに強い、Double End-Point Attachment Methodを採用しています。 こんな複雑なものを入力するのか・・・と思われた人もおられるかもしれませんが、これは、大正新脩大蔵経のテキストデータに すでに脚注情報がある程度構造化されて入っているため、それを半自動的に変換しており、複雑なものだけを少し 手で修正するだけです。ここでは、本文中の校異がある箇所の最初と最後に anchorタグを入れて位置決めをしてそれぞれにXMLのidを 付与し、<back> - </back> の方に校異情報一覧を掲載してそれぞれのidを参照し、あとは、それぞれの校異情報を記述していきます。 どれがどの校本かというのは、すでにteiHeaderの中でリストしていますので、そこで各校本の情報を表すタグに付与されたidを参照しています。 例として2つ挙げてみると以下のような感じになります。

            <app from="#tft_0006_10" to="#tft_0006_10e">
               <lem wit="#原 #丙"></lem>
               <rdg wit="#乙 #甲">法比</rdg>
            </app>
            <app from="#tft_0006_11" to="#tft_0006_11e">
               <lem wit="#原 #丙">亦可見</lem>
               <rdg wit="#甲 #乙"/>
            </app>

6. 返り点

返り点は、大正新脩大蔵経に付されていたものをそのまま使っています。チェックしていくと、少し間違っているようなところも散見されるのですが、 第一段階として、まずはそのままマークアップしています。返り点記号はすでにUnicodeに入っていますので、ここではそれを用います。ただし、漢文のみを取り出すときにこれらの文字をスキップして取り出さねばならない、という データになってしまうと扱う難易度が一気に高くなってしまいますので(特に、日本語を理解できない人がデータを触れなくなってしまいますので)、 ここでは、Unicodeの返り点記号を用いつつも、タグもつけておきます。こういう場合のタグとして何を使うべきかは まだ定まっていないので、ここでは一つの提案として、以下のようにしてみています。ちょっと冗長に見えるかもしれませんが、 日本語を解さない人にでもなるべくうまく処理してもらえるようにするというのが一つの大事なポイントですので、ここは このような感じにしておきたいところです。

<metamark function="kaeriten"></metamark>

7. 大正新脩大蔵経における行番号

大正新脩大蔵経の頁番号・行番号は、元々大正新脩大蔵経自体が国際的な参照本となっている上に、SATとCBETAが この行番号を付与する形でデジタルテキストを世界中に流通させたため、デジタル世界でもスタンダードになって います。世界中のほとんどの仏教学者が、「大正新脩大蔵経の何巻の何頁の何段目の何行目」と言われれば 同じ仏典の同じ行を参照することができるようになっています。そこで、TEIでの行頭を表すタグ lbに、この 行番号を付与しておきます。

8. 大正新脩大蔵経における頁番号

頁番号についても同様で、頁の始まりを示すタグ pb をつけておきます。ただし、頁番号の場合は、 頁画像の始まりとの対応づけにも意味が大きいので、上述の画像の頁のid(=IIIFのcanvasに対応するsurfaceタグに付与したXMLのid)を付与しておきます。 たとえば以下のような感じです。

<pb corresp="T56_0019.json"/>

おまけ

さて、これでマークアップした要素の大部分はご説明できたかと思います。あとは、対校本の画像とそれに対応する 頁番号も一つだけ(大日本仏教全書のものだけ)つけてみています。これも、国立国会図書館デジタルコレクションから IIIF対応で公開されているため、上述のように、IIIF Manifestの構造をfacsimile - surface - graphic として記述して surfaceに XMLの id を付与した上で、参照すればよいということになりますが、ここでは仮に以下のように しています。milestone の@unit は"page"とすべきなのかもしれませんが、せっかく頁の最初なのでpage beginningという 情報を残しておくべく、仮にpbとしています。

<milestone unit="pb" corresp="#DR0000004"/>

終わりに

ということで、今回つけたタグの説明はおおまかにはできたかと思います。このうち、固有表現や返り点などをうまく 表示してくれるビューワを、東京大学情報基盤センターの中村氏が作ってくださっているので、よかったらぜひ 試してみてください。以下のURLで、このTEIファイルを読み込んで表示してくれるはずです。

tei-eaj.github.io

今後、このような形で、仏典だけでなく様々なテキストが利活用されやすい形で作成されていくとありがたいと思っております。 これをみて自分のところでもやってみようと思われた方はご連絡をいただければなるべく対応いたしますので(この時期だとZoomでということに なると思いますが)、よろしくお願いいたします。

オンデマンド配信での著作物の教育利用に向けて?

以下の件につき、識者の方々にご教示いただいた結果、SARTRASに補償金さえ支払えば、利用者側としてはその向こう側を特に気にする必要はないという立て付けになっていると理解しました。 色々気になるところではありますが、したがいまして、以下の件は素人の想像+勉強不足ということでご放念ください。


この件は素人ですので、あとで修正する可能性があることをご容赦ください。

一昨日、以下のニュースが流れました。

headlines.yahoo.co.jp

著作権法第35条にて、教育の情報化に対応した権利制限規定の整備を目指して 「授業目的公衆送信補償金に係る指定管理団体」を介して著作権者等に補償金(「授業目的公衆送信補償金」)を受ける権利を付与することになった のだそうで、ユーザレベルでは、この団体に補償金を支払えば教育機関における利用においてオンデマンド配信でも 著作権者等の許諾を得ることは必要なくなるという話なのですが、それを前倒しにしてくださるということのようです。

(参照:授業目的公衆送信補償金に係る指定管理団体の指定について | 文化庁

上記のサイトによると、すでに一般社団法人授業目的公衆送信補償金等管理協会(SARTRAS)が指定されているとのことですので、ここを通じて 対応することになると思うのですが、現在、どういう範囲で対応可能なのか、一応ちょっと確認してみるといいのかなと思いまして、

以下のURLにPDFにてリストがありましたので、

https://www.bunka.go.jp/seisaku/chosakuken/pdf/r1413647_01.pdf

ここの各団体にどういうところが所属しているのかを確認しやすくすべく、以下に、各団体名の一覧と、それぞれの団体の加盟団体・人物の頁へのリンクをリストしてみました。

新聞教育著作権協議会

一般社団法人新聞著作権管理協会

会員社一覧|一般社団法人新聞著作権管理協会 The Japanese Newspaper Copyright Management Association

言語等教育著作権協議会

一般社団法人学術著作権協会

JACとは | 学術著作権協会(JAC)

公益社団法人日本文藝家協会

会員名簿(PDF) http://www.bungeika.or.jp/pdf/20200401.pdf

協同組合日本脚本家連盟

信託者検索・名簿|日本脚本家連盟

協同組合日本シナリオ作家協会

著作者管理検索: https://www.j-writersguild.org/search-works.html

視覚芸術等教育著作権協議会

一般社団法人日本写真著作権協会(JPCA)

一般社団法人日本美術著作者連合

所属会員 - jarttokyo ページ!

公益社団法人日本漫画家協会

会員: https://www.nihonmangakakyokai.or.jp/?tbl=member&idx=A

出版教育著作権協議会

一般社団法人日本雑誌協会

日本雑誌協会会員社 https://www.j-magazine.or.jp/user/guide/index/5

一般社団法人日本書籍出版協会

会員出版社一覧 | 協会の概要 | 一般社団法人 日本書籍出版協会

一般社団法人自然科学書協会

自然科学書協会[会員社一覧]

一般社団法人日本医書出版協会

頁の下の方に会員社一覧 https://www.medbooks.or.jp/jmpa/

一般社団法人出版梓会会員出版社一覧

http://www.azusakai.or.jp/ichiran.html

一般社団法人日本楽譜出版協会

会員一覧 - 協会概要 | 一般社団法人日本楽譜出版協会

一般社団法人日本電子書籍出版社協会

電書協について | 日本電子書籍出版社協会

音楽等教育著作権協議会

一般社団法人日本音楽著作権協会

JASRACの紹介 JASRAC (網羅性はよくわかりませんがかなり高いようです) 海外のものについても。

音楽が国際的に管理されるしくみ JASRAC

公益社団法人日本芸能実演家団体協議会

正・賛助会員団体一覧 | 日本芸能実演家団体協議会(芸団協)

一般社団法人日本レコード協会

映像等教育著作権協議会

日本放送協会

一般社団法人日本民間放送連盟

会員社放送局 | 一般社団法人 日本民間放送連盟

一般社団法人日本ケーブルテレビ連盟

正会員サプライヤー一覧 | 一般社団法人 日本ケーブルテレビ連盟

素人的な疑問で恐縮ですが

※上記のとおり、以下の件については、SARTRASに補償金さえ支払えば、利用者側としてはその向こう側を特に気にする必要はないという立て付けになっているそうです。 このような制度を作ってくださった関係者の皆様に深く感謝いたします。

ここで気になっているのは、上記の団体のいずれにもつながっていない著作物は、今回の例外規定の対象にはできないのだろうか、という点です。いくつか、よく お世話になっている出版社がリストに見つけられなかったりしてまして、おそらくDVD等でもそういうことがあるのではという気がします。その点の指針もどこかに 明記してあるとありがたいと思っております。(あるいは、どなたかご存じでしたら教えてください)

もし、上記リストにつながらない著作物はダメ、ということである場合には(おそらくそういうことのではないかと想像しているのですが…)、 オンデマンド配信で使いたい資料があれば、まずは各団体の頁に行ってリストから該当する人物・企業等を探してみることになるのかもしれませんが、 そうなのだとしたら、このリストのようなものからいちいち探すのはちょっと大変ですので、どこかでぱっと確認できるようになっているとありがたいですね。 急に施行することになりそうなので、準備がまだできていないということかもしれませんが、今後どうなるでしょうね。たとえばカーリルみたいなところがぱぱっと探せるようにしてくださると ありがたいなあと、一利用者としては思っております。

ということで、いずれにしても、事が前に進みそうで、ありがたいことです。関係者の皆様にも感謝すること至極です。