聖徳太子御製『勝鬘經義疏』でText Encoding Initiativeを

このブログでは、長らくTEI (Text Encoding Initiative) ガイドラインについて扱ってきました。このたびは、 大正新脩大蔵経にNo. 2185として収録されている聖徳太子御製『勝鬘經義疏』をTEI(Text Encoding Initiative)ガイドラインに準拠してマークアップしてみたものを公開いたしましたので、 構造的な側面について少しご紹介させていただきます。

これを公開している頁は以下のURLになります。

https://21dzk.l.u-tokyo.ac.jp/SAT/sat_tei.html

TEIガイドラインでは、テキストを電子的な出版物ととらえて、それのみで流通しても通用することを目指しています。そこで、必ず ファイルには必ずヘッダを含めることになっています。ここには、その文書に関する様々な情報が入ります。 上記のTEI/XMLファイル中では <teiHeader> - </teiHeader> に囲まれた箇所になります。

この文書の場合、以下のようなものとして成立していますので、これらの情報がTEIガイドラインに沿ってteiHeaderの中に書き込まれています。

  1. 大正新脩大蔵経(という仏典叢書)所収のテキスト
  2. 聖徳太子が書いたとされる
  3. 四つの対校本を対校した校異本
  4. SAT大蔵経テキストデータベース研究会として作成公開したもの
  5. CC BY-SAライセンスで公開されている

次に、c. として挙げた校異本のうち2点は国立国会図書館からIIIF対応のデジタル画像が公開されています。 また、デジタル化の対象となった本の画像もSAT大蔵経テキストデータベース研究会から公開されています。 そういったデジタル画像の情報を記載しています。 上記のTEI/XMLファイル中では <facsimile> - </facsimile> に囲まれた箇所になります。 一つのfacsimileが一つのIIIF Manifest ファイルに対応し、一つのsurfaceが IIIF Canvas URIに 対応し、一つ一つの画像はgraphicに対応する、という形で記述されています。また、 テキスト本文と頁画像中の冒頭箇所を対応づけるために、各頁を示すsufaceタグにxml:idを付与しています。

そして、テキストデータの本文があり、本文は『勝鬘師子吼一乘大方便方廣經(勝鬘経)』の注釈書となっており、 一部には著者の意見が述べられています。ちなみに、この注釈対象となっている『勝鬘経』は、 舎衛国の波斯匿王の娘である勝鬘(シュリーマーラー)という(お坊さんではない) 一般信者の女性が大乗仏教の教えを仏陀の前で説くというもので、現代日本語訳がオープンデータとして公開されていますので、ぜひご一読ください。

この『勝鬘経』は、出家をしていない、いわゆる在家信者の、しかも女性が教えを説いたお経ということで注目をされたのかもしれませんが、 そのことを仏教の思想体系の中にどう位置づけるか、ということがこの注釈書『勝鬘經義疏』の注目ポイントです。

とはいえ、今回はTEIガイドラインの解説ですので、内容には踏み込まず、マークアップの方の解説に入ります。

テキスト本文(TEI/XMLファイル中では <text> - </text> に囲まれた箇所)の主な要素は、以下のようになっています。

  1. 『勝鬘經義疏』におけるいわゆる本文テキスト
  2. 『勝鬘経』から引用されたテキスト
  3. 固有表現(人名、地名、書名等)
  4. 割書
  5. 脚注(大部分は校異情報)
  6. 返り点
  7. 大正新脩大蔵経における行番号
  8. 大正新脩大蔵経における頁番号

そこで、それぞれについてTEIガイドラインの中から該当しそうなタグをチョイスしてマークアップしていきます。 マークアップは、テキストデータの状況次第ではかなりの部分を自動的にできます。上記のファイルを見て 「こりゃ無理だわ・・・」と思った人もおられると思いますが、難しい部分は大体自動的にタグ付けしてます。

1. 『勝鬘經義疏』におけるいわゆる本文テキスト

さて、1. に関しては、とりあえず章ごとに<div>、段落とおぼしきところは<p>でマークアップして、 さらに、構造的にリストになっているところは、<list> - <item><item> でリスト化しました。

2. 『勝鬘経』から引用されたテキスト

  1. に関しては、まず<quote>を用いた上で、@sourceでSAT DB 2018 の行番号・文字番号を記載しました。 (SAT DB 2018 の行番号・文字番号は、サイト上でテキストをドラッグすると取得できる機能があります。) たとえば以下のような感じです。
<quote source="T0353_.12.0217a07_12-0217a07_18">祇樹給孤獨園</quote>

ただし、文言が若干違うものの同定できると思われるものについては@corerspで参照しました。 これは、 矢印などで引用関係を示す際に矢印の色や形を示して提示したり、引用関係を統計的に処理して分析したり するときに役立つのではないかと思っております。また、興味深いことに、そのような事情で@corerspを 伏した引用関係の中には、大正新脩大蔵経において校異情報として記載されている甲本・乙本と一致する箇所が 結構ありました。このことから言える可能性は様々にありますが、興味深いテーマであると言えるでしょう。 (まだ調べてませんが、本書は敦煌文書の類似の本との関係が取り沙汰され研究されたことが ありますので、すでにこのことについてはその際に研究成果が出ているかもしれません。いつか 調べてみたいと思います。)

3. 固有表現(人名、地名、書名等)

  1. に関しては、たとえば仏陀は如來や釋迦、佛など、様々な名前で文中に登場する一方、「如來藏」 などの、直接には仏陀を指さない「如來」という文字列も含まれます。そうすると、仏陀を指し示す 表現のみを抽出しようと思ったなら、そこら辺を事前に人手で仕分けしておくとやりやすくなりそうです。 人が読んでいく過程では、どれが人名でそれはどの人を指しているのか、という判断をしながら 読んでいきますので、その際に「これは誰の人名か」ということをメモしていければ後々便利です。 それを、みんなで共通の「タグ」でやっておけば、しかも本文中に埋め込んでおけば、どこの ことかわかりやすくて便利ですよね、というのがここでのTEIガイドラインの役割です。 人名以外にも、地名や書名(経典名)も登場します。

それらの「同定」情報をどのように記述しておくかと言いますと、ここでは、TEIガイドラインではなく TEIガイドラインが現在依拠しているマークアップ言語であるXMLの機能に依拠することになります。 XMLでは、各エレメント(タグ)に、「id」をつけることができます。この「id」は、一つの 文書の中では必ずユニークでなければなりません。そこで、たとえば、仏陀なら「仏陀」 勝鬘なら「勝鬘」というidをつけておきます。そうすると、これらのidは、その文書内では、 それぞれ「#仏陀」「#勝鬘」という案配で「#」をつけることで固有のエレメント(タグ)として 参照できるようになります。さて、そうすると、「佛」と出てきても「如來」と出てきても とりあえずそれらに「#仏陀」とつけておけば、それらはすべて「仏陀」というidを持つ共通の 内容として扱うことができるようになります。同様に、たとえば「我が娘」という表現が 出てきた時に、それが勝鬘のことであれば「#勝鬘」とつけておけばよい、ということになります。 地名や書名についても同様です。たとえば以下のような感じです。

<rs corresp="#勝鬘">我子</rs>

さて、では、そのようにして、参照されるidがついたエレメント(タグ)をどこに置いておくか、 ということが次に出てきますが、これは</text> の次に出てくる<back> - </back> にて、listPerson、listPlace等の中に登場する、ということになります。そして、それぞれの 固有表現について、さらに詳しい情報を付与しておきたいときも、ここに記述してしまいます。 たとえば、経典名のところを見ていただくと、以下のように大正新脩大蔵経のテキスト番号が idnoタグで付けられているのがわかると思います。大正新脩大蔵経にリンクできれば、そこから さらに色んな情報を一気にたぐり寄せることができますので、ここでは単にそれだけ 記述していますが、目的次第では、ここにさらに様々な情報を 記述していくことになります。

            <bibl xml:id="法鼓經">
               <title>法鼓經</title>
               <idno type="Taisho">T0270</idno>
            </bibl>

4. 割書

割書は、このテキストには一カ所だけでてきます。ただし、割書は、改行が入った場合の扱いが独特です。 行頭まで戻らずに、その割書内の冒頭に戻ります。そこで、割書内の改行は、TEIガイドラインにおける 通常のlbタグではなく、milestoneタグを使って仮につけています。この点はTEIガイドラインの改訂すべき 点の一つとして検討しています。

5. 脚注(大部分は校異情報)

脚注のほとんどは校異情報ですので、TEIガイドラインではCritical Apparatusとして3種類の記述方法が用意されています。 ここでは、複雑な校異関係を持ったテキストの情報を記述するのに強い、Double End-Point Attachment Methodを採用しています。 こんな複雑なものを入力するのか・・・と思われた人もおられるかもしれませんが、これは、大正新脩大蔵経のテキストデータに すでに脚注情報がある程度構造化されて入っているため、それを半自動的に変換しており、複雑なものだけを少し 手で修正するだけです。ここでは、本文中の校異がある箇所の最初と最後に anchorタグを入れて位置決めをしてそれぞれにXMLのidを 付与し、<back> - </back> の方に校異情報一覧を掲載してそれぞれのidを参照し、あとは、それぞれの校異情報を記述していきます。 どれがどの校本かというのは、すでにteiHeaderの中でリストしていますので、そこで各校本の情報を表すタグに付与されたidを参照しています。 例として2つ挙げてみると以下のような感じになります。

            <app from="#tft_0006_10" to="#tft_0006_10e">
               <lem wit="#原 #丙"></lem>
               <rdg wit="#乙 #甲">法比</rdg>
            </app>
            <app from="#tft_0006_11" to="#tft_0006_11e">
               <lem wit="#原 #丙">亦可見</lem>
               <rdg wit="#甲 #乙"/>
            </app>

6. 返り点

返り点は、大正新脩大蔵経に付されていたものをそのまま使っています。チェックしていくと、少し間違っているようなところも散見されるのですが、 第一段階として、まずはそのままマークアップしています。返り点記号はすでにUnicodeに入っていますので、ここではそれを用います。ただし、漢文のみを取り出すときにこれらの文字をスキップして取り出さねばならない、という データになってしまうと扱う難易度が一気に高くなってしまいますので(特に、日本語を理解できない人がデータを触れなくなってしまいますので)、 ここでは、Unicodeの返り点記号を用いつつも、タグもつけておきます。こういう場合のタグとして何を使うべきかは まだ定まっていないので、ここでは一つの提案として、以下のようにしてみています。ちょっと冗長に見えるかもしれませんが、 日本語を解さない人にでもなるべくうまく処理してもらえるようにするというのが一つの大事なポイントですので、ここは このような感じにしておきたいところです。

<metamark function="kaeriten"></metamark>

7. 大正新脩大蔵経における行番号

大正新脩大蔵経の頁番号・行番号は、元々大正新脩大蔵経自体が国際的な参照本となっている上に、SATとCBETAが この行番号を付与する形でデジタルテキストを世界中に流通させたため、デジタル世界でもスタンダードになって います。世界中のほとんどの仏教学者が、「大正新脩大蔵経の何巻の何頁の何段目の何行目」と言われれば 同じ仏典の同じ行を参照することができるようになっています。そこで、TEIでの行頭を表すタグ lbに、この 行番号を付与しておきます。

8. 大正新脩大蔵経における頁番号

頁番号についても同様で、頁の始まりを示すタグ pb をつけておきます。ただし、頁番号の場合は、 頁画像の始まりとの対応づけにも意味が大きいので、上述の画像の頁のid(=IIIFのcanvasに対応するsurfaceタグに付与したXMLのid)を付与しておきます。 たとえば以下のような感じです。

<pb corresp="T56_0019.json"/>

おまけ

さて、これでマークアップした要素の大部分はご説明できたかと思います。あとは、対校本の画像とそれに対応する 頁番号も一つだけ(大日本仏教全書のものだけ)つけてみています。これも、国立国会図書館デジタルコレクションから IIIF対応で公開されているため、上述のように、IIIF Manifestの構造をfacsimile - surface - graphic として記述して surfaceに XMLの id を付与した上で、参照すればよいということになりますが、ここでは仮に以下のように しています。milestone の@unit は"page"とすべきなのかもしれませんが、せっかく頁の最初なのでpage beginningという 情報を残しておくべく、仮にpbとしています。

<milestone unit="pb" corresp="#DR0000004"/>

終わりに

ということで、今回つけたタグの説明はおおまかにはできたかと思います。このうち、固有表現や返り点などをうまく 表示してくれるビューワを、東京大学情報基盤センターの中村氏が作ってくださっているので、よかったらぜひ 試してみてください。以下のURLで、このTEIファイルを読み込んで表示してくれるはずです。

tei-eaj.github.io

今後、このような形で、仏典だけでなく様々なテキストが利活用されやすい形で作成されていくとありがたいと思っております。 これをみて自分のところでもやってみようと思われた方はご連絡をいただければなるべく対応いたしますので(この時期だとZoomでということに なると思いますが)、よろしくお願いいたします。

オンデマンド配信での著作物の教育利用に向けて?

以下の件につき、識者の方々にご教示いただいた結果、SARTRASに補償金さえ支払えば、利用者側としてはその向こう側を特に気にする必要はないという立て付けになっていると理解しました。 色々気になるところではありますが、したがいまして、以下の件は素人の想像+勉強不足ということでご放念ください。


この件は素人ですので、あとで修正する可能性があることをご容赦ください。

一昨日、以下のニュースが流れました。

headlines.yahoo.co.jp

著作権法第35条にて、教育の情報化に対応した権利制限規定の整備を目指して 「授業目的公衆送信補償金に係る指定管理団体」を介して著作権者等に補償金(「授業目的公衆送信補償金」)を受ける権利を付与することになった のだそうで、ユーザレベルでは、この団体に補償金を支払えば教育機関における利用においてオンデマンド配信でも 著作権者等の許諾を得ることは必要なくなるという話なのですが、それを前倒しにしてくださるということのようです。

(参照:授業目的公衆送信補償金に係る指定管理団体の指定について | 文化庁

上記のサイトによると、すでに一般社団法人授業目的公衆送信補償金等管理協会(SARTRAS)が指定されているとのことですので、ここを通じて 対応することになると思うのですが、現在、どういう範囲で対応可能なのか、一応ちょっと確認してみるといいのかなと思いまして、

以下のURLにPDFにてリストがありましたので、

https://www.bunka.go.jp/seisaku/chosakuken/pdf/r1413647_01.pdf

ここの各団体にどういうところが所属しているのかを確認しやすくすべく、以下に、各団体名の一覧と、それぞれの団体の加盟団体・人物の頁へのリンクをリストしてみました。

新聞教育著作権協議会

一般社団法人新聞著作権管理協会

会員社一覧|一般社団法人新聞著作権管理協会 The Japanese Newspaper Copyright Management Association

言語等教育著作権協議会

一般社団法人学術著作権協会

JACとは | 学術著作権協会(JAC)

公益社団法人日本文藝家協会

会員名簿(PDF) http://www.bungeika.or.jp/pdf/20200401.pdf

協同組合日本脚本家連盟

信託者検索・名簿|日本脚本家連盟

協同組合日本シナリオ作家協会

著作者管理検索: https://www.j-writersguild.org/search-works.html

視覚芸術等教育著作権協議会

一般社団法人日本写真著作権協会(JPCA)

一般社団法人日本美術著作者連合

所属会員 - jarttokyo ページ!

公益社団法人日本漫画家協会

会員: https://www.nihonmangakakyokai.or.jp/?tbl=member&idx=A

出版教育著作権協議会

一般社団法人日本雑誌協会

日本雑誌協会会員社 https://www.j-magazine.or.jp/user/guide/index/5

一般社団法人日本書籍出版協会

会員出版社一覧 | 協会の概要 | 一般社団法人 日本書籍出版協会

一般社団法人自然科学書協会

自然科学書協会[会員社一覧]

一般社団法人日本医書出版協会

頁の下の方に会員社一覧 https://www.medbooks.or.jp/jmpa/

一般社団法人出版梓会会員出版社一覧

http://www.azusakai.or.jp/ichiran.html

一般社団法人日本楽譜出版協会

会員一覧 - 協会概要 | 一般社団法人日本楽譜出版協会

一般社団法人日本電子書籍出版社協会

電書協について | 日本電子書籍出版社協会

音楽等教育著作権協議会

一般社団法人日本音楽著作権協会

JASRACの紹介 JASRAC (網羅性はよくわかりませんがかなり高いようです) 海外のものについても。

音楽が国際的に管理されるしくみ JASRAC

公益社団法人日本芸能実演家団体協議会

正・賛助会員団体一覧 | 日本芸能実演家団体協議会(芸団協)

一般社団法人日本レコード協会

映像等教育著作権協議会

日本放送協会

一般社団法人日本民間放送連盟

会員社放送局 | 一般社団法人 日本民間放送連盟

一般社団法人日本ケーブルテレビ連盟

正会員サプライヤー一覧 | 一般社団法人 日本ケーブルテレビ連盟

素人的な疑問で恐縮ですが

※上記のとおり、以下の件については、SARTRASに補償金さえ支払えば、利用者側としてはその向こう側を特に気にする必要はないという立て付けになっているそうです。 このような制度を作ってくださった関係者の皆様に深く感謝いたします。

ここで気になっているのは、上記の団体のいずれにもつながっていない著作物は、今回の例外規定の対象にはできないのだろうか、という点です。いくつか、よく お世話になっている出版社がリストに見つけられなかったりしてまして、おそらくDVD等でもそういうことがあるのではという気がします。その点の指針もどこかに 明記してあるとありがたいと思っております。(あるいは、どなたかご存じでしたら教えてください)

もし、上記リストにつながらない著作物はダメ、ということである場合には(おそらくそういうことのではないかと想像しているのですが…)、 オンデマンド配信で使いたい資料があれば、まずは各団体の頁に行ってリストから該当する人物・企業等を探してみることになるのかもしれませんが、 そうなのだとしたら、このリストのようなものからいちいち探すのはちょっと大変ですので、どこかでぱっと確認できるようになっているとありがたいですね。 急に施行することになりそうなので、準備がまだできていないということかもしれませんが、今後どうなるでしょうね。たとえばカーリルみたいなところがぱぱっと探せるようにしてくださると ありがたいなあと、一利用者としては思っております。

ということで、いずれにしても、事が前に進みそうで、ありがたいことです。関係者の皆様にも感謝すること至極です。

みなさんのオンライン授業に向けた取り組み

いよいよ、オンライン授業に向けたみなさんの取り組みが活発になってきたようです。ツィッタを見ているだけでも色々なチャレンジや検討事項が流れてきていて、それが非常に具体化してきているのがとても面白いです。懐疑的な人も問題点を感じている人も、とにかくやろうとしてみているようであることは頼もしいことです。手元の機材や自分の授業ポリシーに応じて、私には思いつかなかったようなことをしておられる人もちょこちょこ見受けられて、取り組む人が増えると多様性が生じるということを改めて実感しているところでもあります。

そんな中で、特にこれはと思ったツィートをいくつかまとめてみました。

まずは、教壇に立って普通に授業をしている状況を配信しようとしてられる方々がおられました。書いたものをみせるのはパワポかGoogle Docsと思い込んでいた自分にとっては なかなか新鮮でした。

データ通信量がかなり違ってきてしまうはずなのでパワポで画面共有した方がよいとは思うものの、授業のダイナミクスを伝えるにはこういうやり方もよいのかも、と思ったところでした。 パワポの利用と部分的に切り替えてもよいのかもしれません。 人によっては当たり前のことと思うかもしれませんが、18年前~10年前に自分がオンラインライブ授業を毎週やっていた時も、すでにパワポをホワイトボード代わりに使っていたので こういう方向に思考が全然いきませんでした。

もう一つ、ちょっとびっくりしたのはこちら、

gustav.air-nifty.com

何がびっくりしたかというと、ノートPCを持ってない大学の先生がまだ結構いらっしゃるようであることを、このブログをめぐるいくつかのツィートから知ったことでした。 しかし冷静に考えてみると、仕事の組み立て方次第ではそういうことも十分にあり得るなと思ったのでした。

ところで、スマホのカメラをZoomで使う場合には、パソコンからカメラを操作できるようにする以外に、おそらくもうちょっと簡単な方法として、Zoomアプリをスマホに入れて、 そのスマホを会議に参加させるという方法もあります。その場合、そのスマホの画面をメイン画面に固定する/しないで切り替えられるので、オンライン中の操作も もしかしたらちょっと楽かもしれません。(これは人によるかも?)

他にも、具体的な話がちらほらみられました。

Skype for ビジネスがちょっと大変、というお話でしたが、

この観点以外にも、そもそもSkypeは、ビデオ通話を利用する場合、データ通信量がZoomやWebex等に比べてかなり多くなってしまうようですので、オンラインライブ授業にはちょっと きついかもしれません。

また、大学単位でWebexを契約したところもあるそうです。

なお、Zoomが教育機関向け期間限定無料をやっていることは、前のブログ記事でもお知らせしたとおりです。

その他、小さな工夫として見受けられたのは、

静止画やテキスト、図表データ+音声で良い場合、ということで、

PowerPointのスライド紙芝居に解説音声つけてZoomで収録

それから、全体的に情報をまとめてくださっているものとして、

などがありました。

一方、海外での実践例が日本語ツィートでも少し流れていましたので、

それもまとめさせていただきますと…

最後のツィートは、割と深刻な問題で、ネット接続環境として大学図書館などを使おうとしても大学図書館も閉められている、ということもあるようです。

今後出てくるであろう問題点についてのツィートも少しまとめてみますと…

といった問題を今後どうクリアしていくのかというのが課題になっていきそうです。

また、個人的に気になっている問題として、 大学には行かない方が良いと思っている親やそういう家庭環境の学生も世の中には結構いるので、 そういう親や家族と同じ屋根の下で勉強することになるとちょっと難しい感じになりそうだ、ということがあります。ここら辺のことは、 学生側からは見えにくいことで、いわゆる研究大学的なところでは少ないことなので、大学を学生としてしか過ごしてない人には わかりにくいことかもしれないですが(今時そんな親がいるわけないだろう、と思う人もいるかもしれないが、そんなことはないの です)、そういう状況でも大学教育を受けたいと思ってくれる若者達のおかげで社会が支えられていく 面が大いにあると思うので、なんとかした方がよいことの一つだと思っています。

最後に、以下のようなオンラインワークショップが予定されているようですので、これを受けてみるとまた色々わかって面白いかもしれません。

Web動画:Voyant-toolsで簡単テキスト分析:コロナウイルス感染症対策本部の会議資料をみてみよう

「Voyant-toolsで簡単テキスト分析:コロナウイルス感染症対策本部の会議資料をみてみよう」という動画を作って、東京大学の大向先生が主宰しておられるUTDHチャンネルにあげていただきました。

Voyant-toolsは、カナダでデジタル・ヒューマニティーズを牽引する二人の先生が開発・公開しておられる簡単テキスト分析ツールで、解説本的なものも出ています。 3年ほどまえに、このブログで採り上げたことがありますが、あの頃からさらに進歩しているような感じです。

今回は、開発者ご本人による紹介動画もいただけたので、そちらもあげていただいております。

www.youtube.com

日本語テキストの分析も一応できるということですので、ここでは、首相官邸のWebサイトに掲載されているコロナウイルス感染症対策本部の第1回から第19回の会議資料を資料として使ってみました。そのファイル群は以下のリンクからダウンロードできます。

http://www.dhii.jp/nagasaki/%E6%84%9F%E6%9F%93%E7%97%87%E5%AF%BE%E7%AD%96%E6%9C%AC%E9%83%A8.zip

元は主にパワポから作ったPDFファイルのようで、そこからテキストデータだけを抜き出しています。文章というよりはポンチ絵の中の単語を 拾いだして数えるような感じになっているようです。ですので、通常のテキスト分析のような、文章全体として反語的表現や否定表現を行っているために分析結果がうまくでない、 という難しさはやや少ないのではないかという気がします。

今回の動画は、Voyant-toolsのごく基本的な使い方を示しただけです。これを機にちょっと試してみたい、という方は、ぜひ以下の動画をご覧ください。

www.youtube.com

この動画を作成していて特に興味深かったのは「学校」という単語の時系列での登場頻度変化です。

f:id:digitalnagasaki:20200326142028p:plain
学校の登場頻度

詳しくは、動画の5分過ぎあたりからご覧いただくか、上に挙げたテキストデータをご自身で試してみるなどしてみてください。

なお、Voyant-toolsには様々な機能がありますので、ぜひお試ししてみてください。それから、より深い分析にはKH Coderがおすすめですので、そちらもぜひお試しください。

それから、この動画を載せてくださっているUTDH動画チャンネルでは、チャンネル登録者を増やしたいという意向がおありだそうです。チャンネル登録していただくと、人文情報学関係の動画が公開されたときなどに通知が来るようですので、よかったらぜひ、「チャンネル登録」をしてみてください。

support.google.com

オンライン授業のための情報まとめ

これから日本でオンライン授業をやるとしたらどういう形で可能なのか、ツィッタをながめていて得られた情報をまとめてみました。(これから徐々に追記していきます)

単位認定するには?

基本的に、送受信双方が同時通信に対応できるのであれば、あとは現実的な工夫でなんとかなりそうです。(でもご自身でもきちんと確認してください!)

という感じです。わかりやすくまとめられたスライド資料もあります。

で、「終了後速やかなサポートと意見交換の場」というのは、たとえばこういう感じのようです。

同時配信の設備って!?

筆者のおすすめはZoomというソフトです。双方向ビデオ会議がかなり楽にできます。

東大DHの大向先生のご協力により、これを使うとどんな感じでできるか、という動画を作ってみましたので、まだあんまり使ってみたことがない人はご覧になってみてください。なお、動画では会議用マイクスピーカーを 使っていますが、ノートPC内蔵のマイク&スピーカーでも通常は十分に対応できます。ここでは、動画収録のために敢えて会議用マイクスピーカーを使用しています。

www.youtube.com

スマホやタブレットから参加するとどういう風にみえるか、という動画も作ってみましたので、受講生側からどう見えるのか気になる向きはこちらもご覧ください。

https://www.youtube.com/watch?v=ptCG41MD57Y

なお、実際に使う場合には、こちら⇓など、きちんと使い方を紹介しているサイトをご覧になってからにしてください。

気になる料金については、この時期は教育機関向けに無料プランを用意しているようです。

有料になっても、ホスト側が月々2000円くらい払えば、受講生側は100人まで無料で参加できるプランがあります。

zoom.us

月々2700円で300人まで参加できるプランもあるようで(ただし、10ホスト分以上のまとめ買いが必要なようで、実際は月々27000円からになるようです)、多くの大学の授業はこれくらいで対応できると思いますが、大学単位で加入している場合もあると思いますし、 これから加入する大学もあると思いますので、今回の無料プランを利用しつつ所属大学の動向を注視しておくのがよいのではないかと思います。

学生の負担が!

そもそも、

という問題があるので、ゼミ単位くらいならなんとかなったとしても大人数の授業の場合には 全員きちんと参加できる環境があるかどうかを確認する必要がありそうです。

その上で、ですが、パソコンで何らかのソフトを使わないとできないような 内容でなければ、スマホかタブレットがあれば大体大丈夫ですので、そこまで行ければ あとは授業の組み立て方次第で対応できる授業もあるでしょう。ただ、ネット接続料金が それなりにかかってしまうので、使い放題プラン的な契約をしていない限り なかなか難しいことになりそうです。この点もなんらかの配慮が必要そうです。

こんなとき、たとえば、孫正義さんが「コロナ対応期間中のオンライン授業時間分の無料SIMカード、すべての学校を対象に配りますよ」と言ってくださったら、 自分の回線全部ソフトバンクに乗り換えて一生使いますけど、どうでしょうかね?

現実的には、「距離を離して座れるようにしたパソコン端末/タブレット端末席」などを図書館やラーニングコモンズのような ところにたくさん配備してそこには来てもいいようにするとか、パソコン端末室で距離を離して座ってもらうようにするとか、wifiは用意されているところが 今時は多いでしょうから、端末は用意せずともパソコン/スマホ/タブレットのいずれかを持ち込んでもらって良いあんばいに着席してもらう、 という感じでしょうか・・・。これはなかなか難しいところです。

著作権が心配!

受講生のみを対象に、ライブ配信の中での利用であれば、著作権者の許諾なく著作物を利用できるようです。

fd.code.ouj.ac.jp

www.kknews.co.jp

ただし、「「主会場」での授業が「副会場」に同時中継されている場合に」限られるようですので、その点もご注意ください。

www.bunka.go.jp

<オンデマンド配信の場合はちょっと大変です!>

「がんばって取り組んだオンライン講義を録画したのだし、割とうまくいったような気がするから学生達がいつでも復習できるようにオンデマンド配信しておこう」と 思ってしまうのは人情ですが、それはいきなりハードルが高くなります。

current.ndl.go.jp

上記のサイトにも説明されているように、先日の著作権法改正によりオンデマンド配信の場合にも対応できるようにするための制度が用意されつつありますが、まだ実施段階には至っていません。 (実施段階に至ったとしても、お金を払わねばならない上に契約が必要、かつ、契約範囲でしか対応できないために契約範囲の確認という業務も発生しそうで、 個々の教員の努力でなんとかなるレベルかと言えばちょっと難しいです。大学単位とか大学コンソーシアム単位等での対応になるのではないでしょうか。) ただし、今回の状況にあわせて緊急避難的な措置が一部で行われています。

以下の頁を見ると、一般社団法人授業目的公衆送信補償金等管理協会(SARTRAS)の「声明」を受けて、参加団体が 徐々に対応を表明しつつあるようです。

新型コロナウィルス感染症対策に伴う学校教育におけるICTを活用した著作物の円滑な利用について | 文化庁

今のところは、上記のように対応を表明してくれている団体が管理する著作物以外は個別に著作権利用許諾を得るしかないようです。

向いてない授業もあるのでは?

まだあんまりあがってきてませんが、モノを実際に扱う授業だけでなく、対面での体験が重要なものも厳しそうです。

特に、初年次ゼミが挙げられています。

他にも色々あるようですので、少しずつリストアップしていきますね。

欧米出羽…

こういうとき、つい気になってしまう「欧米」ですが、欧州は色んな国・文化があってそんなに先進的でないところも結構ありますし、米国の大学も結構色々のようです。

米国の有力大学の多くはオンライン授業に移行するようです。ただ、授業料だけで年間300-500万円くらいとっているようですので、日本の大学とはできることが全然違います。学生10人あたり教授なら1~2名分、助教なら3~6名分くらい違いますし、その財力を以て教育・研究支援職の人達もたくさん雇っているので、状況が全然違います。メディアを見ていると有力大学の話ばかり伝わってきますが、それほど有力でない大学教員の知人の話を聞いていると、教員や学生のIT環境に問題があって難しい、という話が出ていました。

欧州の大学の場合、学費無料や安めの設定をしているところもある一方、ITインフラが脆弱なところも結構あったりして、全体として語るのはちょっと難しいような感じがしております。

我々は我々で、できることを着実にがんばりましょう。

「ネットで国際会議」に向き合ってみよう

このところ、COVID-19のために世界中で会議が中止・延期になってきています。かく言う筆者も、2月末くらいからほとんど出ずっぱりだったはずの予定がほぼなくなってしまい、自宅か職場近辺(自転車通勤)をうろうろしております。

イベントの中には、情報処理学会全国大会のように、大規模学会であるにも関わらずオンラインで開催してしまう例もでてきていて、さすが情報処理学会、と圧倒されるところです(身内褒めです)。

sites.google.com

その少し前ですが、筆者は、3月上旬に、東京大学大学院の人文情報学拠点(いわゆるデジタル・ヒューマニティーズの教育研究をしているところ)のゼミで一緒に研究をしてきた小風尚樹氏と、ボストン近郊のマサチューセッツ州ノートン市にあるWheaton Collegeで開催されるワークショップに呼んでいただいて講演をする予定がありました。Wheaton Collegeには現在、デジタル歴史学の代表的な研究者の一人でありTEI協会の理事長をしておられる Kathryn Tomasek先生がいらっしゃり、これまでにも共同でデジタル歴史学に取り組んできており、その一環としてのワークショップでした。

wheatoncollege.edu

しかしながら、3月上旬ということもあり、直前で出張をキャンセルすることになりました。そこで、ご相談の結果、ビデオ会議システムの雄、Zoomを用いて遠隔講義を実施することになりました。遠隔ということもあり、小風氏の発表に限って実施していただきましたが、先方は20人ほどの参加があり、それほど大きくないカレッジで、"Stakeholders in the British Shipbreaking Industry"というテーマで、しかもデジタル歴史学、というマニアックな内容にしてはなかなか人が集まってくださり、質疑応答も盛り上がりました。それまで会ったこともなかった人から受ける興味深い質問、という、国際会議ならではの体験が自宅にいながらにしてできたという経験は私にとってはなかなか新鮮なものでした。

ここで思い出したのは、(ここの2段落は筆者の思い出話ですので、興味がない方は飛ばして次の次の段落に行ってください)かつて筆者が担当していた遠隔講義の話です。もうずいぶん古い話になりますが、2001年10月に山口県立大学に着任した際、頼まれていた仕事の一つは、少し離れた山口大学とを結ぶ遠隔講義システムの構築と運用管理でした。まだ光ファイバー網が県内に張り巡らされ始めたところで、その目玉事業の一つだった(ので、開始された際にはセレモニーがあって地元の新聞の一面に載りました)。遠隔講義システムは、専用に開発されたもので、100席以上ある学生用机にはそれぞれマイクが装備され、講師用机に配備されたタッチパネルに座席のアイコンがずらっとリストされて、いずれかの座席のアイコンをクリックするとその席についている学生の顔がカメラでクローズアップされて(これは事前に各座席の位置がプリセットされている)、発言を許可する、という風になっていました。諸々あわせて1500万円かかったらしく、私が着任した時はすでに設置作業が開始されている段階で、かなり大がかりなシステムでした。

 当時難しかったのは、これで実施された授業を制度的にきちんと単位化できるようにすることと、これを使って授業が可能な授業とその担当講師を見つけることでした。そこは端折るとして、結果として、私も授業を1コマ配信することになりました。いわゆる一般教養+工学系向けの授業として、工学倫理の授業を配信しました。情報倫理をやっていたので工学倫理もできるだろう、という話になったのでした。当時の単位認定基準をクリアするのに色々な工夫があり、結果として、手元に100人、先方に150人くらいの授業として展開する形になりました。各座席に用意されたマイクにはY/Nのボタンも用意されていて、そのボタンを使ってアンケートを随時とって、それをグラフで画面に表示できるようにもなっていました。慣れた頃には、アンケートの結果⇒学生に詳細を聞く⇒それに基づいてその場でアンケートを作成、というようなこともしていました。専用システムで「あちらの部屋の全体」を見るのと「各学生の座席に注目する(各座席のマイクで音も拾える)」がさくさくと切り替えられるようになっていたので、私語をしていそうな学生の席にあわせて私語をしているかどうか確認してちょっと注意をする、といったこともできていました。(今はどうかわかりませんが、当時は私語があると授業後や授業評価で「どうして私語を注意しないのか」というクレームが学生から出ていたことがありましたので)。そこで働いていたほとんどの期間、前期も後期も1コマずつそういう授業を続けたことになりますが、当時は専用ハードウェアが必要だったものが、今はそれとほとんど同じことがソフトをインストールするだけでできてしまうというところに技術の進歩を深く感じたのでした。特に、カメラ位置のプリセット、という話が各人のノートPCやタブレットについたカメラで対応できるようになったという点(その背景にある諸々の技術進歩)に圧倒されています。

 さて、思い出話はともかく、今回、Wheaton Collegeでのワークショップで痛感したのは、もう、「海外出張旅費(を払えるほどの研究費)を持っていない」ということがディスアドバンテージにならないのではないか、ということでした。Zoom自体は2年前くらいから使っていて、特に欧米の人達と会議をするのによく使っていましたが、ちゃんとした研究発表の場で、発表者がZoomで発表する様をZoom経由でリアルタイムに見るのは多分これが初めてでした。それまでもSkypeでは結構やっていましたが、Skypeは一対一が基本で、一対多だとあまりうまく動いてくれなかったり、音が途切れやすかったり、結果として質疑応答があまりうまくできなかったり、ということがありました。ソフトウェアの違いというよりネットワーク環境や各種ファシリティの進歩の結果かもしれませんが、今回Zoomで実施した国際ワークショップは、あまりにも自然に、発表が行われ、質疑応答がなされました。

 これまでもすでに可能ではあったことですが、今回のように、情報処理学会全国大会のようなところでもビデオ会議システムで開催されたことで、認知度は一気に高まったと思います。海外でも、このようにしてやむにやまれずZoomによる会議が実施される動きが広まれば、こういうことにはやや後ろ向きな学術界でも、ビデオ会議システムでの公式な国際学術大会のようなものを開催するということが現実的になっていくことでしょう。その結果、「旅費がとれなくても国際会議で発表ができる=(遠くの国にいるあの人に発表を聞いてもらってコメントをいただける AND 世界のどこかにいる共通の関心を持つ見知らぬ人と話ができる)」ようになるのだとしたら、いよいよ、かなりのゲームチェンジが行われるようになるのではないか、ということを実感したところでした。良い発表論文さえ書ければ、研究費をとれてなくても、世界のどこかにいる似たような関心を持つ人を見つけて話をすることができる、というのは、国際会議に行くようになって初めて似たような関心の人達をたくさん見つけることができた自分としても、非常に魅力的な話です。

 これはすでに多くの人が気づいていることだと思いますが、これまで、国際会議で発表するためには、出張旅費を確保するための予算を自ら取れるか、あるいは、予算をとれる先生についているか、といったことがほぼ必須でした。つまり、研究費をどうにかすることについてのそれなりの知識(とおそらく経験)がなければ国際会議発表は非常に難しいことで、それゆえに、それができる程度の各種知識と経験を身につけることが多くの分野の研究者にとっては必須事項であり、そうでなかった分野も国際化を求められるなかでそうせざるを得ないようになっていきそうだったのですが、むしろ、それがなくても国際会議発表ができるようになってしまう未来が、すぐそこにやってきた、ということになります。

 そして、そうすると気になるのは、以下の2つの事柄について説明を求められるようになるのではないか、ということです。

  1. その国際会議に敢えて旅費を支出してリアル参加する理由

  2. 旅費なしで国際会議発表できるのにしない理由

1.に関しては、実は結構説明が難しく、国際会議は、発表の後にも議論を続けて、一緒にご飯を食べたり何かのトラブルを一緒に解決したりしながら親交を深めることで、共同研究を始められるような(=一緒に研究助成金を申請するような)信頼関係を作ったりする面があるので、基本的に、旅費があるならなるべく国際会議には参加して、日本人の仲良しだけで固まらず、なるべく現地の人とか、別の国の人のオープンなコミュニティに混じってご飯を食べたり話をしたりすることを周囲には推奨していますが、「敢えて旅費を支出する理由」として「関係者と親交を深めるため」というのが広く認められるか、というところが気になります。研究を主にしている大手大学なら無問題だと思いますが、大学によってはそういうことを聞いてくる事務方があるかもしれません。そのような、当たり前すぎて説明する必要があると思ってなかったようなことを聞かれると、割と心が折れやすいので、それに対する説得力のある説明をきちんと用意しておかないと、早晩、あちこちで悲嘆の声を聞くことになるかもしれないと、少々危惧しています。

 やや余談ですが、このことに薄く関連して面白い体験が一つあります。これも偶然に小風氏関連なのですが、小風氏が主宰する東京デジタルヒストリーという学生団体が2年前にシンポジウムを開催した際に、登録者限定でZoomによる配信を行いました。その時私はたまたまロンドンに滞在しており、ロンドンからZoomでつないでみなさんの発表をおうかがいしていたのですが、偶然にも他に2名、ロンドンからZoomで閲覧しているという人がおり、うち一人はそれが初対面だったのですが、Zoomのチャットで意気投合して3人で一緒にご飯を食べに行った、ということがありました。Zoomは視聴している間に他の視聴者とプライベートチャットができるため、そのようなやりとりを通じて、現地の会合に参加していなくても、関心を共にする人と親交を深めることができたというのはなかなか面白い経験でした。

 2. については、これまでも国際ジャーナルに論文投稿できるのにしてない、という批判はあり得たわけですが、ジャーナルは一定の長さのものが必要な上に査読も厳しく、分野によってはそんなに種類も多くなくて適した投稿先が見つからない、といったことも言えたかもしれません。しかし、旅費を出さずとも国際会議で発表できる、ということになると、事情はずいぶん変わってくるでしょう。国際会議はジャーナルよりも間口がずっと広いですし、十分にまとまっていない挑戦的・実験的な発表を受け入れているところもたくさんあります。国際会議発表を抵抗なくできる人であれば、今の流れだと、旅費用の研究費を取れる人だけでなく、取るのが苦手な人でも、国際会議発表をどんどん増やしていくでしょう。そこでは、国際会議発表をしてない人との研究業績の差がますますくっきりと見えるようになってしまって、「なぜ国際会議発表もしてないのか」ということについての説明を求められる世界が間近に迫っているように思われます。

ただ、ここから、国際学術ジャーナルがたどった道筋(業績稼ぎのために泡沫的なジャーナルが乱立した)を振り返ってもう少し想定を進めてみると、2. のような状況を踏まえ、いわゆる泡沫的な国際会議が乱立することが予想されます。Zoom等でのインターネット上でのビデオ会議は限りなく大量に同時進行させることができますので、早晩、とんでもない数の「国際会議」が開催され、「国際会議発表」が量産されることになるのだろうとも思います。もちろん、業績評価の局面では、国際会議発表の評価はジャーナルに比べるとそんなに高くない場合が多いので、そういう意味ではジャーナルのようなことにはならないかもしれませんが、評価指標的なものとしてはあてにならないような、せいぜい、一定数、コンスタンスにこなしているかどうかを見る程度のものになってしまうのかもしれません。

ちょっと後ろ向きなことばかり書いてしまいましたが、それでもやはり、先週のWheaton Collegeでの小風氏の発表で感じた、「きちんとした場を作った上でのビデオ会議による発表が太平洋を越えてもたらした臨場感」は、今後の学術界の新しくポジティブな可能性を想像させずにはいられないものがありました。

ちなみに、Zoomというソフトウェアは、今のところ、手軽にビデオ会議を始めたい時にはとてもおすすめです。パソコンでもスマホでもタブレットでも簡単に使えます。パソコン同士だと、ホスト側が「招待URL」を送れば、参加する側はクリックするだけでGoogle Chromeにて会議に参加できます。スマホやタブレットだとアプリをインストールする必要はありますが、他のアプリの操作が普通にできるなら特に難しいことはありません。特にお勧めなのは、ホスト側が登録していれば、参加者側は登録などせずとも使える、という点です。参加者側の負担が非常に少ないです。筆者はこれまで、会議だけでなく、海外に行っている大学院生の論文指導にも使ってきました。

Zoomは、ホストを担当する人がユーザ登録をすれば無料で使えますが、その場合、参加者100人まで、40分で切れて再接続しなければなりません。40分ごとに再接続しても問題ないのであれば無料でも問題ないと思います。また、1対1での通信なら、無料でも時間制限なく使えるようです。

筆者のおすすめは、「プロ」プランです。米ドルで支払うと月々14.99ドルで、参加者100人まで、24時間までのミーティングができるようで、録画やその他細々とした便利な機能がついてますので、大人数でなければこれで十分ではないかと思います。ゼミ等を運営している教員であれば、この金額を支払うのはそんなに難しいことではないでしょうし、何らかのコミュニティであれば皆で分担するとかなり安価になりそうです。

Zoomの料金体系については、詳しくはこちらをご覧ください。

つい、Zoomをおすすめしてしまいましたが、他にもSkype やHangoutなど、類似の便利なサービスがありますので、色々試してみていただいてもよいかもしれません。

というわけで、筆者の最近の体験が、多少なりともお役に立つことがありましたら幸いです。

Apache Solrの検索でtoo many boolean clausesと言われた時

細かい話で恐縮ですが、自分のメモも兼ねて。

Apache Solrで作ったインデックスに細々検索をかけて、少し他の人にもチェックをお願いしたら、少し長めの文字列で検索した時に以下のようなエラーが出るという報告をいただきました。

{
  "responseHeader":{
    "status":400,
    "QTime":82,
    "params":{
      "q":"title:初期仏典における十支縁起説の成立"}},
  "error":{
    "metadata":[
      "error-class","org.apache.solr.common.SolrException",
      "root-error-class","org.apache.lucene.search.BooleanQuery$TooManyClauses"],
    "msg":"org.apache.solr.search.SyntaxError: Cannot parse 'title:初期仏典における十支縁起説の成立': too many boolean clauses",
    "code":400}}

一文字減らすと問題なく検索できるという状況で、別の文字列だともっと長くても大丈夫だったので、おそらくcharfilterで実際の検索式が長くなりすぎているのでは…と思ったものの、検索式をいじることはできない(というか、気合いがあればできますが、その後のアップデートに対応できなくなるので避けるべし)ので、設定でなんとかならいあものかと調べていたところ、以下のサイトをみつけました。

yomon.hatenablog.com

なるほど、solrconfig.xmlか、最初に読み込まれるコアのものをとりあえず書き換えればいいのか、と思ってsolrconfig.xmlを見てみたところ、

 If this per-collection limit is greater then the global `maxBooleanClauses` limit specified in `solr.xml`, it will have no effect, as that setting also limits the size of user specified boolean queries.

などとなっていましたので、solrconfig.xml中のmaxBooleanClausesの値を増やした後に、solr-8.4.1/server/solr/solr.xml の方も

<int name="maxBooleanClauses">${solr.max.booleanClauses:2048}</int>

という風に値を増やして、bin/solr restart。これで動くようになりました。ほっ。