人文学データにおけるジェンダーの記述手法がTEIガイドラインに導入されるようです

先週は、イギリスのニューカッスル大学にてTEIカンファレンスが開催されていました。TEI (Text Encoding Initiative)というのは、人文学のためのテキストデータを構築するために1987年から策定され続けている国際的なデファクト標準のガイドラインであり、それを策定する団体のことでもあります。前者をTEIガイドライン、後者をTEI協会(Consortium)と言います。

このTEIガイドラインの詳細については、最近、日本語の解説書『人文学のためのテキストデータ構築入門』(文学通信)が出まして、アマゾンのKindleでも読めますので、よかったらぜひご覧ください。お金を出すのは大変だけどなんとかして読みたいという場合は、公開前提のレビューを執筆してもよいのであれば、「『人文学のためのテキストデータ構築入門』刊行記念レビューキャンペーン」から申込んでいただければ無料で読むこともできます(まだ少し枠が残っています。先着順です)。

www.amazon.co.jp

あるいは、レビュー書くのも大変だから避けたいけどなんとかしてTEIガイドラインについて知りたいという場合は、単にグーグルで「TEIガイドライン」で検索していただくと、上記の解説書に含まれている原稿の(改稿前の)大部分の原稿が論文やエッセイの形でWebで色々読めますので頑張って探してみてください。

さて、このTEIガイドラインでは、とにかく人文学資料のデータを「あとで機械処理しやすいように」記述するためのルールを様々に用意しています。これに準拠して記述しておけば、「この手紙はどこからどこにいつ出されたのか地図年表上にマッピングする」とか「この古典籍はどこの所蔵者の手を経てここに来ているのか」、あるいは「戯曲の登場人物達はどの幕で登場しどこで亡くなるか、そして亡くなってからも登壇発言するのは誰か」といったこと、さらには「校訂テキストの各対校本を脚注の校異情報から再建して各対校本のテキストを並べて読めるようにする」等々、色々なことを可能になります。(この書き方も含めて上記の解説書には色々なことが解説されています)

そのようなことで、「どういう要素をどのようにして記述するべきか」ということが常に議論され、その成果がガイドラインに反映されていきます。昨年、日本語のルビを記述するためのルールが導入されたことは記憶に新しいですね。近年は、コンピュータやネットの高速化・高度化により、様々な要素の記述手法が新たに追加されるようになり、ほぼ半年に1度の新規リリースが行われています。

次回リリースは10月の予定なのですが、そこでの目玉として先週のTEIカンファレンスで発表されたのが、ジェンダーの記述手法です。これまでも性別の記述はできていたのですが、生物学的性別とは異なる位置づけとしてのジェンダーは、別の記述手法を用意した方がよいということになり、これまでの<sex>というエレメント(タグ)に加えて<gender>が提供されることになりました。

<gender>が導入されたことで、たとえば、女性に生まれ変わったり気持ちまで女性になったりしたことのあるヴァージニア・ウルフの小説『オーランド―』の主人公は以下のように記述できることになったようです。

<person xml:id="orlando">
  <persName>Orlando</persName>
  <sex from="#ch1" to="#ch3" value="M"/>
  <sex from="#ch3" value="F"/>
  <gender from ="#ch1" to="#ch3" value="M"/>
  <gender from ="#ch3" to="#ch3b" value="NB"/>
  <gender from ="#ch3b" value="W"/>
</person>

ここでは、第三章までは身体的には男性でそれ以降は女性、ジェンダー的には、第三章までは同様だが第三章の途中までは不明瞭になり、第三章の途中からは女性になる、ということが記述できています。このルールを使って色々な人物や資料を記述すれば、面白いデータが作れるようになるでしょうし、そもそも、その点を意識しながらデータを作るようになれば、ジェンダーへの理解もこれまでとは少し違ったものになるのではないかとも思います。

<追記>

念のため追記しておきますと、この<gender>タグはTEIガイドラインでは必須のものではなく、利用するかどうかについては、あくまでも、タグ付けをする人やタグ付けの方針を策定する人の任意です。このタグが必要ないという場合も多いと思いますし、敢えてそこまでやらないということもあるでしょう。ただ、そういう選択肢が提示されているかいないか、ということが重要なポイントかと思っております。

それから、<gender>を採用することにした場合には、このタグは本文中に埋め込むことはおそらくはほとんどありません。文書中のどこかに人物情報を書いておき、そこに<gender>タグを記載することになります。そして、本文中には「人名」を指すタグとともにこの人物情報を参照する属性をつける形になります。たとえば、上記の解説書での事例では<back>の中の<listPerson>の中に人物情報が書かれています。こちらでそのサンプル(漱石書簡)が閲覧できます。たとえば上記の<persName corresp="#orlando">オーランドー</persName>氏の情報を指す場合は…という風になります。

</追記>

この件についての詳しい議論の経緯や情報は、メールマガジン『人文情報学月報』の10月号に掲載予定ですので、よかったらこれを機にぜひ『人文情報学月報』の読者登録(無料)をしてみてください。