TEI の検索結果:

海外の文化資料系の開発者コミュニティと技術トレンド

…g members.tei-c.org iiif.io www.euromed2018.eu 隔年・数年に一度開催: pro.europeana.eu 他にも大きめのものがあるかもしれませんが、海外先進国で進められている文化資料デジタル化の雰囲気を味わったり、今まさに議論されていることを把握したかったりした場合は、こういう会合に顔を出してみるとよいのではないかと思います。 また、日本でも、文化資料関連のデジタルアーカイブ方面の活動が、こういった流れにうまく対応できるようになる…

「TEIで青空文庫」勉強会を開催します

TEI

…ーヨークにて始まったTEI (Text Encoding Initiative)の取り組みは、2016年の東アジア/日本語分科会の設立、2018年、30年の歴史の中で初の欧米外での年次大会開催に至り、欧米の外への対応をより本格化しつつあります。東アジア/日本語分科会では、ガイドラインを日本語で便利に使えるようにするための取り組みを続けてきておりますが、それまでの取り組みが一つの区切りを迎えました。そこで、次の取り組みとして「TEIで青空文庫」勉強会を開催いたします。 青空文庫…

欧米の文献学者によるデジタル文献学の最先端と欧州デジタルアーカイブの最先端

…米で長らく担ってきたTEI (Text Encoding Initiative) 協会が、今回初めて、欧米を離れて日本で年次大会を開催します。欧米の文献学者(IT専門家ではなく)が主導するデジタル文献学を日本で知ることができるという、絶好の機会になります。年次大会の事前申し込みは締め切りましたが、当日申し込みも可能ですので、ぜひお越しください。 無料公開国際シンポジウムをもう少し詳しく これにあわせて開催される日本デジタル・ヒューマニティーズ学会の年次国際学術大会JADH20…

デジタル校訂テクスト作成のMOOCに日本語字幕がつきました

…itiative (TEI) Guidelinesは、それを実現するための記述方法であり、欧米の文献学ではすでにそういうことが普通にできるようになっています。たとえば西洋中世写本研究のカリキュラムにも、この記述の仕方が取り入れられ、若手研究者にとっては、得手不得手はともかく、リテラシーのレベルでとりあえず学んでおく技術ということになっているようです。 さて、少し話を戻しますと、筆者としては、基本的には「学術編集版」に賛成なのですが、しかしながら、今度は、日本語の「編集」という…

IIIF, Mirador, TEI, Word2vecを活用した仏教学研究教育サイト「SAT2018」

… Mirador, TEI, Word2vecで、隠れたキーワードはWebコラボレーションです。 1994年に始まったSATプロジェクトでは、比較的初期の段階から、入力が済んだ順にテキストデータを公開していましたが、2008年に最初の全文検索Webサイトを公開した時は、大正新脩大藏経約1億字の全文検索や辞書検索、論文検索機能などが中心であり、2012年/2015年の改定では仏典画像の自前公開やリンク、パラレルコーパスなどが新規追加されました。 今回、2018年版は、ネタが多す…

Omeka IIIF ToolKitを少し便利に

…会(IIIF講習会やTEI講習会など)は着々と実施しておりまして、12月には沖縄県立芸術大学と琉球大学附属図書館でもIIIF講習会を実施しました。その後引き続き、基本的にはSAT大蔵経テキストデータベースの再構築作業を続けているのですが、機能が多すぎてまだ公開できるところまでたどり着いておりません。もう少ししたら公開できると思いますので、もうしばしお時間をください。 それはともかくとしまして、今回は、東京大学の「文化資源デジタルアーカイブ特論」という3日間の集中講義のなかでO…

デジタルアーカイブにおけるテクスト資料の扱い: oXygenで日本語解説付きTEIガイドラインを利用する

TEI

…扱い」ということで、TEIガイドラインの解説をしてきました。しかし、実際に使ってみる話をまだ全然書いておりませんでしたので、今回は、実際に使ってみる手順のはじめのところについてご紹介したいと思います。このブログの読者の方々には日本語解説付きの方がわかりやすい人が多いと思いますので、日本語解説付きで利用するにはどうしたらいいか、ということもここで御説明しておきます。 まず、TEIガイドラインをテクスト資料に適用するためには、XMLエディタを利用することがほぼ必須です。Windo…

デジタルアーカイブにおけるテクスト資料の扱い: 図書館向けのTEI活用法

TEI

…こまで、このブログでTEIに関する話を読んできていただくと、「そんなに細かいタグを付けるのは大変だ」と思ってしまわれる人も結構おられるのではないかと思います。しかし、TEIでは、必ずしも細かく深いタグをつけていかねばならないというものではなく、浅いマークアップ(タグ付け)でもTEIであると言えますし、それでも一定の機能を果たすことはできます。 特に、こういったことについて関心があるのは、やはり図書館の方々のようです。デジタル化はするが、内容にあまり深入りすることははばかられる…

デジタルアーカイブにおけるテクスト資料:TEIでの電子版と元資料の書誌情報

TEI

…何度かご紹介しているTEI (Text Encoding Initiative)に関するご紹介の続きです。 先週、カナダのモントリオールにて開催されたDigital Humaities 2017というカンファレンスで、TEIコミュニティが賞をもらいました。そこで受賞記念スピーチがあったのですが、1980年代終わりにTEIがどういう状況で生まれてどういうことを目指してきたか、ということが創始者達によって語られました。詳しくは別の機会にご紹介させていただきますが、ここで一つ、なる…

青空文庫の『走れメロス』をTEIで

TEI

…・前々回に引き続き、TEIの話です。前回、ごく基本的なマークアップでもOKだということを少し書きましたが、それでは試しに、ということで、青空文庫の『走れメロス』をTEIにて書いてみました。それがこちらになります。 特に説明するようなことはあまりないのですが、TEIのタグ付けルールに従って、本文にパラグラフごとに<p>タグをつけていっているのと、書誌情報のところで、青空文庫としての入力者情報や訂正情報などを書いています。これには、電子版としての位置づけをどう考えるかによって色々…

TEIへの取り組み方

TEI

TEIに取り組むには、一人で取り組むか、プロジェクトとして複数人で取り組むか、という二つのやり方があります。一人で取り組む場合には、とにかく自分で頑張ってみればいいのですが、プロジェクトとして複数人で取り組む場合には、まず、役割分担をする必要があります。「TEIで用意されているタグ(エレメント・アトリビュート)のうち、どれをどう使うか」ということを決めるという役割と、それに従ってマークアップをしていく役割をわけておかねばなりません。これは文化資料に関わる他の規格の多くも同様か…

「デジタルアーカイブ」で全文テキストデータをうまく継承していくには

TEI

…語での解説が手薄な、TEI (Text Encoding Initiative) に関する話を、このブログにて数回にわけてご紹介していきたいと思います。 TEI (Text Encodnig Initiative) という呼称は割と広く使われていますが、正確に言えば、TEI協会がTEIガイドラインを作成して、テキストデータの共有に関して共有すべき事柄を提示する、という形になっています。そのいずれもがTEIと呼ばれることがあります。 TEIは、1987年から欧米で作られてきてい…

写本や貴重書等の書誌情報の書き方について(TEI/XMLのご紹介)

TEI

…、人文学資料向けに TEI (Text Encoding Initiative)というガイドラインが公開されています。これは、人文学資料向けというくらいですので、希望すれば非常に細やかな構造化が可能で(しかし浅い構造化もできて)、対応可能な分野も様々です。(たとえば、コーパス言語学では各単語の属性に着目しますが、古典文献学ではどちらかというと書誌情報や異文に着目する、という風な違いがあります。) このTEIガイドラインでの構造化は、現在はXMLで行うのが主流になっています。T…

国文学研究資料館の古典籍等のデータベース群(の一部?)にパーマリンク的なものがついた模様

…きていて、IIIFやTEI、Unicode等に入れ込んでいるのはそれを解消するための土台を皆で共有できるようにするということもあるのですが、まだ完全とは言えません。一方、古瀬先生が責任者として動かしておられた仕事は、事業として確実に動かせる形を目指して整備され、古瀬先生が亡くなった後にも着々と進められ、ついに公開にまで至り、とても地味ですが、しかし、国文学のみならず、日本文化研究全般を大きく前進させる1歩を刻むことになりました。それだけでなく、色々なデータベースがシステムの全…

「デジタルアーカイブ」を考える―「日本」がそのアイデンティティを取り戻すために

…々な展開があり得る。TEIコンソーシアムに日本語SIGが設立されることになったのもこの文脈からのことで、ただ受容しようとしてうまくいかないから終わり、ではなく、グローバル側に対してローカルの要求をきちんとした手続きを経て提示していくことが肝要であると思っている。それは、ローカルにとってのメリットだけでなく、グローバルの価値を高めることにもつながり、結果としてローカルも含めた全体の価値が高まっていくことにもなる。それを理解しているグローバルなコミュニティには、積極的に参加し、協…

「デジタルアーカイブ」におけるテクスト資料の構造化・マークアップの国際デファクト標準、TEIガイドラインを作っているTEI協会に日本語資料を扱う分科会ができました

…張が行われています。TEIについては、いくつか記事を書いたことがありますので、よかったら下記のURLなどをご参照ください。 TEIとoXygenの初歩 | Digital Humanities notes in Japan http://nlp.nii.ac.jp/tawc/papers/W05_nagasaki.pdf しかしながら、日本語資料への対応は未だ十分ではありません。これは、このコミュニティに参加する日本人が少なかったことが直接の大きな理由なのですが、なぜ参加する…

「デジタルアーカイブ」における日本語古典籍+翻刻とIIIF、そして皆様の取組み

…かしようという動きがTEI関係で始まっておりまして、個人的にも、TEI とIIIFをいかにうまく連携させるかということに取り組んでおります。基本的に、タグをつけてもらったら、それをTEI P5 Guidelinesの<sourceDoc/>に自動的にマッピングしてしまって、さらに、リニアなテクストにも変換するというオーソドックスなアプローチを考えています。それについては9月末にウィーンで開催されるTEI会議で報告する予定なのですが、国内でもいずれどこかでご報告させていただけた…

「デジタルアーカイブ」における画像共有のための国際規格IIIFについてのご紹介(続)

…るを得ず、IIIFやTEIなど、日本ではまだなじみの薄い技術にも取り組んでいるようである。これは大変ありがたいことで、NTTデータの英断には深く感謝している。 たとえば、バチカン図書館のサイトで左上のアイコンをクリックすると、下記のように書誌詳細情報が表示される。この中に「IIIF manifest URI」というのが表示される(赤枠をつけたところ)ので、これをコピーすれば、他のIIIF対応ビューワで表示できるようになる、というわけである。(manifest URIについては…

ワークショップ (デジタル/アナログ・ヒューマニティーズ)によせて:パブリックドメイン資料の活用と大学図書館連合への参画について

…ィーズ」というのは、TEIガイドラインをめぐる議論等を通じて、まさにDHの努力の半分かそれ以上が捧げられているような歴史のある重要な事柄なので、ぜひそこを踏まえた上での建設的な議論を期待したい。 さて、さらにうれしいのは、テーマになっている話としてEEBO-TCP、ECCO-TCPが採り上げられていることである。TCP (Text Creation Partnership)というのは、有料(かつかなり高額な)英語文化資料データベースであるEEBO (Early English…

人文学に役立ちそうなプログラミングの勉強会(中級編)

ここしばらく、TEI/XMLの勉強会を全国各地で開催してきましたが、そろそろ次の一歩に進んでみようかと思います。題して「人文学に役立ちそうなプログラミングの勉強会」です。といっても、「次の一歩」というほど今までの勉強会を踏まえたものになるかどうかわかりませんが、とりあえず今回は試しとして、一つはhttps://sites.google.com/site/opuoageijutsu/link/1の検索システムの解説&こういうものを簡単に作れるようになるための基礎知識(?)の習得…

デジタル・ヒューマニティーズ(デジタル人文学、人文情報学、etc...)がよくわからない人のために

…有しようということでTEI (Text Encoding Initiative) ガイドラインを皆で作成・改良していこうという動きがかなり広まっているようです。XMLですと、いわゆるデータベースの機能として提供されるような内容も含めて、かなり細かい注釈的な事項も記述・共有できるということが広まっている理由の一つなのでしょう。我国では、どちらかというとまだTEIのような考え方は広まっていないような感じがしますが、せっかくすでにあるので、これをうまく日本語資料向けに拡張できればと…