TEI

TEI/XML利活用の基礎:PythonでTEI/XMLファイルの地理情報を地図上にプロットする

プログラミング言語Pythonは、自然言語処理のライブラリが充実しているので、自分のメインの言語ではなかったのですが、10年くらい前に、授業で教えられるくらいの勉強をして、授業で教えたりしていました。その後、ディープラーニングへの入口として注目さ…

人文学のためのテキストデータ構築入門を教科書として使う場合

『人文学のためのテキストデータ構築入門』は、表題の通り、人文学のためのテキストデータ構築全般についての入門書という位置づけの本ですので、教科書として使っていただくこともできます。ただし、色々な要素を含んでいますので、用途に応じて取捨選択し…

TEI準拠テキスト作成の入門セミナーを実施します

2022年10月10日、11:00~17:00(昼休みは12:30-13:20くらい)に、オンライン(Zoom)にて、TEI入門セミナーを実施します。 「人文学のためのテキストデータ構築入門」の第2部の第四章を中心に、TEIによるマークアップ手法について解説します。本で独習するこ…

シェイクスピア戯曲の文法的特徴を簡単に調べてみる

本日は、英語コーパス学会のワークショップで、「はじめてのXML」のお話をさせていただきました。コンセプトとしては、「とりあえずXMLはどういう風に良いものなのかを見ていただき、自分でやってみたい人はあとで録画をみていただく」ということで、パワポ…

日本学術会議の公開シンポジウムで人文・社会科学のデジタル研究基盤がテーマとなります

今度の土曜日、1/22に、日本学術会議の公開シンポジウム「総合知創出に向けた人文・社会科学のデジタル研究基盤構築の現在」が開催されます。 日本学術会議には「分野別委員会」があり、それぞれの委員会が分科会を設置して特定のテーマについて議論します。…

サンスクリット写本 データベースを作った話

最近、サンスクリット写本のデータベースを作りました。といっても、文字起こししたテキストデータベースではなくて、 デジタル画像のデータベースです。世間ではむしろ「デジタルアーカイブ」と言った方が通りがいいでしょうか。 一人で作ったわけではなく…

人文学向け電子テキストガイドラインTEI/XMLに準拠したファイルをPHPで処理するにあたって

人文学向け構造化ルールであるTEI/XMLガイドラインに準拠して作成したファイルは、とにかく色んな方法で処理して その都度必要な状態にして利用できるのが魅力です。それについて書き始めると長くなるので詳しくは 以下のページなどをご覧ください。 bungaku…

TEIガイドラインにルビが導入:人文学向け国際デファクト標準に沿った日本語テキストデータの作成が容易になりました

人文学向けデジタルテキスト作成の国際デファクト標準、TEIガイドラインでルビが導入されました 2月25日付けで、TEI協会が策定・公開している人文学資料のデジタル構造化の国際デファクト標準である TEI ガイドラインの version 4.2.0がリリースされ、 日本…

ケンブリッジ大学デジタル図書館の日本資料の書誌情報を視覚化してみる

TEI

本日は、第3回 日本宗教文献調査学 合同研究集会という会合でパネルディスカッションの司会をさせていただきました。 司会が自分が言うのもなんですが、大変興味深い議論が行われたようにも思いまして、ご参加いただいたみなさまのおかげで意義のある場にな…

聖徳太子御製『勝鬘經義疏』でText Encoding Initiativeを

TEI

このブログでは、長らくTEI (Text Encoding Initiative) ガイドラインについて扱ってきました。このたびは、 大正新脩大蔵経にNo. 2185として収録されている聖徳太子御製『勝鬘經義疏』をTEI(Text Encoding Initiative)ガイドラインに準拠してマークアップ…

Evasion of breathing tax: editing TEI with VSCode

TEI

This article introduces how to set up VSCode so that any user can edit TEI/XML relatively easy by free, based on a brief report by Yifan Wang who is graduate student of the University of Tokyo and junior fellow in the International Institu…

フリーソフトで快適TEI/XML(Oxygenを使わない道)

TEI

TEI/XMLは、基本的には裏側で勝手にタグがついたりそれに対応した表示が勝手に行われてくれるものであり、個別には色々なソリューションがあります。 しかし一方で、「どういうタグをつけるか」「どういう風に構造化するか(=それにあわせてどういうタグを…

「TEIで青空文庫」勉強会を開催します

TEI

人文学のためのテクスト構造化のガイドラインを策定すべく1987年、ニューヨークにて始まったTEI (Text Encoding Initiative)の取り組みは、2016年の東アジア/日本語分科会の設立、2018年、30年の歴史の中で初の欧米外での年次大会開催に至り、欧米の外への…

デジタルアーカイブにおけるテクスト資料の扱い: oXygenで日本語解説付きTEIガイドラインを利用する

TEI

ここまで、「デジタルアーカイブにおけるテクスト資料の扱い」ということで、TEIガイドラインの解説をしてきました。しかし、実際に使ってみる話をまだ全然書いておりませんでしたので、今回は、実際に使ってみる手順のはじめのところについてご紹介したいと…

デジタルアーカイブにおけるテクスト資料の扱い: 図書館向けのTEI活用法

TEI

前回記事に続けてもう一つ、デジタルアーカイブにおけるテクスト資料の扱いについての記事です。 ここまで、このブログでTEIに関する話を読んできていただくと、「そんなに細かいタグを付けるのは大変だ」と思ってしまわれる人も結構おられるのではないかと…

デジタルアーカイブにおけるテクスト資料:TEIでの電子版と元資料の書誌情報

TEI

やや間が空いてしまいましたが、先日より何度かご紹介しているTEI (Text Encoding Initiative)に関するご紹介の続きです。 先週、カナダのモントリオールにて開催されたDigital Humaities 2017というカンファレンスで、TEIコミュニティが賞をもらいました。…

青空文庫の『走れメロス』をTEIで

TEI

前回・前々回に引き続き、TEIの話です。前回、ごく基本的なマークアップでもOKだということを少し書きましたが、それでは試しに、ということで、青空文庫の『走れメロス』をTEIにて書いてみました。それがこちらになります。 特に説明するようなことはあまり…

TEIへの取り組み方

TEI

TEIに取り組むには、一人で取り組むか、プロジェクトとして複数人で取り組むか、という二つのやり方があります。一人で取り組む場合には、とにかく自分で頑張ってみればいいのですが、プロジェクトとして複数人で取り組む場合には、まず、役割分担をする必要…

「デジタルアーカイブ」で全文テキストデータをうまく継承していくには

TEI

デジタルアーカイブ学会が設立されて第一回の学術大会が開催され、ジャパンサーチ(仮称)がその姿をみせつつあるなど、デジタルアーカイブが再び脚光を浴びつつあります。しかしながら、我が国ではデジタルアーカイブは以前にもブームになったことがありま…

写本や貴重書等の書誌情報の書き方について(TEI/XMLのご紹介)

TEI

最近、メタデータの書き方について相談を受けることが多いので、今回は、写本や貴重書的な資料の書誌情報の書き方に関して、ちょっと事例を紹介させていただきます。 テクスト資料のデジタル化に関しては、いわゆるISOのような規格ほどかっちりとしたもので…