TEI の検索結果:

Scholarly primitives: 最近デジタル人文学で話題になっている話

…man先生と言えば、TEIで書いた校訂テキストをきれいに表示してくれるViersioning Machineというソフトウェアの 開発プロジェクトを率いておられたり、DHの代表的な教科書であるCompanion to Digital HumanitiesのエディタをJohn Unsworth先生達とされたりと、DH界では重要なお仕事を色々してきておられますが、最近は3Dの学術利用(=学術編集版の構築)に力を入れておられるようで、すでにこの方面のフルペーパー "Textuali…

「デジタル人文学」以前の日本の人文系デジタルテキスト研究を探訪してみる

…itiative (TEI)に関しても、一人でひょこひょこ国際会議に入っていって、鶴見大学の大矢一志先生は比較的よく参加していたのでお知り合いになることができましたが、それ以外の日本人にはあまり会うことがないまま、英語は苦手ながら中心メンバーの方々と一緒にご飯を食べに行ったりあれこれ議論を重ねるなかで徐々に雰囲気に馴染んでいったということがありました。もちろん、中心メンバーの半分くらいはADHOと重なっていたので、JADH/ ADHO関連での会合とあわせて仲良くなったというこ…

日本学術会議の提言を読んでみる:学術情報流通の現在と未来 6/n

…グ付きコーパス(主にTEI準拠) を共有する仕組みとしてTextGridが提供されて シボレス認証にも対応していたりして、なかなか重厚な感じです。 欧州全体としては、CLARINというプロジェクトで、タグ付きコーパスを集約しているようです。 CLARINは、欧州の研究インフラ事業ERICの一環として運用されているもののようで、 デジタル研究インフラのなかに人文学の「二次研究データ」がしっかりと位置づけられているようですね。 我が国もそろそろこういったところを目指さねばならない…

日本学術会議の提言を読んでみる:学術情報流通の現在と未来 1/n

…グループは 要するにTEIガイドラインの国際化という話で、どちらかと言えばデータの話でしたが、他のグループは 学術情報をめぐる人のコミュニケーションが主なテーマになっているようでした。学術情報流通は門外漢なので あまりよくわからないのですが、Scholarly communication に学術情報流通という訳語を与えたことで議論の幅が結構変わったのかもしれないと思ったところでした。 また、学術情報環境(学術情報インフラ)の整備が必要であるにも関わらず経費高騰により 最低限必…

40代後半人文系で未だにWeb開発をしている理由

…onsortium(TEI協会)では、30年前からまさにそれにコミュニティとして 取り組んできていて、最近は日本語も含め各言語文化圏の事情にあわせた対応をしていこう という流れが強まっているので、そこでの蓄積をうまくこちらにも持ってこれれば だいぶん楽ができると思います。人文学としてもエンジニアリングとしても、彼我の文化の 違いは大きく、そのまま持ってきても通用しないことが多いかもしれませんが、 その点も含めた「翻訳」を行っていくことで、なんとかなればと思っているところです。…

デジタルアーカイブやデジタル文化資源をテーマに含むオンライン授業のための資料をご提供

…決まり事:IIIFとTEI 国際的なデファクト標準とそれへの関わり方。特に、IIIFの解説が詳しい。 第6章 実際の公開にあたって 公開のための具体的な留意事項 第7章 評価の問題 デジタルアーカイブに対する評価について 第8章 研究者の取り組みへの評価の問題 研究者として取り組んだ場合の留意事項 おわりに/さらに深めたい人・アップデートしたい人に 全体のまとめとさらなる情報源 申し込み用Google Form docs.google.com 本書の内容 本書の内容につきまし…

聖徳太子御製『勝鬘經義疏』でText Encoding Initiativeを

TEI

…のブログでは、長らくTEI (Text Encoding Initiative) ガイドラインについて扱ってきました。このたびは、 大正新脩大蔵経にNo. 2185として収録されている聖徳太子御製『勝鬘經義疏』をTEI(Text Encoding Initiative)ガイドラインに準拠してマークアップしてみたものを公開いたしましたので、 構造的な側面について少しご紹介させていただきます。 これを公開している頁は以下のURLになります。 https://21dzk.l.u-t…

Web動画:Voyant-toolsで簡単テキスト分析:コロナウイルス感染症対策本部の会議資料をみてみよう

「Voyant-toolsで簡単テキスト分析:コロナウイルス感染症対策本部の会議資料をみてみよう」という動画を作って、東京大学の大向先生が主宰しておられるUTDHチャンネルにあげていただきました。 Voyant-toolsは、カナダでデジタル・ヒューマニティーズを牽引する二人の先生が開発・公開しておられる簡単テキスト分析ツールで、解説本的なものも出ています。 3年ほどまえに、このブログで採り上げたことがありますが、あの頃からさらに進歩しているような感じです。 今回は、開発者ご…

「ネットで国際会議」に向き合ってみよう

…な研究者の一人でありTEI協会の理事長をしておられる Kathryn Tomasek先生がいらっしゃり、これまでにも共同でデジタル歴史学に取り組んできており、その一環としてのワークショップでした。 wheatoncollege.edu しかしながら、3月上旬ということもあり、直前で出張をキャンセルすることになりました。そこで、ご相談の結果、ビデオ会議システムの雄、Zoomを用いて遠隔講義を実施することになりました。遠隔ということもあり、小風氏の発表に限って実施していただきまし…

Evasion of breathing tax: editing TEI with VSCode

TEI

… can edit TEI/XML relatively easy by free, based on a brief report by Yifan Wang who is graduate student of the University of Tokyo and junior fellow in the International Institute for Digital Humanities. I strongly recommend to use Oxygen …

フリーソフトで快適TEI/XML(Oxygenを使わない道)

TEI

TEI/XMLは、基本的には裏側で勝手にタグがついたりそれに対応した表示が勝手に行われてくれるものであり、個別には色々なソリューションがあります。 しかし一方で、「どういうタグをつけるか」「どういう風に構造化するか(=それにあわせてどういうタグをどう使うか)」といったことを 考える際には、今のところ、XMLを直に書いた方がやりやすいです。それを支援してくれる強力なツールとしてOxygen XML Editorというものがあり、 その簡単さと便利さゆえに、世界中どこに行っても、…

ようやく刊行にこぎつけました:『日本の文化をデジタル世界に伝える』

…IFが流行り始めたりTEIの日本語圏への導入が本格化したりましたので、その後の状況もかなり追記しております。共同研究班で議論してきたことをまとめたものではありますが、執筆は一人で行いましたので、基本的に私の主観がかなり入っており、議論そのものを忠実に反映したとは言えない面があります。また、わかりやすさの優先や私の理解不足から、記述に甘いところや間違いなども含まれていると思いますが、それらについてはすべて私の責任ですのでご容赦ください。 本書の目次は以下のようになっています。 …

TEI P5ガイドラインの最新版(v3.5.0)でルビを。

…のでお知らせです。 TEI P5ガイドラインは着々とアップデートを続けておりまして、現在はv3.5.0となっております。日本語訳も、エレメント・アトリビュートの説明に関しては、かつて鶴見大学の大矢一志先生がやってくださったものに、TEI協会東アジア/日本語分科会を中心とした翻訳会のボランティアによる追加作業が加わり、日本語でもずいぶん使えるようになってきています。 ところで、TEI P5ガイドラインには、まだ「ルビ」がありません。既存のタグを流用することでなんとかしのいでいる…

海外の文化資料系の開発者コミュニティと技術トレンド

…g members.tei-c.org iiif.io www.euromed2018.eu 隔年・数年に一度開催: pro.europeana.eu 他にも大きめのものがあるかもしれませんが、海外先進国で進められている文化資料デジタル化の雰囲気を味わったり、今まさに議論されていることを把握したかったりした場合は、こういう会合に顔を出してみるとよいのではないかと思います。 また、日本でも、文化資料関連のデジタルアーカイブ方面の活動が、こういった流れにうまく対応できるようになる…

「TEIで青空文庫」勉強会を開催します

TEI

…ーヨークにて始まったTEI (Text Encoding Initiative)の取り組みは、2016年の東アジア/日本語分科会の設立、2018年、30年の歴史の中で初の欧米外での年次大会開催に至り、欧米の外への対応をより本格化しつつあります。東アジア/日本語分科会では、ガイドラインを日本語で便利に使えるようにするための取り組みを続けてきておりますが、それまでの取り組みが一つの区切りを迎えました。そこで、次の取り組みとして「TEIで青空文庫」勉強会を開催いたします。 青空文庫…

欧米の文献学者によるデジタル文献学の最先端と欧州デジタルアーカイブの最先端

…米で長らく担ってきたTEI (Text Encoding Initiative) 協会が、今回初めて、欧米を離れて日本で年次大会を開催します。欧米の文献学者(IT専門家ではなく)が主導するデジタル文献学を日本で知ることができるという、絶好の機会になります。年次大会の事前申し込みは締め切りましたが、当日申し込みも可能ですので、ぜひお越しください。 無料公開国際シンポジウムをもう少し詳しく これにあわせて開催される日本デジタル・ヒューマニティーズ学会の年次国際学術大会JADH20…

デジタル校訂テクスト作成のMOOCに日本語字幕がつきました

…itiative (TEI) Guidelinesは、それを実現するための記述方法であり、欧米の文献学ではすでにそういうことが普通にできるようになっています。たとえば西洋中世写本研究のカリキュラムにも、この記述の仕方が取り入れられ、若手研究者にとっては、得手不得手はともかく、リテラシーのレベルでとりあえず学んでおく技術ということになっているようです。 さて、少し話を戻しますと、筆者としては、基本的には「学術編集版」に賛成なのですが、しかしながら、今度は、日本語の「編集」という…

IIIF, Mirador, TEI, Word2vecを活用した仏教学研究教育サイト「SAT2018」

… Mirador, TEI, Word2vecで、隠れたキーワードはWebコラボレーションです。 1994年に始まったSATプロジェクトでは、比較的初期の段階から、入力が済んだ順にテキストデータを公開していましたが、2008年に最初の全文検索Webサイトを公開した時は、大正新脩大藏経約1億字の全文検索や辞書検索、論文検索機能などが中心であり、2012年/2015年の改定では仏典画像の自前公開やリンク、パラレルコーパスなどが新規追加されました。 今回、2018年版は、ネタが多す…

Omeka IIIF ToolKitを少し便利に

…会(IIIF講習会やTEI講習会など)は着々と実施しておりまして、12月には沖縄県立芸術大学と琉球大学附属図書館でもIIIF講習会を実施しました。その後引き続き、基本的にはSAT大蔵経テキストデータベースの再構築作業を続けているのですが、機能が多すぎてまだ公開できるところまでたどり着いておりません。もう少ししたら公開できると思いますので、もうしばしお時間をください。 それはともかくとしまして、今回は、東京大学の「文化資源デジタルアーカイブ特論」という3日間の集中講義のなかでO…

デジタルアーカイブにおけるテクスト資料の扱い: oXygenで日本語解説付きTEIガイドラインを利用する

TEI

…扱い」ということで、TEIガイドラインの解説をしてきました。しかし、実際に使ってみる話をまだ全然書いておりませんでしたので、今回は、実際に使ってみる手順のはじめのところについてご紹介したいと思います。このブログの読者の方々には日本語解説付きの方がわかりやすい人が多いと思いますので、日本語解説付きで利用するにはどうしたらいいか、ということもここで御説明しておきます。 まず、TEIガイドラインをテクスト資料に適用するためには、XMLエディタを利用することがほぼ必須です。Windo…

デジタルアーカイブにおけるテクスト資料の扱い: 図書館向けのTEI活用法

TEI

…こまで、このブログでTEIに関する話を読んできていただくと、「そんなに細かいタグを付けるのは大変だ」と思ってしまわれる人も結構おられるのではないかと思います。しかし、TEIでは、必ずしも細かく深いタグをつけていかねばならないというものではなく、浅いマークアップ(タグ付け)でもTEIであると言えますし、それでも一定の機能を果たすことはできます。 特に、こういったことについて関心があるのは、やはり図書館の方々のようです。デジタル化はするが、内容にあまり深入りすることははばかられる…

デジタルアーカイブにおけるテクスト資料:TEIでの電子版と元資料の書誌情報

TEI

…何度かご紹介しているTEI (Text Encoding Initiative)に関するご紹介の続きです。 先週、カナダのモントリオールにて開催されたDigital Humaities 2017というカンファレンスで、TEIコミュニティが賞をもらいました。そこで受賞記念スピーチがあったのですが、1980年代終わりにTEIがどういう状況で生まれてどういうことを目指してきたか、ということが創始者達によって語られました。詳しくは別の機会にご紹介させていただきますが、ここで一つ、なる…

青空文庫の『走れメロス』をTEIで

TEI

…・前々回に引き続き、TEIの話です。前回、ごく基本的なマークアップでもOKだということを少し書きましたが、それでは試しに、ということで、青空文庫の『走れメロス』をTEIにて書いてみました。それがこちらになります。 特に説明するようなことはあまりないのですが、TEIのタグ付けルールに従って、本文にパラグラフごとに<p>タグをつけていっているのと、書誌情報のところで、青空文庫としての入力者情報や訂正情報などを書いています。これには、電子版としての位置づけをどう考えるかによって色々…

TEIへの取り組み方

TEI

TEIに取り組むには、一人で取り組むか、プロジェクトとして複数人で取り組むか、という二つのやり方があります。一人で取り組む場合には、とにかく自分で頑張ってみればいいのですが、プロジェクトとして複数人で取り組む場合には、まず、役割分担をする必要があります。「TEIで用意されているタグ(エレメント・アトリビュート)のうち、どれをどう使うか」ということを決めるという役割と、それに従ってマークアップをしていく役割をわけておかねばなりません。これは文化資料に関わる他の規格の多くも同様か…

「デジタルアーカイブ」で全文テキストデータをうまく継承していくには

TEI

…語での解説が手薄な、TEI (Text Encoding Initiative) に関する話を、このブログにて数回にわけてご紹介していきたいと思います。 TEI (Text Encodnig Initiative) という呼称は割と広く使われていますが、正確に言えば、TEI協会がTEIガイドラインを作成して、テキストデータの共有に関して共有すべき事柄を提示する、という形になっています。そのいずれもがTEIと呼ばれることがあります。 TEIは、1987年から欧米で作られてきてい…

写本や貴重書等の書誌情報の書き方について(TEI/XMLのご紹介)

TEI

…、人文学資料向けに TEI (Text Encoding Initiative)というガイドラインが公開されています。これは、人文学資料向けというくらいですので、希望すれば非常に細やかな構造化が可能で(しかし浅い構造化もできて)、対応可能な分野も様々です。(たとえば、コーパス言語学では各単語の属性に着目しますが、古典文献学ではどちらかというと書誌情報や異文に着目する、という風な違いがあります。) このTEIガイドラインでの構造化は、現在はXMLで行うのが主流になっています。T…

国文学研究資料館の古典籍等のデータベース群(の一部?)にパーマリンク的なものがついた模様

…きていて、IIIFやTEI、Unicode等に入れ込んでいるのはそれを解消するための土台を皆で共有できるようにするということもあるのですが、まだ完全とは言えません。一方、古瀬先生が責任者として動かしておられた仕事は、事業として確実に動かせる形を目指して整備され、古瀬先生が亡くなった後にも着々と進められ、ついに公開にまで至り、とても地味ですが、しかし、国文学のみならず、日本文化研究全般を大きく前進させる1歩を刻むことになりました。それだけでなく、色々なデータベースがシステムの全…

「デジタルアーカイブ」を考える―「日本」がそのアイデンティティを取り戻すために

…々な展開があり得る。TEIコンソーシアムに日本語SIGが設立されることになったのもこの文脈からのことで、ただ受容しようとしてうまくいかないから終わり、ではなく、グローバル側に対してローカルの要求をきちんとした手続きを経て提示していくことが肝要であると思っている。それは、ローカルにとってのメリットだけでなく、グローバルの価値を高めることにもつながり、結果としてローカルも含めた全体の価値が高まっていくことにもなる。それを理解しているグローバルなコミュニティには、積極的に参加し、協…

「デジタルアーカイブ」におけるテクスト資料の構造化・マークアップの国際デファクト標準、TEIガイドラインを作っているTEI協会に日本語資料を扱う分科会ができました

…張が行われています。TEIについては、いくつか記事を書いたことがありますので、よかったら下記のURLなどをご参照ください。 TEIとoXygenの初歩 | Digital Humanities notes in Japan http://nlp.nii.ac.jp/tawc/papers/W05_nagasaki.pdf しかしながら、日本語資料への対応は未だ十分ではありません。これは、このコミュニティに参加する日本人が少なかったことが直接の大きな理由なのですが、なぜ参加する…

「デジタルアーカイブ」における日本語古典籍+翻刻とIIIF、そして皆様の取組み

…かしようという動きがTEI関係で始まっておりまして、個人的にも、TEI とIIIFをいかにうまく連携させるかということに取り組んでおります。基本的に、タグをつけてもらったら、それをTEI P5 Guidelinesの<sourceDoc/>に自動的にマッピングしてしまって、さらに、リニアなテクストにも変換するというオーソドックスなアプローチを考えています。それについては9月末にウィーンで開催されるTEI会議で報告する予定なのですが、国内でもいずれどこかでご報告させていただけた…