TEI の検索結果:

今時の簡単なXML論文ファイル作成提出方法/デジタル・ヒューマニティーズ国際会議での事例

…。(ここでのXMLはTEIガイドライン準拠のものですが、JATS/XML等にもおそらく自動変換できると思われます)。 論文執筆者の手順 さて、これを論文執筆者の手順の方からみてみますと、 論文執筆者は自分の投稿システムIDでXMLファイル作成システムにログイン 自分の名前・所属・発表タイトル等が入力された、MSワードかLibreOfficeのテンプレートファイルをダウンロード MSワードかLibreOfficeでテンプレートファイルに本文・図・脚注・参考文献一覧などを記入 X…

SSH Open Marketplace:欧州の人文・社会科学分野の研究資源カタログはクラウドソーシングのようでした

欧州では European Union’s Horizon 2020 project の下、研究インフラの構築が盛んに行われています。 European Research Infrastructure Consortium (ERIC) を中心として進められているようで、 基本的には理工系の話なのですが、欧州では人文・社会科学にもそれなりに力が入っているようです。 たとえば、社会科学ではCESSDAやESS (European Social Survey)、 人文学ではCLA…

【頭の整理】日本での「テキストデータベース」作りのステップ6くらい

…たタグ付けのルールがTEIガイドラインであり、それゆえに、 特定の分野に偏ることなく、コミュニティに参加する人文学研究者達が取り組む分野全体に対応しつつ、 個別分野にも丁寧に配慮しようとしてきたのである。 TEIガイドラインはともかくとして、ここでは、「タグ」をつけることの可能性についてもう少し検討してみよう。 前回記事でみたように、タグの名前はタグが囲まれる文字列に対してなんらかの意味を付与することになる。 人名であったり、手紙の宛先であったり、校異情報であったり、様々であ…

【頭の整理】日本での「テキストデータベース」作りのステップ5くらい

…の種のものは、前出のTEIガイドラインが得意であり、たとえば『校異源氏物語』のある箇所をタグ付けすると以下のようになる。 ここでは、校異情報が存在する本文をまず<lem>~</lem>というタグで囲み、これに対して、校異情報を<rdg>~</rdg>という タグで囲んだ上で<rdg>タグには wit="#別陽" あるいは wit="#別國" と記載している。これは、一つ目の<rdg>は「別本の陽明本」 における記述であることを示し、二つ目の<rdg>は「別本の國冬本」であるこ…

【頭の整理】日本での「テキストデータベース」作りのステップ4くらい

… 記述手法を提示するTEI (Text Encoding Intiative) ガイドラインを定めている TEI協会の図書館分科会が 提供している Best Practices for TEI in Libraries というルールがある。 ここでは、テキストデータへのタグ付け(符号化、encoding)のレベルを以下のように5段階に分けて整理している。 Level 1: OCRによって自動生成されたテキストにそのまま自動化可能な範囲でタグ付け Level 2: 最小限のテキ…

【頭の整理】日本での「テキストデータベース」作りのステップ3くらい

…味がある人は、特に teiHeaderの章を読まれたい。 というわけで、文字をデジタルに転記する方法に関しては、まあ 大体なんとかなるとして、次に出てくるのは、誤転記である。せっかくルールを作っても、 人間だもの。間違うことは(大いに)ある。コンピュータにOCRやHTRで読み込ませても お茶目な間違いをしてくれることは大いに期待できる。それを人力で修正しても、やはり 間違いが残ってしまうこともあるだろう。では、たとえば分析のためのテキストデータとする 場合はどうなのか。誤転記…

Vue.jsで簡単地図マッピング - その1 準備編(2021/12/13追記)

前回はTEIファイルから地図マッピングをする話でしたが、今回は少し違う角度から取り組んでみます。 最近、JDCatデータのお試し検索サイトというものを作ってみました。 人文社会科学の研究データを総欄できるサイトとして最近運用が始まった JDCatというサイトがありますが、 こちらで集約して検索できるようにしているメタデータはCC0で公開されていますので、 せっかくのCC0を活かして教材作り等に使えないかということで試しに作ってみたのが 上記のお試し検索サイトです。ちなみにソー…

Digital 法寶義林 (Hôbôgirin) の作り方/TEIファイルから地図年表マッピング-その1

…ると、 サーバ側ではTEI/XMLで書かれたデータ(ファイル)をJSONに変換して返戻し、インターフェイス(Javascript)側では それを地図や年表などにプロットする、という風になっています。全体的にはよくある構成ですが、 サーバ側に置いてあるのがTEI/XMLファイルである、という点が、よくあるやり方とはちょっと違っています。 基本的に、サーバ側でデータを扱う時は、データサイズが大きくなっても大丈夫なように、検索に特化された ソフトウェアを使うのが一般的です。これも用…

サンスクリット写本 データベースを作った話

…うのは、メタデータはTEI P5の形式で用意されており、そこからいかにしてうまく 必要なデータを取り出して便利に使えるようにするか、ということでした。似たようなこと(=TEIに準拠したメタデータで古典籍の書誌情報検索を提供)をしているサイトとしては、ケンブリッジ大学デジタル図書館がありましたので、あまり凝りすぎずに、ここでできていることを目指せばいいか…というくらいに考えていたところでした。ただ、難しかったこととして、基本的に、写本の一つの束の中には複数の経典が含まれているこ…

「楽譜のデジタル化」という課題

…2000年くらいからTEI (Text Encoding Initiative) ガイドラインの勉強を開始し、デジタルテキストを用いた研究の可能性と課題について、探求と実践を繰り返してきた。デジタル化とは、単にデジタルカメラで撮影してメタデータをつけるだけでなく、全文テキストを作成し、その構造を何らかの方法で機械可読な形で共有することも含んでおり、そのようにすることで、テキストを主に用いるタイプの人文学を大いに振興することができるとともに、テキストを扱う研究の伝統的な営みを未…

人文系研究者はデジタルに手を出しても評価されない?

…し、 欧米先進国ではTEIガイドラインがあるので、まず、それに準拠しているかどうかを 確認し、準拠していれば、あとは、すでに定められた記法をどのように適用しているか、 を確認すれば済みます。もちろん、TEIガイドラインに準拠せずに成果物を作成する こともあるでしょうが、その場合は、そのようにして簡便に評価してもらえる道筋が あることを前提として敢えて茨の道を歩くことになるわけですから…ということになりますね。 欧米先進国では、とりあえずTEIガイドラインはDHの基礎の一つとし…

人文学向け電子テキストガイドラインTEI/XMLに準拠したファイルをPHPで処理するにあたって

…け構造化ルールであるTEI/XMLガイドラインに準拠して作成したファイルは、とにかく色んな方法で処理して その都度必要な状態にして利用できるのが魅力です。それについて書き始めると長くなるので詳しくは 以下のページなどをご覧ください。 bungaku-report.com なお、この記事は、PHPプログラミングをかなりやりこんでいる人向けで、TEI/XMLガイドラインに準拠した ファイルを処理するのに必須の知識ではありませんので、PHPをやってない人はここでお帰りいただく(?)…

この5年ほどのデジタル・ヒューマニティーズ学会の発表者の動向(+Palladioの使い方)

…2017年大会以外はTEI/XML準拠のデータです。TEI/XML準拠ということは、「著者のメールアドレスだけを取り出す」「メールアドレスが.comドメインなら代わりに所属情報を取り出す」といったようなことが(データがきちんと入っていれば)DOM操作で確実にできます。では、2019, 2020はどうでしょうか。これは、それぞれの学会サイトでTEI/XML準拠の発表論文データがダウンロードできるようになっていて、簡単なスクレイピングプログラムを走らせればすべて入手できます。なお…

3D学術編集版:人文学の研究成果/研究環境としての3D構築

…のうちの一人であり、TEI (Text Encoding Initiative) にも力を入れていて、学術編集版(いわゆる校異本・校訂本)の表示システムであるVersioning Machine の開発プロジェクトを率いた人としても知られています。日本にも何度かいらっしゃってDHに関する講演やTEIのワークショップを開催してくださったりしました。コロナ前は世界中を飛び回っておられて、学問的にも地理的にも幅広い視野でデジタル・ヒューマニティーズに取り組んでおられる研究者の一人か…

TEIガイドラインにルビが導入:人文学向け国際デファクト標準に沿った日本語テキストデータの作成が容易になりました

…国際デファクト標準、TEIガイドラインでルビが導入されました 2月25日付けで、TEI協会が策定・公開している人文学資料のデジタル構造化の国際デファクト標準である TEI ガイドラインの version 4.2.0がリリースされ、 日本語のルビが導入されました(リリースノート)。 これにより、ルビが付された膨大な日本語テキスト資料をTEIガイドラインに準拠して構造化することが、これまでとは比べものにならないくらい簡便になりました。このことは、 国際的な人文学向けデジタルテキス…

ケンブリッジ大学デジタル図書館の日本資料の書誌情報を視覚化してみる

TEI

… このメタデータは、TEI (Text Encoding Initiative) ガイドライン(本家英語版:日本語解説版)に準拠して作成されており、用意された情報に関しては機械可読性がかなり高いものと なっております。当初はケンブリッジ大学図書館日本司書の小山さん等、当該図書館の人達がメタデータをつけていたような感じがしますが(この点、間違えていたら ご教示ください)、途中から立命館大学アートリサーチセンターの方々が参入してがんばってくださったようで、日本文化資料だけで463…

新規開発されたJ-Stageの全文XML作成ツールにお付き合いした話(その1)

…があり、 JATSとTEIのコンセプトの違い、のような話もこってりと教えていただいたこともあり、 もちろん、最初にJ-Stageを使い始めたときにも一応全文XMLは試してみていたので、 まあ大丈夫かな…と、安易にも思ってしまったということもありました。 今にして思えば、 ツール開発1つ分か論文1本分くらいの時間を費やしてしまったので、本当に失敗だったと 思っていますが、結果として作業に慣れてしまったということと、ここまでやったのだから その試行錯誤を残しておくことで、後に続く…

Scholarly primitives: 最近デジタル人文学で話題になっている話

…man先生と言えば、TEIで書いた校訂テキストをきれいに表示してくれるViersioning Machineというソフトウェアの 開発プロジェクトを率いておられたり、DHの代表的な教科書であるCompanion to Digital HumanitiesのエディタをJohn Unsworth先生達とされたりと、DH界では重要なお仕事を色々してきておられますが、最近は3Dの学術利用(=学術編集版の構築)に力を入れておられるようで、すでにこの方面のフルペーパー "Textuali…

「デジタル人文学」以前の日本の人文系デジタルテキスト研究を探訪してみる

…itiative (TEI)に関しても、一人でひょこひょこ国際会議に入っていって、鶴見大学の大矢一志先生は比較的よく参加していたのでお知り合いになることができましたが、それ以外の日本人にはあまり会うことがないまま、英語は苦手ながら中心メンバーの方々と一緒にご飯を食べに行ったりあれこれ議論を重ねるなかで徐々に雰囲気に馴染んでいったということがありました。もちろん、中心メンバーの半分くらいはADHOと重なっていたので、JADH/ ADHO関連での会合とあわせて仲良くなったというこ…

日本学術会議の提言を読んでみる:学術情報流通の現在と未来 6/n

…グ付きコーパス(主にTEI準拠) を共有する仕組みとしてTextGridが提供されて シボレス認証にも対応していたりして、なかなか重厚な感じです。 欧州全体としては、CLARINというプロジェクトで、タグ付きコーパスを集約しているようです。 CLARINは、欧州の研究インフラ事業ERICの一環として運用されているもののようで、 デジタル研究インフラのなかに人文学の「二次研究データ」がしっかりと位置づけられているようですね。 我が国もそろそろこういったところを目指さねばならない…

日本学術会議の提言を読んでみる:学術情報流通の現在と未来 1/n

…グループは 要するにTEIガイドラインの国際化という話で、どちらかと言えばデータの話でしたが、他のグループは 学術情報をめぐる人のコミュニケーションが主なテーマになっているようでした。学術情報流通は門外漢なので あまりよくわからないのですが、Scholarly communication に学術情報流通という訳語を与えたことで議論の幅が結構変わったのかもしれないと思ったところでした。 また、学術情報環境(学術情報インフラ)の整備が必要であるにも関わらず経費高騰により 最低限必…

40代後半人文系で未だにWeb開発をしている理由

…onsortium(TEI協会)では、30年前からまさにそれにコミュニティとして 取り組んできていて、最近は日本語も含め各言語文化圏の事情にあわせた対応をしていこう という流れが強まっているので、そこでの蓄積をうまくこちらにも持ってこれれば だいぶん楽ができると思います。人文学としてもエンジニアリングとしても、彼我の文化の 違いは大きく、そのまま持ってきても通用しないことが多いかもしれませんが、 その点も含めた「翻訳」を行っていくことで、なんとかなればと思っているところです。…

デジタルアーカイブやデジタル文化資源をテーマに含むオンライン授業のための資料をご提供

…決まり事:IIIFとTEI 国際的なデファクト標準とそれへの関わり方。特に、IIIFの解説が詳しい。 第6章 実際の公開にあたって 公開のための具体的な留意事項 第7章 評価の問題 デジタルアーカイブに対する評価について 第8章 研究者の取り組みへの評価の問題 研究者として取り組んだ場合の留意事項 おわりに/さらに深めたい人・アップデートしたい人に 全体のまとめとさらなる情報源 申し込み用Google Form docs.google.com 本書の内容 本書の内容につきまし…

聖徳太子御製『勝鬘經義疏』でText Encoding Initiativeを

TEI

…のブログでは、長らくTEI (Text Encoding Initiative) ガイドラインについて扱ってきました。このたびは、 大正新脩大蔵経にNo. 2185として収録されている聖徳太子御製『勝鬘經義疏』をTEI(Text Encoding Initiative)ガイドラインに準拠してマークアップしてみたものを公開いたしましたので、 構造的な側面について少しご紹介させていただきます。 これを公開している頁は以下のURLになります。 https://21dzk.l.u-t…

Web動画:Voyant-toolsで簡単テキスト分析:コロナウイルス感染症対策本部の会議資料をみてみよう

「Voyant-toolsで簡単テキスト分析:コロナウイルス感染症対策本部の会議資料をみてみよう」という動画を作って、東京大学の大向先生が主宰しておられるUTDHチャンネルにあげていただきました。 Voyant-toolsは、カナダでデジタル・ヒューマニティーズを牽引する二人の先生が開発・公開しておられる簡単テキスト分析ツールで、解説本的なものも出ています。 3年ほどまえに、このブログで採り上げたことがありますが、あの頃からさらに進歩しているような感じです。 今回は、開発者ご…

「ネットで国際会議」に向き合ってみよう

…な研究者の一人でありTEI協会の理事長をしておられる Kathryn Tomasek先生がいらっしゃり、これまでにも共同でデジタル歴史学に取り組んできており、その一環としてのワークショップでした。 wheatoncollege.edu しかしながら、3月上旬ということもあり、直前で出張をキャンセルすることになりました。そこで、ご相談の結果、ビデオ会議システムの雄、Zoomを用いて遠隔講義を実施することになりました。遠隔ということもあり、小風氏の発表に限って実施していただきまし…

Evasion of breathing tax: editing TEI with VSCode

TEI

… can edit TEI/XML relatively easy by free, based on a brief report by Yifan Wang who is graduate student of the University of Tokyo and junior fellow in the International Institute for Digital Humanities. I strongly recommend to use Oxygen …

フリーソフトで快適TEI/XML(Oxygenを使わない道)

TEI

TEI/XMLは、基本的には裏側で勝手にタグがついたりそれに対応した表示が勝手に行われてくれるものであり、個別には色々なソリューションがあります。 しかし一方で、「どういうタグをつけるか」「どういう風に構造化するか(=それにあわせてどういうタグをどう使うか)」といったことを 考える際には、今のところ、XMLを直に書いた方がやりやすいです。それを支援してくれる強力なツールとしてOxygen XML Editorというものがあり、 その簡単さと便利さゆえに、世界中どこに行っても、…

ようやく刊行にこぎつけました:『日本の文化をデジタル世界に伝える』

…IFが流行り始めたりTEIの日本語圏への導入が本格化したりましたので、その後の状況もかなり追記しております。共同研究班で議論してきたことをまとめたものではありますが、執筆は一人で行いましたので、基本的に私の主観がかなり入っており、議論そのものを忠実に反映したとは言えない面があります。また、わかりやすさの優先や私の理解不足から、記述に甘いところや間違いなども含まれていると思いますが、それらについてはすべて私の責任ですのでご容赦ください。 本書の目次は以下のようになっています。 …

TEI P5ガイドラインの最新版(v3.5.0)でルビを。

…のでお知らせです。 TEI P5ガイドラインは着々とアップデートを続けておりまして、現在はv3.5.0となっております。日本語訳も、エレメント・アトリビュートの説明に関しては、かつて鶴見大学の大矢一志先生がやってくださったものに、TEI協会東アジア/日本語分科会を中心とした翻訳会のボランティアによる追加作業が加わり、日本語でもずいぶん使えるようになってきています。 ところで、TEI P5ガイドラインには、まだ「ルビ」がありません。既存のタグを流用することでなんとかしのいでいる…