今時の簡単なXML論文ファイル作成提出方法/デジタル・ヒューマニティーズ国際会議での事例

論文の本文をXMLで記述しよう、という取り組みは、世界的にはかなり進んでいるようであり、日本でもJ-STAGEが「全文XML」ということで推進中です。 この7月に東京大学が開催予定の、国際デジタル・ヒューマニティーズ学会連合(ADHO)による国際学術大会 DH2…

日本発のプレプリントサーバJxivに論文を載せてみました

いわゆる10兆円ファンドの運用主体としてますます注目を浴びる科学技術振興機構(JST)が、最近、プレプリントサーバの運用を開始したそうです。その名もJxiv。すでに海外にいくつか著名なプレプリントサーバがあり、国内でも筑波大学が筑波大学ゲートウェイ…

SSH Open Marketplace:欧州の人文・社会科学分野の研究資源カタログはクラウドソーシングのようでした

欧州では European Union’s Horizon 2020 project の下、研究インフラの構築が盛んに行われています。 European Research Infrastructure Consortium (ERIC) を中心として進められているようで、 基本的には理工系の話なのですが、欧州では人文・社会科学に…

【頭の整理】日本での「テキストデータベース」作りのステップ6くらい

前回記事では、用途に応じたタグの付け方についてみてきた。 このようにして様々なタグの付け方があり、分野毎に異なるタグが用意されることになるのであれば、 タグの構造を設定したり使い方をレクチャーしたりする、かなり詳しい人が分野毎に必要となりそ…

【頭の整理】日本での「テキストデータベース」作りのステップ5くらい

前回記事の続き。 テキストデータベースが「どういう深さのものか」を決めて、それを記述するというのが前回の到達点である。 しかしながら、前回は、研究志向の強いものについては、 「Level 5: 学術編集のためのタグ付け」で一括されてしまっていた。「学…

【頭の整理】日本での「テキストデータベース」作りのステップ4くらい

テキストデータベース作りに関するメモの続き。 前の記事からくる帰結は、テキストデータの元資料への忠実さや付与される解釈の深さは、以下の2点に依拠するということになる。 ・どういう人のどういうニーズを対象とするか ・どれくらいの手間暇時間をかけ…

【頭の整理】日本での「テキストデータベース」作りのステップ3くらい

前回記事では、非ボーンデジタルなテキストデータを元資料を一致させることの難しさについてちょこちょこメモしてみた。とはいえ、そんなことばかり言っていては先に進まないので 解決策、というか、それをどう捉えるべきかということについて少しメモしてみ…

【頭の整理】日本での「テキストデータベース」作りの2つ目のステップあたり

前回記事では、「テキストデータベース」作りに関して、その意義とか、テキストデータそのものをどうやって得るか、というようなことをメモしてみた。 今回は、とりあえずテキストデータが入手できたあと、どうすべきか、ということをメモしておきたい。やや…

【頭の整理】日本での「テキストデータベース」作りの最初のあたり

標題の件につき、少し頭を整理するためにメモを残しておく。多分これが本来的なブログの使い方なのではないかと思うので、情報収集したい人にはあまり有益ではないかもしれず申し訳ないがご容赦いただきたい。 テキストデータベースを作る、という取組みは、…

DHフェス2022 が発表者(2/14締切)・参加者募集中です

2022年2月23日の13:00時から開催される、DHフェス2022 というイベントが発表者・参加者を募集しています。 sites.google.com このイベントは「人文学+デジタルな取り組みを気楽に話しましょう!」という気楽な会合で、 少し前に開催されたイベント、「言語…

日本学術会議の公開シンポジウムで人文・社会科学のデジタル研究基盤がテーマとなります

今度の土曜日、1/22に、日本学術会議の公開シンポジウム「総合知創出に向けた人文・社会科学のデジタル研究基盤構築の現在」が開催されます。 日本学術会議には「分野別委員会」があり、それぞれの委員会が分科会を設置して特定のテーマについて議論します。…

Vue.jsで簡単地図マッピング - その2 マーカー表示編

さて、前回記事に引き続き、 Vue.jsで簡単地図マッピングです。 マーカーの地図上での表示 今度は、マーカーを表示してみましょう。 すでにここまでインストールしたモジュールでマーカーの表示はできますので、あとは タグやスクリプトを書いていけば…とい…

Vue.jsで簡単地図マッピング - その1 準備編(2021/12/13追記)

前回はTEIファイルから地図マッピングをする話でしたが、今回は少し違う角度から取り組んでみます。 最近、JDCatデータのお試し検索サイトというものを作ってみました。 人文社会科学の研究データを総欄できるサイトとして最近運用が始まった JDCatというサ…

Digital 法寶義林 (Hôbôgirin) の作り方/TEIファイルから地図年表マッピング-その1

先週の土曜日、人文情報学による仏教知識構造化の新潮流 ​というシンポジウムがあり、 そこでDigital 法寶義林 (Hôbôgirin) というサイトが公開されました。このサイトは インターフェイスをJavascriptで作り込んでおり、インターフェイスからサーバ側にリク…

増上寺三大蔵がユネスコ「世界の記憶」における国際登録の登録申請案件に

先日、文部科学省から、増上寺三大蔵がユネスコ「世界の記憶」における国際登録の登録申請案件に推薦されることになったとのお知らせがありました。 文部科学省のサイトによれば、ユネスコの「世界の記憶」は、以下のようなもののようです。 世界的に重要な…

サンスクリット写本 データベースを作った話

最近、サンスクリット写本のデータベースを作りました。といっても、文字起こししたテキストデータベースではなくて、 デジタル画像のデータベースです。世間ではむしろ「デジタルアーカイブ」と言った方が通りがいいでしょうか。 一人で作ったわけではなく…

著書・共著書は業績であり続けられるのか

※書いていたら長くなってしまったので結論だけ先に書いておきますと、「学術出版社の皆さま、明示的に査読制度を作っていただくとよいと思います」という話を書いております。 研究業績とはどういうものか、ということについて、ずっと考えております。先日…

Apache Solr8のnested documentの検索の仕方

表題の件について、結構苦労して色々なパラメータの使い方を理解して、一人で暖めておくのはもったいないのでメモ。 Solr8では2段以上(上限不明)のデータのネストが可能。 スキーマの作り方は今のところ十分に理解できていないが、dynamicFieldを用いるこ…

人文学研究者必読の第六期科学技術・イノベーション基本計画のポイントを確認してみる

科学技術基本法は、しばらく前までは「科学技術(人文科学のみに係るものを除く。以下同じ。)」という 文言で人文学を除外していましたが、令和3年4月、「科学技術・イノベーション基本法」に変更されて 施行され、これにともない、人文・社会科学が含ま…

翻訳は研究業績にならないの?

少し前に、パワポ資料は研究業績にならないのか、という記事を書きましたが、 最近、以下のツィートを拝見しましたので、今度は、翻訳はどうなのか、ということについて少し思うところを書いてみたいと思います。 いつからでしょう、学術の世界で翻訳が研究…

Ubuntu16環境でCUDAをPythonのOpenCVモジュールから使えるようにする

ちょっと色々あって、Ubuntu16環境でCUDAをPythonのOpenCVから使えるようにする必要が生じました。 GPU使って画像のディープラーニングやってる人なら何のことかわかると思います。 基本的には、こちらのサイトがとても参考になりました。ほとんどこれに沿っ…

研究業績はなぜ論文でなければならないのか?パワポはダメ?

久々に、いかにもブログらしいという感じの何の役にも立たない記事を書きます。 研究業績はなぜ論文でなければならないのか? ということは自分としては長年の謎の一つでしたが、では、パワポ資料が研究業績だと言われたらどうするだろうか、と 考えてみるこ…

IIIFでMirador3をMirador2のような便利さで使うために

IIIFでの画像ビューワの一方の雄であるMiradorは、現行バージョンのMirador3が出てしばらく経ちます。Mirador2の更新が止まってしまったことで、Mirador3に移行するところも徐々に増えてきているようにみえます。 しかしながら、Mirador3は、Mirador2の時代…

Mirador3をMirador2のような便利さで使うために

IIIFでの画像ビューワの一方の雄であるMiradorは、現行バージョンのMirador3が出てしばらく経ちます。Mirador2の更新が止まってしまったことで、Mirador3に移行するところも徐々に増えてきているようにみえます。 しかしながら、Mirador3は、Mirador2の時代…

般若心経をブラウザに読んでもらう(+簡単Javascript解説)

もうすぐ50歳になるおじさんなので、新しい情報にはかなり疎くなっております。若者達から色々教えてもらうように心がけているのですが、もう記憶力が弱いのか、周囲があまりカバーしてないのか、はたまた、色々問題があって人に言うほどではないと思ってし…

「楽譜のデジタル化」という課題

筆者は、2000年くらいからTEI (Text Encoding Initiative) ガイドラインの勉強を開始し、デジタルテキストを用いた研究の可能性と課題について、探求と実践を繰り返してきた。デジタル化とは、単にデジタルカメラで撮影してメタデータをつけるだけでなく、全…

KHコーダで形態素解析用の辞書に単語を追加する方法

KHコーダを使っていると、形態素解析がうまくできない単語をどうにかしたくなることがあります。 そんな時の対策の一つとして、形態素解析辞書に単語を追加するという方法があります。 ググればなんてことのない作業なのですが、一応、調べて、やってみた、…

曼荼羅上の菩薩の名前をIIIFで確認できます+あつ森対応の件

SAT大正蔵図蔵DBがアップデートされました。今回のアップデートで、IIIFアノテーションは2万件を超えました。 青山学院大学の津田徹英先生率いるチームによる作業で、科学研究費補助金の研究成果公開促進費(データベース)の成果でもあります。 今回の目玉…

人文系研究者はデジタルに手を出しても評価されない?

(2021/07/06 午前、追記あり) 海外ではデジタル・ヒューマニティーズ(DH)が普及しつつあるのに日本では…という話は最近よく聞きます。 日本でDHについての話題が出ると、人文系のベテラン研究者の方々からは 「しかしデジタルに手を出しても評価されない…

人文学向け電子テキストガイドラインTEI/XMLに準拠したファイルをPHPで処理するにあたって

人文学向け構造化ルールであるTEI/XMLガイドラインに準拠して作成したファイルは、とにかく色んな方法で処理して その都度必要な状態にして利用できるのが魅力です。それについて書き始めると長くなるので詳しくは 以下のページなどをご覧ください。 bungaku…