サンスクリット写本 データベースを作った話

最近、サンスクリット写本のデータベースを作りました。といっても、文字起こししたテキストデータベースではなくて、 デジタル画像のデータベースです。世間ではむしろ「デジタルアーカイブ」と言った方が通りがいいでしょうか。 一人で作ったわけではなく…

著書・共著書は業績であり続けられるのか

※書いていたら長くなってしまったので結論だけ先に書いておきますと、「学術出版社の皆さま、明示的に査読制度を作っていただくとよいと思います」という話を書いております。 研究業績とはどういうものか、ということについて、ずっと考えております。先日…

Apache Solr8のnested documentの検索の仕方

表題の件について、結構苦労して色々なパラメータの使い方を理解して、一人で暖めておくのはもったいないのでメモ。 Solr8では2段以上(上限不明)のデータのネストが可能。 スキーマの作り方は今のところ十分に理解できていないが、dynamicFieldを用いるこ…

人文学研究者必読の第六期科学技術・イノベーション基本計画のポイントを確認してみる

科学技術基本法は、しばらく前までは「科学技術(人文科学のみに係るものを除く。以下同じ。)」という 文言で人文学を除外していましたが、令和3年4月、「科学技術・イノベーション基本法」に変更されて 施行され、これにともない、人文・社会科学が含ま…

翻訳は研究業績にならないの?

少し前に、パワポ資料は研究業績にならないのか、という記事を書きましたが、 最近、以下のツィートを拝見しましたので、今度は、翻訳はどうなのか、ということについて少し思うところを書いてみたいと思います。 いつからでしょう、学術の世界で翻訳が研究…

Ubuntu16環境でCUDAをPythonのOpenCVモジュールから使えるようにする

ちょっと色々あって、Ubuntu16環境でCUDAをPythonのOpenCVから使えるようにする必要が生じました。 GPU使って画像のディープラーニングやってる人なら何のことかわかると思います。 基本的には、こちらのサイトがとても参考になりました。ほとんどこれに沿っ…

研究業績はなぜ論文でなければならないのか?パワポはダメ?

久々に、いかにもブログらしいという感じの何の役にも立たない記事を書きます。 研究業績はなぜ論文でなければならないのか? ということは自分としては長年の謎の一つでしたが、では、パワポ資料が研究業績だと言われたらどうするだろうか、と 考えてみるこ…

IIIFでMirador3をMirador2のような便利さで使うために

IIIFでの画像ビューワの一方の雄であるMiradorは、現行バージョンのMirador3が出てしばらく経ちます。Mirador2の更新が止まってしまったことで、Mirador3に移行するところも徐々に増えてきているようにみえます。 しかしながら、Mirador3は、Mirador2の時代…

Mirador3をMirador2のような便利さで使うために

IIIFでの画像ビューワの一方の雄であるMiradorは、現行バージョンのMirador3が出てしばらく経ちます。Mirador2の更新が止まってしまったことで、Mirador3に移行するところも徐々に増えてきているようにみえます。 しかしながら、Mirador3は、Mirador2の時代…

般若心経をブラウザに読んでもらう(+簡単Javascript解説)

もうすぐ50歳になるおじさんなので、新しい情報にはかなり疎くなっております。若者達から色々教えてもらうように心がけているのですが、もう記憶力が弱いのか、周囲があまりカバーしてないのか、はたまた、色々問題があって人に言うほどではないと思ってし…

「楽譜のデジタル化」という課題

筆者は、2000年くらいからTEI (Text Encoding Initiative) ガイドラインの勉強を開始し、デジタルテキストを用いた研究の可能性と課題について、探求と実践を繰り返してきた。デジタル化とは、単にデジタルカメラで撮影してメタデータをつけるだけでなく、全…

KHコーダで形態素解析用の辞書に単語を追加する方法

KHコーダを使っていると、形態素解析がうまくできない単語をどうにかしたくなることがあります。 そんな時の対策の一つとして、形態素解析辞書に単語を追加するという方法があります。 ググればなんてことのない作業なのですが、一応、調べて、やってみた、…

曼荼羅上の菩薩の名前をIIIFで確認できます+あつ森対応の件

SAT大正蔵図蔵DBがアップデートされました。今回のアップデートで、IIIFアノテーションは2万件を超えました。 青山学院大学の津田徹英先生率いるチームによる作業で、科学研究費補助金の研究成果公開促進費(データベース)の成果でもあります。 今回の目玉…

人文系研究者はデジタルに手を出しても評価されない?

(2021/07/06 午前、追記あり) 海外ではデジタル・ヒューマニティーズ(DH)が普及しつつあるのに日本では…という話は最近よく聞きます。 日本でDHについての話題が出ると、人文系のベテラン研究者の方々からは 「しかしデジタルに手を出しても評価されない…

人文学向け電子テキストガイドラインTEI/XMLに準拠したファイルをPHPで処理するにあたって

人文学向け構造化ルールであるTEI/XMLガイドラインに準拠して作成したファイルは、とにかく色んな方法で処理して その都度必要な状態にして利用できるのが魅力です。それについて書き始めると長くなるので詳しくは 以下のページなどをご覧ください。 bungaku…

Webで地図上にマーカーを載せたりグルーピングしたりする方法

地図上にマーカーを載せたり、マーカーをグルーピングしたりする機能、最近はかなり流行ってますね。 Wikipediaの充実等により地図上の座標情報を簡単にとれるようになってきてデータ作りが簡単になってきたというのと、 自由に使える地図がかなり使いやすく…

書物のグローバルな歴史における日本の位置付け

今夜は慶應義塾ミュージアム・コモンズのシンポジウム「KeMCo国際シンポジウム|本景——書物文化がつくりだす連想の風景」を 拝聴して勉強させていただいた。 前大英図書館収書・司書部長のクリスチャン・イエンセン氏、トロント大学の中世英文学教授、アレク…

この5年ほどのデジタル・ヒューマニティーズ学会の発表者の動向(+Palladioの使い方)

デジタル・ヒューマニティーズ(DH)学会といえば、ADHO (Alliance of Digital Humanities Organizations)で開催している年次国際学術大会が最大級です。「デジタル・ヒューマニティーズ」を冠するようになったのは2006年パリ大会からですが、その前から、欧…

3D×紙の繊維×漢字字形:イベント盛りだくさんな土曜日でした

3/13(土)は、参加したいイベントが盛りだくさんな日でした。 なんとか少しでも参加できたのは、3Dと紙の繊維と漢字字形を扱う3つのイベントでした。他にも 日本語コーパスのイベントと舞台芸術アーカイブのイベントがありましたが、残念ながら、これは参加…

「人間文化研究情報資源共有化研究会」への期待

明日、3/12(金)は、デジタル人文学/人文情報学に関する重要なイベントが2つあります。 片方は人文学の研究データの基盤の話、もう片方は研究データをどのように展開するか、というテーマを 扱うようで、この二つが重なってしまうのはなかなか残念なことな…

3D学術編集版:人文学の研究成果/研究環境としての3D構築

このところ、3Dに関する取り組みがデジタル・ヒューマニティーズの世界でも見られるようになってきました。この週末には人文学と3Dをテーマとしたイベントも開催されるようで、いよいよ盛り上がりが始まる気配を感じさせます。 ではデジタル・ヒューマニティ…

TEIガイドラインにルビが導入:人文学向け国際デファクト標準に沿った日本語テキストデータの作成が容易になりました

人文学向けデジタルテキスト作成の国際デファクト標準、TEIガイドラインでルビが導入されました 2月25日付けで、TEI協会が策定・公開している人文学資料のデジタル構造化の国際デファクト標準である TEI ガイドラインの version 4.2.0がリリースされ、 日本…

CLARIN-ERIC/欧州の言語資源データインフラについて

欧州の言語資源データインフラとして運用されているCLARIN-ERICについて、ちょっと言及しなければならないかもしれないので 、CLARIN in a nutshell | CLARIN ERIC から、少しメモをしておきます。 CLARIN は、"Common Language Resources and Technology In…

ケンブリッジ大学デジタル図書館の日本資料の書誌情報を視覚化してみる

TEI

本日は、第3回 日本宗教文献調査学 合同研究集会という会合でパネルディスカッションの司会をさせていただきました。 司会が自分が言うのもなんですが、大変興味深い議論が行われたようにも思いまして、ご参加いただいたみなさまのおかげで意義のある場にな…

一つのフォルダの中のファイルのファイル名をエクセルを介して一括で変更する方法@Windows10

Windowsで、一つのフォルダの中のファイルのファイル名を一括で変更したいときがあります。フリーソフトでそういうことをやってくれるものもありますし、玄人的な方法なら本当にいろんな方法があります。 でも、Windows10で普通にワードとかエクセルを使った…

データクレンジング/大日本仏教全書の目次データを作成した話

ここしばらく、国立国会図書館デジタルコレクション(NDLデジコレ)で公開されている『大日本仏教全書』という仏典叢書のインデックスを作成する作業に没頭しておりました。 『大日本仏教全書』は大正時代に刊行されたものなのですが、大変面白いもので、仏…

新規開発されたJ-Stageの全文XML作成ツールにお付き合いした話(その2)

さて、前々回の記事の続きです。前回記事から引用すると、 総合的にみて現在おすすめのワークフロー というわけで、J-Stageで全文XML登載をするにあたって、当方でおすすめの作業の流れは、大体以下のような感じです。 ワードで、全文XML作成ツールに沿った…

動画へのアノテーションを(サーバなしで)手元で試してみる

本日、初めてのIIIF動画アノテーション講習会を実施しました。受講者だか講師だかわからないような人たちが続々ご参加くださったおかげで大変有益な議論ができました。 これにあたって、どういう風にすると皆さんが試しやすいだろうか…と考えつつ準備をする…

新規開発されたJ-Stageの全文XML作成ツールにお付き合いした話(その1)

J-Stageに論文登載をする作業を時々しています。一部にはよく知られていますが、J-Stageは、 学会等に無料でオープンアクセス論文の公開をさせてくれてDOIまでつけてくれるという信じられないくらいありがたいサービスです。 普通はお金を取るものですが、J-…

Web動画をアンロックする:IIIF動画アノテーションのご紹介

追記:動画に色々描き込んだりするのはYou○ubeやニコニ○動画でもできるんじゃないの…?と思われる人も多いと思いますが、 大きな違いが2点ありますので、それを挙げておきます。 まず、それらは今のところ基本的には「時間」に対して文字のアノテーションを…