セキュリティがかかってなくてテキストが埋め込まれているPDF群からテキストを一括して抜き出す

セキュリティがかかってなくてテキストが埋め込まれているPDF群からテキストを一括して抜き出す(Windows - Cygwin編)はじめにWindows - Cygwin編、としているのは、単に、OSとしてUnix系をなんとかするという大仕事をせずに、Windowsからあまり離れずにな…

SAT大蔵経テキストデータベース研究会 公開ワークショップ

SAT大蔵経テキストデータベース研究会「仏教研究におけるデジタル技術の現在 〜SAT DBの具体的な活用手法について」 日時:2015年5月22日(金) 16:30〜18:00場所:京都大学・教育学部・第7演習室 (吉田キャンパス本部構内・総合研究2号館B1F)講師:永崎研…

Web用の画像ビューワをさがして(書きかけ)

先日、京大にてシンポジウムを開催した折りに、若手の人と話をしていて、Webビューワの情報とか得にくくて困っている、というお話をうかがったので、知っている限りのことを少しずつメモしていくことにしました。間違っているところなどありましたらお知らせ…

「大蔵経テキストデータベース」では何ができるのか

「大蔵経テキストデータベース」では何ができるのか、についての概略を簡潔に記しておきます。なぜこういうものを書こうと思ったのか等といった前置き的なことは後述します。<全体向け> ・大正新脩大藏經の本文(脚注付)を心ゆくまで無料で読むことができ…

「データベースやデジタルリソースが研究者にとって役立つかどうか」という話は少し整理してみてから考えてみるといいかもしれません。

先日、「じんもんそん」というイベントがありまして、人文学のデータを通じて何か面白いことが出来ないかどうかということを皆で話し合ってみるという面白い会合でした。参加費も無料で、主催者の皆様には大感謝だったのですが、そこで出ていた色々な話のう…

Europeanaを実際に使ってみました。

最近、Europeana がすごいということで各方面が大変賑わっているのですが、プロジェクトや政策としてのすごさはよく伝わってくる割に、内容についての話があんまり聞こえてこないので、実際にどれくらいのところに来ているのか、試してみました。といっても…

デジタルアーカイブの持続可能性に向けて

「デジタルアーカイブ」という言葉が再び脚光を浴びるようになってきている。人文学におけるデジタル化に関わる者としてはありがたい限りである。古典資料に関しては国文学研究資料館で巨大プロジェクトが動き出しており、科研費の基盤研究でも大型の研究助…

デジタル・ヒューマニティーズ(デジタル人文学、人文情報学、etc...)がよくわからない人のために

デジタル・ヒューマニティーズ(デジタル人文学、人文情報学、etc...)がよくわからない、という質問をよくいただきます。そこで、なるべくわかりやすいようにご説明すべく、ブログ記事をしたためてみました。とりあえずここでは、デジタル・ヒューマニティ…

江戸時代の出版に関してのメモ

江戸時代の著作権については、 大谷 卓史「江戸時代における「板権」」『情報管理』Vol. 55 (2012) No. 11 pp. 852-854.https://www.jstage.jst.go.jp/article/johokanri/55/11/55_852/_htmlにてまとめられている。基本的な知識はこれで十分に得られると思わ…

大正新脩大藏經刊行に関わるあれこれ

この件は、以前にツィッタ連投して書いたことがありましたが、改めてちょっと書いてみます。(書きかけ)

php-mbstringに関するメモ

Redhat6でyumの設定を直したらphp-mbstringがupdateできなくなった。今までの方法でもうまくいかないのでどうしたものかと思っていたら(ちょっとダークな気分になっていたが)、チャンネル名が変わったようであることに気がついて、以下のコマンドでなんと…

いまさら、Unicodeの漢字をさらに増やそうとしているのですが…

Unicodeの漢字をさらに増やそうとしています。うまくいけば、CJK Unified Ideographs Extension F となる予定のものです。大正新脩大藏經に登場する外字をUnicodeで使えるようにしようとする話で、今回は3000字ほど提案しました。実は、すでに情報処理学会「…

3Dプリンタの近い将来?

やらなければいけないことがたまってくるとつい余計なことも考えてしまい がちである。最近流行ってきている3Dプリンタ、今は一続きのオブジェを作るものしか 商品化されていないが、たとえば密室殺人事件における氷のような、作った 後に消えてくれるものを…

#本棚の中のニッポンの会 個人的なまとめ

本棚の中のニッポンの会の第一回会合を個人的にまとめてみる。比較的クローズな会という位置づけだったようなのだが、 ツィートをしてもよかったようで、まとめが作られている。そこで、差し支えのない範囲で思ったことを書いてみた。発端は、Summonというデ…

Neatlineをインストールしてみる

Neatlineのインストールの仕方です。Neatlineは時空間情報を手軽にWebで公開できるようにするためのOmekaのプラグインです。詳しくはNeatlineの公式サイトをご覧下さい。まず、以下の手順にしたがってOmekaをインストールしておきます。 http://d.hatena.ne.…

Omekaをインストールしてみる

Omekaのバージョン2をインストールするための簡単なチュートリアルです。Omekaは、ジョージ・メイソン大学の歴史とニューメディアセンターが中心となって開発された、Dublin coreをはじめとするメタデータをWeb上で共有するのに便利なCMSです。自分でメタデ…

Omekaについてのご紹介

http://omeka.org/about/ をざっと和訳してみました。ぜひご覧下さい。 Omekaは、自由で柔軟で、オープンソースのWebパブリッシングのプラットフォームであり、図書館や美術館・博物館、文書館、そして学術コレクションや展示に向けたものです。「5分で使え…

国会図書館近代デジタルライブラリー 一部書籍一部公開停止の件で

Togetterの解説にずっと書いておりましたが、あまりに長くなりすぎて読みにくいような気がしてきましたのでこちらに転載しつつ今後しばらくはこちらメインで更新していきます。最初に、筆者の立場を明らかにしておきますと、基本的に、学術出版に携わる方々…

Digital Humanitiesに関連しそうな学会・研究会を探してみる。

こちらは雑談サイトなので別のサイトを作って移動しました。

Windows7 64bit版でのキーバインド変更

常用マシンをLet's Note CF-C1 Windows7 64bit版に移行。ソフトをざっと買ってきてインストールして、Atokのデータを移行して、データはNTFSでフォーマットし直した外付けHDDを介して移動して、Mozilla関係のプロファイルはユーザディレクトリのAppData以下…

はてなを使ってみることに。

ちょっとはてなを使ってみることにした。

レッツノートC1のハードディスクをSSDに換装。

レッツノートC1のHDDに換装してみました。あまりの簡単さに 感動したのと、例によって、HDDの固定方法に感動したので 投稿することに。…と思ったけど、そんなことやってる場合ではないような気がしてきたのでまた今度。一応、かいつまんで書いておくと、袋に…

レッツノート CF-C1 SSD換装記

今回はとっても簡単です。すでに以下の写真では外してしまっている状態ですが、そこは気にせずに見てやってください。 まず、ここ(↑)のねじを外します。この一か所だけ外せばOKです。 最初はよくわからずに、例によってあちこち外してしまいましたが、 こ…