2020-01-01から1年間の記事一覧

Zoomで参加者リストやチャットも録画する

Zoomにはレコーディング機能がついていて、保存したらすぐにmp4で保存してくれるということで、この利便性は筆舌に尽くしがたいものがあります。一度レコーディングしながらオンライン授業を実施すれば、あとはそれをどこかに載せておいて受講生から見られる…

UTDHアンカンファレンスへのお誘い

学会・研究会の類がどんどん中止になっていき、一方で、オンラインでの開催も徐々に広がりつつあります。 そのようななかで、東京大学大学院人文社会系研究科人文情報学部門の大向一輝先生を中心に、 UTDHアンカンファレンス、というイベントが、今度の日曜…

オンライン授業をやってみた方々による実感のこもったツィートの数々

…を集めてみました。私自身は、運がいいのか悪いのか、まだ、今期のオンライン授業は一度もしておりません。 開始が後ろに順延しているところです。ですが、実際に今時の環境でやってみるとどうなのか、徐々に ツィッターにて体験者のみなさまのコメントが流…

デジタルアーカイブやデジタル文化資源をテーマに含むオンライン授業のための資料をご提供

背景事情のご説明 (この点に興味がない人は、下の方の「今回ご提供するもの」まで飛んでいただいてもかまいません) オンライン授業をしなければということで、大学では教員も学生もみなさま大変な状況になっておられると思います。 なかでも問題の一つは、…

聖徳太子御製『勝鬘經義疏』でText Encoding Initiativeを

TEI

このブログでは、長らくTEI (Text Encoding Initiative) ガイドラインについて扱ってきました。このたびは、 大正新脩大蔵経にNo. 2185として収録されている聖徳太子御製『勝鬘經義疏』をTEI(Text Encoding Initiative)ガイドラインに準拠してマークアップ…

オンデマンド配信での著作物の教育利用に向けて?

以下の件につき、識者の方々にご教示いただいた結果、SARTRASに補償金さえ支払えば、利用者側としてはその向こう側を特に気にする必要はないという立て付けになっていると理解しました。 色々気になるところではありますが、したがいまして、以下の件は素人…

みなさんのオンライン授業に向けた取り組み

いよいよ、オンライン授業に向けたみなさんの取り組みが活発になってきたようです。ツィッタを見ているだけでも色々なチャレンジや検討事項が流れてきていて、それが非常に具体化してきているのがとても面白いです。懐疑的な人も問題点を感じている人も、と…

Web動画:Voyant-toolsで簡単テキスト分析:コロナウイルス感染症対策本部の会議資料をみてみよう

「Voyant-toolsで簡単テキスト分析:コロナウイルス感染症対策本部の会議資料をみてみよう」という動画を作って、東京大学の大向先生が主宰しておられるUTDHチャンネルにあげていただきました。 Voyant-toolsは、カナダでデジタル・ヒューマニティーズを牽引…

オンライン授業のための情報まとめ

これから日本でオンライン授業をやるとしたらどういう形で可能なのか、ツィッタをながめていて得られた情報をまとめてみました。(これから徐々に追記していきます) 単位認定するには? 基本的に、送受信双方が同時通信に対応できるのであれば、あとは現実…

「ネットで国際会議」に向き合ってみよう

このところ、COVID-19のために世界中で会議が中止・延期になってきています。かく言う筆者も、2月末くらいからほとんど出ずっぱりだったはずの予定がほぼなくなってしまい、自宅か職場近辺(自転車通勤)をうろうろしております。 イベントの中には、情報処…

Apache Solrの検索でtoo many boolean clausesと言われた時

細かい話で恐縮ですが、自分のメモも兼ねて。 Apache Solrで作ったインデックスに細々検索をかけて、少し他の人にもチェックをお願いしたら、少し長めの文字列で検索した時に以下のようなエラーが出るという報告をいただきました。 { "responseHeader":{ "st…

検索した語の前/後のn文字をグループ化&ヒット数の多い順にリスト@みんなで翻刻サーチ

本日は、顧問としてお手伝いしている大学院生たちのデジタルヒストリー研究グループ、ToDHによるシンポジウムがあり、その関係で朝からお仕事でした。シンポジウムは大阪大学と九州大学からの招待講演の先生方お二人の深いお話と、主に大学院生達による新鮮…

今更 jQueryですが、簡単な要素の表示/非表示程度なら…

Web頁をインタラクティブに見やすくするための工夫としてJavascriptを使うのはもうごく一般的な手法になっています。Javascriptは、そのまま書くのはちょっと大変なので書きやすくするための工夫が様々に凝らされています。ライブラリやフレームワークが各地…

続:Apache Solrでファセット表示のタネ作り

今回は、以下の企画の続編です。 digitalnagasaki.hatenablog.com が… facet.pivotという機能を使った方が断然楽であるようですので、それを使って みんなで翻刻サーチに資料単位での絞り込み機能をつけてみたところです。 たとえば、以下のリンクのような感…

Evasion of breathing tax: editing TEI with VSCode

TEI

This article introduces how to set up VSCode so that any user can edit TEI/XML relatively easy by free, based on a brief report by Yifan Wang who is graduate student of the University of Tokyo and junior fellow in the International Institu…

フリーソフトで快適TEI/XML(Oxygenを使わない道)

TEI

TEI/XMLは、基本的には裏側で勝手にタグがついたりそれに対応した表示が勝手に行われてくれるものであり、個別には色々なソリューションがあります。 しかし一方で、「どういうタグをつけるか」「どういう風に構造化するか(=それにあわせてどういうタグを…

Flask/Python3からApache Solrに問い合わせるには

さて、ここまでApache Solrへの問い合わせの仕方を色々とみてきました。検索結果はJSON形式だったりCSV形式だったり、いくつか選ぶことはできるものの、人に優しい感じではありません。 しかしながら、コンピュータにはとても優しいもので、ということは、コ…

Apache Solrでファセット表示のタネ作り

最近、多くの検索サイトでは、検索した時に、絞り込みの助けになるような分類が横に表示されるものが増えています。Amazonや楽天では、検索語を含む商品のカテゴリやメーカー、価格帯などが出ますし、ジャパンサーチで検索すると所蔵機関がリストされたりし…

Apache Solr で異体字同時検索

さて、今回は異体字同時検索です。クラウドソーシング翻刻に限らず、字体・字形の選択ポリシーが一定していなかったり徹底されていなかったりということは、テキスト文字起こし全般においてしばしばみられます。普通にデータを作成していても、國學院大學を…

Apache Solr でとりあえず全文検索

前回記事では、Apache Solrを起動するところまでいきました。起動しただけではなんともなりませんので、まずは全文検索をできるようにしてみましょう。 Apache Solrで全文検索をできるようにするためには、大体以下のようなプロセスがあります。 Apache Solr…

Apache Solr - 全文検索、異体字同時検索、ファセット…

ここ5年ほど、Webでの全文検索は、どこも大体似たような感じの機能に落ち着いてきているように思います。全文検索ができて、異体字も同時に検索ができて、ファセットから絞り込みができて…。 この背景には、Apache Luceneという全文検索ソフトウェアの存在が…

みんなで翻刻のWeb API!

Web APIという言葉はあちこちで耳にされることがあると思います。API=アプリケーション・プログラミング・インターフェイス、ということで、つまり何かを作ったり動かしたりする時にやりとりをする機能、をWebで使えるようにしたもの、と考えておけばいいで…

みんなで翻刻⇔みんなで検索

「みんなで翻刻 」というサイトを知らない人は、このブログの読者にはいらっしゃらないと思います。しかしながら、○○業界なら必須アイテムになりそうだし、大体の人は知ってそうな…と思ってご紹介してみると意外とそうでもないことが多く、人が自分(の仕事…