IIIF の検索結果:

CTSからDTSへ:古典籍引用の新たな枠組み

…テキスト引用におけるIIIFのような存在になりたい、というようなことをおっしゃっていました。サイトを見ると概ね以下のような説明があります。 Distributed Text Services (DTS) 仕様は、テキストコレクションを機械可処理データとして扱うための API を定義する。 デジタルテキストコレクションの発行者は、DTS API を利用することで、自身のテキストデータを Findable, Accessible, Interoperable, Reusable …

IIIF対応デジタルアーカイブのサーバを更新・更改・アップデートする際に気をつけていただきたいこと

…日本でも広まってきたIIIF対応デジタルアーカイブのサーバも、そろそろ各地で更新・更改・アップデートの時期を迎えているかと思います。その際に、担当者の方々に気をつけていただきたいことがあります。それは、URIを変えないでいただきたい、ということです。これは、IIIF Imageサーバや IIIF maunifest URIだけでなく、 IIIF Presentation APIの中の Canvas URIも変更されると困るものの一つです。 とはいえ、担当者の方々が、「変えない…

簡単に簡素なデジタルアーカイブを構築するにあたってIIIF対応も簡単に

…を構築するにあたってIIIF対応も簡単に」する方法です。それができるサンプルプログラムをしばらく前に作って紹介しましたので、それをご紹介する記事です。そして、この記事は、初心者向けの記事ではなく、そういうことができるシステムをすでに作っていたり、これから作ろうと思っている方々に、「もう一手間かけるとIIIF対応にできる」ことを知っていただくことを目的としたものです。ですので、そういう方々は、ここで紹介するプログラムを見て、ぜひ色々と可能性をご検討ください。 デジタルアーカイブ…

生成AIの新展開!?―学術研究支援用ボットを作ってみた。その(1)

…いる)AI-OCRとIIIFを使った木版仏典画像の超効率的なcollationという話だったのですが、もう一つ、RAG (Retrieval-Augmented Generation) を使った生成AI学術研究支援ボットのようなものを作って紹介してみたところ、これもなかなか好評でした。今回の記事は、ここで作ってみた経験を通じて、このRAGというものが、これまでは結構使いにくかったものから急に極めて使いやすくなったという、一大転換点が生じているように思いましたので、これをぜひみ…

歌合絵巻テキスト構造化&IIIF画像連携の成果が公開されました

… そして、この画像はIIIF対応で公開されていますので、たとえば以下のような感じで、「虫」がどこにいるのか、拡大して探してみることもできます。 では次に、この会に参加したり歌を詠んだりした人たちはどういう人たちだったんだろう…?と思った時には、「人物」タブをクリックしてみましょう。 今度は、人物のリストが表示されます。各人物の名前をクリックしてみると、その項目が開いて、その人物の詳細情報が表示されます。たとえば、以下のような感じです。 そして、人物情報の下の方に、「参照してい…

それでも高度なデジタルアーカイブを提供したい時は:「一次公開」「二次公開」とIIIF

…とです…というのは、IIIF (International Image Interoperability Framework) 登場以前の話でした。今はそう考える必要がありません。 IIIFの枠組みでは、このルールに従って公開された画像は、この枠組みに準拠したより良いツールが登場したら、そのツールに切り替えることができます。それは、デジタルアーカイブ提供者だけでなく、利用者の側でIIIFに準拠した好きなツールを使用することができます。ですので、提供者側ではできなくても、利用者…

「デジタルアーカイブ」構築のロジと専門知識

…大変でしたが、近年はIIIF (International Image Interoperability Framework)の普及により、あるレベルまでは簡単に構築したり発注したりできるようになりました。画像を拡大縮小しながら閲覧して、メタデータを検索して検索結果を表示する、くらいのことであれば、かなり容易にできるようになってきました。システムの高度化に関しても、IIIF対応で構築・公開すれば、IIIF Curation Platformを利用して注釈をつけたり、みんなで翻…

デジタルアーカイブのためのプログラミングレッスン:第7回を追加しました。

…ンを対象として、主にIIIFのデータを扱うことを目指した基礎的なプログラミングレッスンの教材を作成中です。ようやく第7回を追加しました。ここまでの繰り返しになって恐縮ですが… バリバリの研究にすぐに役立つ手法ではないのですが、むしろ、色々さらっと調べてヒントを得たいとか、研究支援的な仕事などには応用できることがあるのではないかと思います。 また、これですべてできるようになるというわけではありませんが、入口として試してみていただいて、そこからプログラミングの基本に立ち返っていた…

デジタルアーカイブのためのプログラミングレッスン第一回~第六回

…チのAPIを用いて、IIIF Manifestを操作してサムネイル画像を作成する、というところまでに必要な機能をプログラミング言語Pythonで一通り勉強するものです。 バリバリの研究にすぐに役立つ手法ではないのですが、むしろ、色々さらっと調べてヒントを得たいとか、研究支援的な仕事などには応用できることがあるのではないかと思います。 また、これですべてできるようになるというわけではありませんが、入口として試してみていただいて、そこからプログラミングの基本に立ち返っていただいた…

デジタルアーカイブのためのプログラミングレッスン第一回~第四回

…ツをMiradorやIIIF Curation viewerで直接開くリンクを作成できるようになります。 これですべてできるようになるというわけではありませんが、入口として試してみていただいて、そこからプログラミングの基本に立ち返っていただいたり、モチベーションを高めたりするきっかけにしていただけますと幸いです。 教材は、国立国会図書館デジタルコレクションです。主に、検索用のAPIを使わせていただいております。これもなかなか素晴らしいもので、デジタルアーキビストならぜひ使いこ…

TEI用ビューワでローカルPC上の画像を表示するには(準備編)

…最近増えてきました。IIIFなら簡単なのですが、ローカルPCだと微妙に難しいところがあります。Webブラウザのセキュリティが色々細かくなってきているので、それをどうパスするか、という課題もあります。そのあたりをクリアしたTEI用ビューワを最近2つほど作成しました。日本近代文学の草稿研究向けのものと、和歌・歌合研究のためのものです。基本は同じですが、今のところそれぞれ少しニーズが異なるので、ベースは同じで、それぞれにカスタマイズしながら作っています。 なお、ローカルPC上の画像…

書誌情報作成/図書館情報学/デジタル・ヒューマニティーズ/デジタルアーカイブに関心がある方々におすすめの講演会

…報だけでなく、画像をIIIF対応で公開しているのはもちろんですが、さらに、テキストによっては本文もTEIガイドラインに準拠した形で作成・公開しています。科学史の研究者の方々ならおそらくよくご存じかと思いますが、ここの図書館のNewton Papersというデジタルコレクションでは、ニュートンの手書き原稿のTEIガイドラインに準拠して構造化された翻刻テキストが公開されています。たとえば、Papers connected with the Principiaでは、以下のような感じ…

京大OCW閉鎖の件に寄せて:これからの可能性だったものの一つ

…ソリューションとしてIIIF(International Image Interoperability Framework)における動画アノテーションという技術仕様がある。残念ながらYouTubeには適用できないのだが、MP4動画であれば、公開されている動画を別のサイトで再生させ、その際に画面上(+タイムライン上)に文字や画像、音声、動画をアノテーションとして付与することができるという、結構アレな技術仕様なのだ。もちろん、仕様としてアレ過ぎて、それを完璧に実装できるソフトウェ…

サンスクリット写本 データベースを作った話

…最近、和本に関してはIIIFの普及もありかなり標準化されてきているので割と簡単にできるようになって いるようにも思えますが、今回はちょっと事情が異なるかもしれないですし、そもそも外注する費用がちょっともったいないということもあり(それより 若手に色々作業してもらう謝金に回した方がいいと思うので)、自分で構築することにしました。 利用するソフトウェア データの件数としては、公開当初は一部のみを先行公開ということでしたので100件に満たない数で、しかし最終的には数千件のデータを扱…

Apache Solr8のnested documentの検索の仕方

…*]' 子を検索してその親と子を両方表示(hierarchy_s:parentは親、title_tは子) curl 'http://localhost:8984/solr/skrt/select' -d 'omitHeader=true' -d 'q={!parent which="hierarchy_s:parent"}title_t:pra*&wt=json&fl=iiifmanifesturi_s,id,msItems,title_t,[child]&rows=100'

IIIFでMirador3をMirador2のような便利さで使うために

IIIFでの画像ビューワの一方の雄であるMiradorは、現行バージョンのMirador3が出てしばらく経ちます。Mirador2の更新が止まってしまったことで、Mirador3に移行するところも徐々に増えてきているようにみえます。 しかしながら、Mirador3は、Mirador2の時代に最初からセットされていたいくつかの便利な機能がプラグインとして外付けされるようになって しまいました。ただ、このプラグインの組み込みが、以前のように簡単ではありません。いったんWebpac…

Mirador3をMirador2のような便利さで使うために

IIIFでの画像ビューワの一方の雄であるMiradorは、現行バージョンのMirador3が出てしばらく経ちます。Mirador2の更新が止まってしまったことで、Mirador3に移行するところも徐々に増えてきているようにみえます。 しかしながら、Mirador3は、Mirador2の時代に最初からセットされていたいくつかの便利な機能がプラグインとして外付けされるようになって しまいました。ただ、このプラグインの組み込みが、以前のように簡単ではありません。いったんWebpac…

曼荼羅上の菩薩の名前をIIIFで確認できます+あつ森対応の件

…回のアップデートで、IIIFアノテーションは2万件を超えました。 青山学院大学の津田徹英先生率いるチームによる作業で、科学研究費補助金の研究成果公開促進費(データベース)の成果でもあります。 今回の目玉はいくつかありますが、一つは曼荼羅画像の各菩薩等へのアノテーションです。 「等」というのは、たとえば獅子さんとか蟹さんなどもいらっしゃいますので。 それはともかく、一つの曼荼羅に含まれる300~450くらいの各菩薩等に アノテーションが付与されましたので、これは大変に素晴らしい…

ケンブリッジ大学デジタル図書館の日本資料の書誌情報を視覚化してみる

TEI

…けで463件が画像(IIIF対応)と ともに公開されています。 このTEIガイドラインに準拠したメタデータには、いくつかの特徴がありまして、特に興味深いのは、来歴情報、provenanceが割とよく書いてあり、 そこに登場する人物を同定できるようにしている、という点です。そうすると、この書誌情報データを一通り取得すれば、たとえば以下のような ことができます。 これは、「ケンブリッジ大学デジタル図書館における日本資料の入手に関わった人の 貢献の割合をTEI ガイドライン形式の書…

データクレンジング/大日本仏教全書の目次データを作成した話

…のが、最近導入されたIIIF Manifestファイルを見たときに「sc:Rageを取得すれば目次がとれるぞ」と思ったことです。 たとえば、 https://www.dl.ndl.go.jp/api/iiif/952681/manifest.json このようなIIIF Manifest URIで、"structures"以下に配列として入っている要素のうち、"@type": "sc:Range"の"label"を取得すれば確実に機械的に取得できます。JSON形式データなので…

動画へのアノテーションを(サーバなしで)手元で試してみる

本日、初めてのIIIF動画アノテーション講習会を実施しました。受講者だか講師だかわからないような人たちが続々ご参加くださったおかげで大変有益な議論ができました。 これにあたって、どういう風にすると皆さんが試しやすいだろうか…と考えつつ準備をするなかで、やはり、IIIF Manifest のJSONファイルを手元で書いて、それに手元で アクセスして確認&閲覧できるようにするのが便利だろうという気がしてきたので、Miradorをローカルで動かす方法を考えてみました。これだと、 イ…

Web動画をアンロックする:IIIF動画アノテーションのご紹介

…ンをするだけですが、IIIF動画アノテーションの仕組みでは、「時間」と「動画上の任意の位置」を指定して、さらに文字だけでなくあらゆるコンテンツのアノテーションができるということになっています。(ただし今回できるようになったのは文字と静止画像アノテーションです)。 それから、もう一つの大きな違いは、アノテーションの規格がオープンなものであるということです。これには色々なメリットがありますが、たとえば、特定の企業にデータ形式を左右されて急に使えなくなったりすることがなく、さらに、…

IIIFで動画:『あつまれ動物の森』にSAT図像DBのIIIF画像を取り込む方法をIIIF動画で紹介してみる

…が作れなかったので、IIIFの動画コンテンツの扱い方の紹介にあわせて、SAT図像DBのIIIF画像を『あつまれ動物の森』に取り込む方法をご紹介したいと思います。 ちなみに「あつまれ動物の森」は、以下のツィッタアカウントにもみられるように、デジタル人文学(DH)界でも新たなコミュニケーションツールとして活用されるようになっており、先日のバーチャル国際学術大会 でも知る限り少なくとも2本のセッションが「あつまれ動物の森」を用いて開催されたようでした。 twitter.com さて…

Mirador 3が正式リリース:IIIF対応ビューワが新しくなりました

IIIF対応ビューワの代表格の一つ、Miradorの新バージョンが、ついに正式リリースとなりました。バージョン2の反省を踏まえつつ、一方で、バージョン2を通じて一気に広がった開発者コミュニティのパワーを活かして、バージョン2よりも圧倒的に便利そうな雰囲気のものができあがってきました。 開発の中心になったのはスタンフォード大学図書館の面々です。開発に着手するときは、インターフェイスの専門家に担当してもらって片っ端からインタビューを行なって可能な限りニーズに対応したものを作るべく…

40代後半人文系で未だにWeb開発をしている理由

…近の大きなものでは IIIF がありましたが、自分がIIIFを試し始めた頃は、まだ欧米でも 人文学者はほとんど参画していなかったので、何にどこまでどう使えるのか、ということを 仕様を見ながらオープンソースソフトを試しつつ確認して、実際にシステムを構築してみる、 ということをする必要がありました。IIIFに関しては、いけそうだという確信はありましたが、 1度目に試した時はあまりうまく使えず、1年ほど後に、その時の課題が解決されたようである のを見て2度目に試してみて、ようやく、…

3Dミーティングツール? Hubs Cloud がすごすぎて呆然

…ーカイブコンテンツをIIIF経由で取り込めます、ということが話題になってましたが、 これなら、任天堂スイッチを買いそびれた人でも楽しめそうですね(『あつまれ 動物の森』とは意義は全然異なるわけですが、まあそこは置いておきまして)。 automaton-media.com 今回は一人でインストールしただけなので、この後、他の人が参加するとどういう風になるのか色々試してみたいところですので、今度の週末にでも、 どなたかご協力をいたけますと大変ありがたく存じます。スケーラビリティ的…

UTDHアンカンファレンスへのお誘い

…ては、上記のサイトから参加申し込みをする必要があります。 今のところ、以下のようなセッションが予定されているようですが、その後もう少し入れ替えや増減があるかもしれません。 財務記録史料の構造化記述に向けて 文化庁メディア芸術データベース・ベータ版のデザイン 大蔵経データベースの近未来 自然科学記録のデジタルアーカイブ 歴博・総合資料学から公開の新アーカイブ IIIFによる3Dアノテーション ビデオゲームのオンライン目録の開発 ご興味がおありの方は、ぜひお気軽にご参加ください。

デジタルアーカイブやデジタル文化資源をテーマに含むオンライン授業のための資料をご提供

…かと思います。特に、IIIFについて説明をしなければならないような今時の図書館情報関係の授業等では、 とりあえず第五章を渡しておけばかなり楽ができるのではないかと思います。また、第七章の「評価の問題」は 色々な観点から議論できる内容かと思いますので、学生同士の議論の材料としてご利用いただくと面白いかもしれません。 そのようなことで、もしご利用してみようかと思われる場合には、ぜひ下記のGoogle Formから お申し込みください。ちなみに、本書の章立ては以下のようになっており…

聖徳太子御製『勝鬘經義疏』でText Encoding Initiativeを

TEI

…は国立国会図書館からIIIF対応のデジタル画像が公開されています。 また、デジタル化の対象となった本の画像もSAT大蔵経テキストデータベース研究会から公開されています。 そういったデジタル画像の情報を記載しています。 上記のTEI/XMLファイル中では <facsimile> - </facsimile> に囲まれた箇所になります。 一つのfacsimileが一つのIIIF Manifest ファイルに対応し、一つのsurfaceが IIIF Canvas URIに 対応し、…

みんなで翻刻のWeb API!

…です。画像に関しては、IIIF対応画像の翻刻をシステムの基盤の一つとしていることもあるのかもしれませんが、IIIF Manifestを継承した形になっているようで、これをきちんと理解しようと思うなら、IIIF Presentation API 2.1をみておくとよいかもしれません。 というわけで、今回は、Web APIで本文を取得する方法を最短距離でまとめてみました。 エントリのJSONデータからどのデータを取り出してどのように使ったか、という話は、また次の機会としましょう。