『般若心経』の敦煌写本@フランス国立図書館を大正新脩大蔵経と比較できるツール

このところ、少しずつ時間をみつけて改良を続けている、「大正新脩大蔵経と他の木版・写本を簡単に比較できる仕組み」ですが、表示を高速化できるように色々工夫を行いまして、割とお待たせせずに表示できるようになりつつあります。

それから、「木版大蔵経の版まるごと」の比較だけでなく、個々の経典の写本や版本でも対比できるように、全体的に枠組みを拡張しました。まずはお試し版ということで、短いけど有名なテキスト『般若波羅蜜多心経』で、フランス国立図書館に所蔵されている敦煌写本ペリオコレクションから2つの写本を組込んでみました。以下の画像で、左上の「大蔵経一覧」のところを選ぶとそれぞれの版と大正新脩大蔵経が表示できるようになっています。

https://sate.dhii.jp/VIEW/ZJK/TID/T0251_.08.0848c04

これらのテキストでは、黄色いマーカーがついていますが、そのうちで、「@」ではなく文字についている箇所は、大正新脩大蔵経と文字が異なっている部分です。(なお、フランス国立図書館の画像サーバは結構重く、よく止るので、画像が見えない時は焦らず、のんびりご対応ください。)

大正新脩大蔵経(左側)のテキストの黄色いマーカーがついている文字をクリックすると、対応する真ん中のOCRテキストが画面の真ん中に移動し、同時に、それに対応する画像も表示されるはずです。これで、テキストの異同の確認を画像単位でできるようになりました。SAT2018の該当行からもいけますので、そちらから試していただいてもよいかと思います。以下の画像のように、見たい版にチェックボックスをいれて、本文の確認したい行をクリックすると、新たなウインドウが開いてその箇所が表示されます。

さて、これは例によって、国立国会図書館の古典籍OCRを使ってテキスト化したものです。…と言っても、木版はともかく、敦煌写本の手書き文字はなかなか手強かったようで、おそらく25%くらいは手直しをすることになりました。まあ、それは、人間がみてもよくわからないかもしれないような字でしたので、仕方が無いことかと思います。

この仕組みはまだ開発途中で、にも関わらず公開してしまっているのですが、つまり結構頻繁に改良作業のために一瞬止ったりすることがある、ということになります。その点、お気をつけいただけますとありがたいです。