2021-11-17

増上寺三大蔵がユネスコ「世界の記憶」における国際登録の登録申請案件に

先日、文部科学省から、増上寺三大蔵がユネスコ「世界の記憶」における国際登録の登録申請案件に推薦されることになったとのお知らせがありました。

文部科学省のサイトによれば、ユネスコの「世界の記憶」は、以下のようなもののようです。

世界的に重要な記録物への認識を高め、保存やアクセスを促進することを目的に、ユネスコが1992年に開始した事業の総称。本事業を代表するものとして、人類史において特に重要な記録物を国際的に登録する制度が1995年より実施されている。

そして、この「世界の記憶」の現在の登録状況は、

現時点で429件が国際登録、56件が地域登録されている。日本からは国際登録に7件、地域登録に1件が登録されている。

とのことです。

ここで話題にしている増上寺三大蔵は、この文科省のサイトでは以下のように説明されています。

17 世紀初頭に徳川家康が日本全国から収集し、浄土宗の大本山である増上寺に寄進した、三部の木版印刷の大蔵経（※）。現代の仏教研究の基礎を為すという文化史上はもとより、漢字文化、印刷文化の観点からも貴重な史料。全て国指定重要文化財。 ※「大蔵経」…5,000 巻を超える仏教聖典の叢書。

家康が集めて寄進した、という経緯もなかなかすごい話で、当時はまだ入手がかなり困難であった大蔵経を、3セットも、しかも異なる時代・地域で印刷されたものを集めたというのもすごいことですが、これに加えて、天海僧正に木活字版の大蔵経を編さんさせたり（このあたりはまだよく理解していなくて、家康は支援していただけ？）もしていたようです。（これは寛永寺で実施されたようで、天海版として現在も各地の古寺名刹の経蔵に納められているそうです。ColBaseで刊記がみられたり、国文学研究資料館で妙法蓮華經観世音菩薩普門品の全頁画像が見られたりします。）

この三大蔵（木版印刷で、宋代に刊行された思渓版、元代に刊行された普寧版、高麗で刊行された高麗版再雕本）が現代の仏教研究の基礎を成す、というのは、直接には、明治14年から18年にかけて刊行された大日本校訂大蔵経（縮刷蔵）の校訂編纂にこの三大蔵が使われたからなのです。お寺の宝である大蔵経ですので、おいそれと人に見せられるものでもなく、そもそも分量が膨大ですので（5000巻以上になる）、それを3セット広げて確認するだけでも相当な時間とそれなりの場所を必要とします。日常業務に加えてこれを3セット全部出して、編纂作業をしにくる人たちが扱いやすいように用意する、ということを考えただけでもかなり膨大な作業量になってしまいそうです。実際のところ、お寺が大切に所蔵してきた大蔵経を、単なる複製ではなく編纂に供した例は国内では他にはあんまり思いつきません。獅谷白蓮社の忍澂上人が1702年から5年かけ、若者達を動員して建仁寺の高麗版（現在は焼失）を黄檗版（鉄眼版とも。主に嘉興蔵を模し、日本で広く普及した整版。）と一通り比較した、という話は残っていますが、校正録や一部の経典を刊行したくらいのようであり、大蔵経全編を刊行した、というわけではなさそうです。また、大蔵経全編を一人で全部写経した色定法師という大物もおられますが、宋版大蔵経一つをみながらだったようですので、3セットも並べるというほどの大事ではなかったかもしれません。

さて、そのようなことをどうやって実現したのか、というところで出てくるのが、増上寺七〇世であった福田行誡上人です。行誡上人は様々なご活躍をされた人ですが、その偉業のうちの一つに、この大日本校訂大蔵経（縮刷蔵）の刊行事業があります。この事業は天台宗本山派修験道の大先達であり政府の役職にあった島田蕃根と共に推進したようで、島田蕃根の事績を調べると縮刷蔵の刊行に関する情報が色々出てきますが、この事業は、廃仏毀釈や増上寺大殿の放火による焼失などの苦難から立ち直るなかで、おそらくはこれまでどこもやったことがないような大変な事業を、弘教書院を設立するという形で引き受けたようです。『島田蕃根翁』によれば、

最初は弘教書院を京橋山城町に置きましたのを、行誡上人の好意に依つて増上寺大門前の源興院に移し、此處で校合を始めることになりました

とのことで、ここに三大蔵を持ち出して作業しと思われます。自らの宗派のみならず、広く他宗派の僧侶にも集まってもらって編纂を行ったようで、『島田蕃根翁』には参加者の名前もリストされています。ちょっと長いですが、文字起こししたものを以下に貼り付けておきます。ただ、これでも全員ではないそうです。

東京芝區愛宕下銭照院寄寓眞言宗居士　飯島道實
美濃國武儀郡高野邑臨済宗永昌寺徒弟　東海玄虎
美濃國眞島郡垂見邑同宗佛土寺徒弟　　　桑宜動
東京築地眞宗應善寺住職　　松岡了厳
近江國蒲生郡豊浦邑天台宗東南寺住職　櫻木谷慈薫
武藏國橘樹郡神奈川町眞宗長延寺住職　雲居玄導
駿河國益津郡郡村臨済宗慶全寺前住徒弟　天野宜格
豊前國宇佐郡日足村曹洞宗地蔵院前住徒弟　佐藤道悟
東京下谷區南稲荷町眞宗南松寺住職　櫻木谷範隆
信濃國南佐久郡跡部村浄土宗西方寺住職　森亭闇
紀伊國海部郡湊村天台宗明王院住職　蘆津實全
東京赤坂臨済宗種徳寺住職　朝木英叟
近江國滋賀郡比叡山坂本村天台宗正觀院住職　岩本榮中
伊勢國安濃郡垂見村眞言宗成就寺住職　牧政純
遠江國榛原郡牧谷原士族　伊佐岑満
上野國勢多郡大胡町浄土宗養林寺住職　月性豊民
上總國長柄郡高洲驛日蓮宗實相寺住職　守本惺亮
駿河國富士郡大鹿村日蓮宗三澤寺住職　齋藤日一
武蔵國南葛飾郡亀戸村眞言宗普門院住職　千葉賢永
三河國碧海郡河野村眞宗東派宗園寺衆徒　太田祐慶
山城國紀伊郡伏見同宗西方寺副住職　兼松空賢
丹波國與謝郡須津村臨済宗江西寺徒弟　外山義文
東京芝公園地廣度院住職　千葉寛鳳
飛騨國大野郡大名田村眞宗入寺住職　平野素藏
同國益田郡馬瀬村同宗桂林寺住職　日野厳了
美濃國本巣郡文殊邑曹洞宗成泉寺住職　古田梵仙
越後國岩船郡平林驛同宗千眼寺住職　山本法泉
東京築地眞宗敬覺寺住職　大江凝玄
摂津國有馬郡三田村曹洞宗心月院住職　蘆浦默應
備中國淺口郡柏島村天台宗福壽院住職　實相圓隨

この一大事業が比較的短い期間で刊行に至ったということは、それだけ関係者の力が集約されていたということでもあろうかと思います。（このあたりの記述は主にこちらの松永知海先生・梶浦晋先生の記事に拠っています）

ちなみに、なぜ縮刷蔵と言われるのかといえば、懐に入るハンディなものを作ろうとしたためのようです。結果として字が小さくてちょっと読むのが大変なものになってしまった感もありますが、サイズ感を見ていただくと大体以下のような感じです。

f:id:digitalnagasaki:20211116113659j:plain — 大正新脩大蔵経と並べたサイズ感

f:id:digitalnagasaki:20211116113538j:plain — 縮刷蔵の校異情報（頭注として書かれている）

ちなみに、この編纂にあたっては、上記の『島田蕃根翁』では以下のように記述されています。

校合の順序校合には、種々方法を考へましたが、大躰は、高麗藏に依ることとし、即ち高麗藏を原稿として、其れに宋藏、元藏、明藏の三藏を對照して、校訂することとし、若し増上寺の元藏が缺けて居れば淺草淺草寺の元藏を對照して之を補ひ、又、増上寺ので缺けた處があれば、忍澂師の校正本を以て之を補ふこととし、略ぼ仕組は出来ましたので、まづ、一人が大きい聲で高麗藏を讀むと、三人の人が其側で、元藏、宋藏、明藏の三つを見て居て、「それ缺けて居る」「此方には斯様ある」と云ふ様に、双方で相違した點を謂ひ立てる、直に筆を執つて、原稿の麗藏の上に、其由を書き付ける、中には、長行と偈頌と違つて居るものもあれば、全く文字の無い所もある、四本相對しても、全く解らぬ時には、□を付けて後日の識者を待つこととし、それでも、何ぞ、外に流布した本に、参照して見るべきものがあつた時には、其を書き加へて、「今按」の二字を加へ、又、全く参照すべきものもなく、而かも意義の通り安いものは、「疑何誤」「恐當作何」と書いて後人の爲に便利を謀りましたか、此時などには、校訂者に博識の人がほしかつたのです、今、當時、校合者の爲た仕事の順序を云へば、第一業　校本刪補第二業　句讀第三業　麗、宋、元、明四本對校第四業　再校第五業　印刷對校此の通りにしていきました

当時は部数限定でそれほど広まらず、結果として、その後しばらくの時を経て、大学院生が師匠に「縮刷版は入手が難しいからなんとかならないか」と訴えるに至り、それも大正新脩大蔵経刊行の動機の一つのなったようですが、それはまた次の話になります。

大正新脩大蔵経刊行に関しては、すでにこちらのブログ記事にかなり書いておりますので、そちらをご参照ください。大正新脩大蔵経は、縮刷蔵の本文や校異情報を引き継いでいる部分もあるようですが、増上寺三大蔵を改めて踏まえたようで、そのようにして刊行された大部の大蔵経が、世界中の研究図書館に所蔵され、標準的に参照される漢文仏典として広く活用されるようになりました。

この件にはさらに続きがありまして、この大正新脩大蔵経が、筆者もお手伝いしているSAT大蔵経データベースや、台湾で推進されているCBETA大蔵経といった、デジタル時代の仏教学研究基盤を支える重要な要素になります。特に重要だったのは、ある文献のある箇所、というのを指定し共有し議論する際に、大正新脩大蔵経における位置情報を利用できることです。世界中の多くの図書館に所蔵されているために現物の確認が容易であり、また、それまでの実績から、研究論文等でも同様に参照されてきたため、デジタル時代の研究基盤として移行していく際に情報共有のための基盤になったのです、学術情報流通の文脈で言えば、すでに識別子がテキスト単位・頁単位・段落・行単位等で付与されている上に、デジタル以前の論文にも識別子が記載されていて、デジタルデータとして入力すればその識別子を用いて機械的に接続できてしまう、のです。いわば、DOI以前のObject Identifierになっているわけです。実はこれは聖書学でも同じような状況で、西洋古典学でもCTS (Canonical Text Services) というのが以前から用いられていますので、古典学では驚くほどのことではなくて、むしろ、日本の古典作品も頑張りましょう、という話なのですが、それはともかくとしまして、このようにしてデジタル研究基盤を支えるプロトコルが大正時代から用意されていて、それを可能にしたのが増上寺三大蔵だった、ということなのです。また、仏典は、仏教研究だけでなく、様々な研究において参照されることがあります。その場合、その内容だけでなく、参照しようと思うような信頼性を有することも重要なのですが、そのような意味でも、増上寺三大蔵に基づいて編纂された、ということがその信頼の基礎に置かれているように思います。

ということで、ちょっと長い割に内容が薄くて恐縮ですが、増上寺三大蔵のありがたみについて、思うところを述べさせていただきました。自分は仏教学を基礎にして仕事をしていますので、日々、このことを忘れることなく取り組んでおりまして、それがユネスコの記憶遺産に申請されることになったのは、たいへんありがたいことであると思っており、ここに至る努力と、これからさらに登録に向けて進めてくださる関係者のみなさまには深く感謝する次第です。

2021-10-02

サンスクリット写本データベースを作った話

最近、サンスクリット写本のデータベースを作りました。といっても、文字起こししたテキストデータベースではなくて、デジタル画像のデータベースです。世間ではむしろ「デジタルアーカイブ」と言った方が通りがいいでしょうか。

一人で作ったわけではなくて、メタデータを作ってくださった人と、デジタル画像を撮影してくださった企業、撮影された画像を検品してくださった人、撮影等の費用を捻出するために助成金を取ってくださった人、その助成金を出してくださった組織、といった色々なステイクホルダーがあり、また、そういったデジタルに関することとは別に、この資料を集めてくださった人たち、大事に整理・所蔵してきた図書館の方々、という、現物に関するステイクホルダーの方々もおられます。

私の役割は、そういった方々の間を回って話をしたり色々作っていただいたりしながら、現物のサンスクリット写本の「デジタル代理物」としてのデータベース（デジタルアーカイブ）のシステム部分を構築した、ということになります。ここでは、そのシステム構築の部分の話をちょっと書いておきたいと思います。

まずはじめに

この種のものを構築するときは、仕様書を書いて外注するのが一般的ですが、そもそも元になった資料の性質やとれるメタデータ等々、一通りきちんと把握していないと良い仕様書は書けません。最近、和本に関してはIIIFの普及もありかなり標準化されてきているので割と簡単にできるようになっているようにも思えますが、今回はちょっと事情が異なるかもしれないですし、そもそも外注する費用がちょっともったいないということもあり（それより若手に色々作業してもらう謝金に回した方がいいと思うので）、自分で構築することにしました。

利用するソフトウェア

データの件数としては、公開当初は一部のみを先行公開ということでしたので100件に満たない数で、しかし最終的には数千件のデータを扱うことになります。数千件ですと、今のコンピューティングであれば単にテキストファイルを用意して検索するだけでもいいのですが、AND検索、OR検索、NOT検索等の各種検索に加えてソートをしたり等々といった色々な検索機能を拡張していくことを考えますと、そういう機能が充実しているソフトウェアにデータを組み込んでしまった方が構築や改良が圧倒的に楽です。そこで、最近この種のことに使っている全文検索ソフトウェアApache Solrを今回も採用することにしました。

検索システムへの格納

どういうデータをここに載せて検索させるか、ということについては、相当悩みました。というのは、メタデータはTEI P5の形式で用意されており、そこからいかにしてうまく必要なデータを取り出して便利に使えるようにするか、ということでした。似たようなこと（＝TEIに準拠したメタデータで古典籍の書誌情報検索を提供）をしているサイトとしては、ケンブリッジ大学デジタル図書館がありましたので、あまり凝りすぎずに、ここでできていることを目指せばいいか…というくらいに考えていたところでした。ただ、難しかったこととして、基本的に、写本の一つの束の中には複数の経典が含まれていることが多く、写本の束と含まれている経典のどちらを基準としてデータを構築すべきか、ということについてかなり悩み、ちょうど、Apache SolrでNested Child Document機能が使えるようになったと知ったのでそれもかなり色々試してみたのですが、結局、どうもうまくいかない点がいくつかあって（苦闘の記録）、今回は諦めて、中に含まれている経典の単位、いわゆる子書誌を単位にしたデータ格納をすることにしました。ですので、すべての子書誌が親書誌の情報をそれぞれ有していて、検索後、表示等をする際には親書誌情報単位でまとめて表示する、という関係になっています。

IIIF対応のための作業

画像は、Phase Oneの1億画素のデジタルバックで撮影したものを、JPEG圧縮をかけたPyramid TIFF画像に変換しました。これはTIFF画像の時点では1枚あたり300MBくらいありますが、JPEG圧縮を結構かけているのでPyramid TIFFでのファイルサイズは18Mバイトくらいです。これを、IIP Image Serverを使ってIIIF Image API経由で閲覧できるようにしました。（詳しいやり方はこちら）ついでに、サムネイル画像作成もしたのですが、これはvipsthumbnail というLinuxのシェルで使えるプログラムで繰り返し処理をしたらさくっと終わりました。

その後、IIIF Presentation APIです。IIIF Presentation APIを用意するということは、すなわち、IIIF Manifestファイルを作成するということです。これは、やはりTEI P5に準拠したデータをなるべくよい感じで取り出して、metadeta フィールドに全部押し込んでしまう、というのが基本的な戦略です。TEI準拠で書かれたメタデータファイルと画像のデータやThumbnailなども組み込むPythonのスクリプトを作成して、これはそんなに難しくなくできました。スクリプトのひな形はこちらですが、もう少し整理できたら、今回新たに作成したスクリプトも公開したいと思っております。

Webインターフェイスの作成

さて、検索とIIIF対応画像・IIIF Manifestファイルは作成できました。次はWebインターフェイスです。Webインターフェイスは、凝り出すときりがないので、なるべく簡素に、Bootstrapのテンプレートの中でよさそうなものを使って見ることにしました。「Album」というのがありましたので、それを使ってみることにしたのですが、ただ見せるだけでは面白くないのではないか…と思ってきてしまい、少しだけギミックを作り込んでしまいました。

ちょっとしたギミックの作り込み

f:id:digitalnagasaki:20211002173747p:plain

サムネイル画像の表示は、写本の束の単位で、トップページでも検索結果でもサムネイル画像が表示されるようにした上で、各サムネイル画像に代表的なIIIF Viewerで開くようにリンクアイコンを付けた上で、さらに、「Go」「Back」ボタンでそれぞれの写本のサムネイル画像を遷移できるようにして、さらに、写本の束のタイトルをクリックすると、表示されているサムネイル画像のページでIIIF Viewer (Mirador 3) が開く、という風にしました。また、IIIF Curation Platformでも、該当ページが開くようになっています。Universal Viewerはやりかたがよくわからなかったので諦め、TIFYは、やり方はわかったのですが n枚目という記述を独自形式で行わねばならず、ちょっと面倒だったのでやりませんでした。（でも30分も集中すればできると思いますが）。

というようなことで、このサムネイル画像表示にはちょっと凝ったのですが、なかなか楽しくて気に入っています。

反省点

ただ、反省として、この種のページを作るには、明らかにvue.jsのような仮想DOMを使った方が全体構成としては楽だったはずなのですが、vanilla JSがどうもよくわからないことがあって、しかしjQueryは何も考えずに普通に使えてしまうので、ついjQueryで書いてしまいました…。反省しつつ、vanillaの勉強をしなければと改めて心に誓ったのでした。

2021-10-02

著書・共著書は業績であり続けられるのか

※書いていたら長くなってしまったので結論だけ先に書いておきますと、「学術出版社の皆さま、明示的に査読制度を作っていただくとよいと思います」という話を書いております。

研究業績とはどういうものか、ということについて、ずっと考えております。先日はパワポ資料が業績になるかどうか、ちょっと書いてみたところでした。もちろん、業績の「評価」は評価する主体が基準を決めるものですから、自由に決めてよいのですし、パワポ資料を他のスタイルの研究発表と公平に評価する基準を作れるのであれば何の問題もありません。個人的には、粗製濫造が可能であり記号の標準化も不十分なパワポ資料を評価するのはすごく難しいだろうと思いますが、内容に踏み込まずに何がが作られていることさえ確認できればよいとか、あるいは、altmetricsを評価基準に持込むというようなことであれば結構いけるかもしれないとも思います。

ということで、今日のテーマに入りたいのですが、著書・共著書を研究業績として評価するのはおかしいのではないか、ということは、大学院生だった四半世紀前からずっと聞いていたことであり（これは自分が情報系の学会にも出入りしていたためかもしれません）、昨今の人文系バッシングもあって耳にタコができている人も多いと思うのですが、最近とうとう、神戸大学で以下のような話があったそうで、いよいよ本格的に来るのか…という気持ちになっているところです。

やっぱり衝撃の「専門書をいくら書いても業績にカウントしない事件」から、仕事をやる積極的な気持ちにならない。はじめから他人の業績を評価するつもりのない、執行部というのは本当にどうなのだろうか。
— Kan Kimura (@kankimura) 2021年6月28日

もちろん、著書・共著書の中には明らかに高度な研究成果と言えるものがたくさんあり、それも、著書のような大部のものでなければ意味を成さないものが多くあるように思います。いわゆる「理系」でもそういうものはあってもおかしくないのですが、なぜあまりないのかというのは後述します。

にも関わらず、研究業績として評価するのはおかしいと言われてしまうことがあるのは、研究業績と言えないようなものもまとめてカウントされてしまう可能性が高く、公平性を欠いてしまうからでしょう。研究成果そのものとは言えない教科書や啓蒙書でも、分野が異なれば学術書なのかどうかよく判断できませんし、また、そのようなタイプの本であっても、研究成果が多かれ少なかれ反映されているとしたら、研究成果ではないとは言い切れないでしょう。また、科研費などの紐付きシンポジウムなどでの講演をまとめた論文集が共著書として出版社から刊行されることもよくありますが、これなどは査読がない上に、これまでの発表を改めてまとめなおしたようなものもよくみられます。啓蒙書的な位置づけとしてはあり得るかもしれませんが、「理系」で査読者としのぎを削って新規性や信頼性を厳しく確認した上でようやく刊行された雑誌論文（このあたりの「理系」の大変さと真摯さは、 3年間、情報処理学会の論文誌編集委員をやらせていただいたおかげで、ごく一端ではありましたがよくわかりました）と同じようにカウントしてよいのかどうかよくわかりません。もちろん、インパクトファクターやh-indexなどを使えば差別化はできるわけですが、とくに人文系の場合、そもそもインパクトファクターとかh-indexが未整備なのでそういう判定もできません。

「理系」でもSTAP細胞論文に代表されるように、論文取り下げは結構ありますし、とくに我国は論文取り下げ大国であり、「撤回論文数」世界ランキングでは圧倒的な存在感を誇っているようですので、そんな「理系」の人たちに色々言われたくない、とするのか、国民性とか政策上の問題だから仕方がないと考えるのか、色々な考え方はあるとは思いますが、後者だとしたら「文系」もチェックが行き届いていないだけで結構大変な状況になっているのかもしれません。いずれにしても、学術研究に対して疑問符が突きつけられる状況になっていて、とくに我国ではそれがちょっと大変な感じになっているようであることは確かです。せめて、何か、研究成果が信頼できるものであるという第三者的な指標のようなものとか、基準のようなものがあってほしいという気持ちは、おそらく納税者の立場に立つと多くの人が持ってしまわざるを得ないのではないかという気がします。神戸大学の上記の決定の背景の一つにはそういうこともあるかもしれません。

そこでまた著書の話に戻ってきますが、ではなぜ著書である必要があるのか、と言えば、一つの名前空間というか言語空間の中で厳密に定義された術語を駆使しないと表現できない新知見があって、それは細切れの学術論文で査読者ごとに基準が少しずつ異なる査読付きジャーナルでは実現できないことなのです。では「理系」ではなぜそれがなくても回っているのかと言えば、おそらく「理系」だと「文系」に比べて分野がかなり細切れになっていて名前空間や言語空間をほぼ共有できるということと、そのような共有を行うことが比較的容易であるということが理由としてあるのではないかと思っております。おそらく、共著書の中にもそういうものは相当数あるだろうと思います。ですので、とくに人文系の場合、著書はやめられませんし、これが研究業績として認められなくなったら人間文化の研究が非常に困難になってしまい、日本であれば、日本文化は大幅に衰退すると思います。著書・共著書を研究業績として認めないのは完全に悪手です。

しかしながら、著書・共著書を研究業績として認めようとすると、その幅の広さのゆえに、どうしても難しいということになってしまいます。実は現状ですと、これを解決するための一つの方法として、出版助成をとれているかどうか、という基準があり得ます。特に科研費の研究成果公開促進費は、きちんと審査も行われますし、それに基づいて出た成果ということであれば業績として評価する価値があるとみてもよさそうな気がします。ただ、この場合は、外形上は助成金を取れたということであって、研究成果という形を取っているわけではありません。助成金を取れたことを業績としてカウントしてしまうと、非常に殺伐とした世界が訪れてしまいますので、そこを詰めて、たとえば「これに関してだけは助成金だけど研究業績として認める」というロジックを立てる必要があろうかと思います。こういうときにいつも難しいのは、「ではこれは研究業績として認められるのではないか」ということで似たような少し違うものが色々あがってくることなのですが、まあ、科研費の研究成果公開促進費のみに限定するというようなルールを立てられるのであれば、なんとかなるのかもしれないとも思います。

ただ、これだけですと、出版助成がとれてないものはすべて研究業績として認められないということにもなってしまいかねません。今回の問題意識は、冒頭の神戸大学の件にあるのです。そこで考えられる一つの方策は、著書・共著書に対しても査読を導入することです。なんだ、さんざんもったいをつけておいてそんな話か…と思われるかもしれませんので冒頭にも書いてしまいましたが、とにかく、学術的な価値があるものとして出版されたものとそうでないものとを明白に区別できるようにするには、査読体制を作って、査読編集委員会がお墨付きを出す、という形にするのがもっとも早道なのではないかという気がします。それをどこが担うのか、と言えば、学会等で立てるよりは、学術出版社側、それも、個々の出版社というよりは、複数の出版社で共同で立てるのがよいのではないかという気がします。外野からみている分には、出版梓会などはこういうものの母体としてよさそうにも見えます。委員会の人選については、有力な編集者の方々だけでなく、特に文系だと、学術出版社からお願いされればそれくらいなら受けてもいい、という研究者も結構おられるのではないかと思いますし、うまいこと、広く信頼される研究者や編集者の方々から成る委員会を立てて、そこからさらに匿名で外部に査読・審査をお願いする、ということでよいのではないかという気がします。

すでに個別にはやっている出版社もあるように仄聞しておりますが、そうは思えない学術出版社もまだ多く、しかし、このあたりでやっておかないと、今度の国立大学中期計画あたりで神戸大学の状況次第では他も色々変わっていってしまうのではないかという気がしております。最近の、一般社団法人日本私立大学連盟による「大学設置基準の要件から図書館を外す」話ともリンクしてしまいそうな気がしますので、それを押し返すという意味でも重要ではないかと思っております。

もちろん、世界大学ランキングでのパラメータチューニングのようなことには全然役に立ちませんので、そういう話になってしまうとやはりちょっと弱いのですが、それは日本語の査読付き論文誌でも同じですので、せめて、査読付き論文と同じくらいの土俵に持って行けるようにするとよいのではなかろうか、ということです。

編集委員会をたてた後、遡及して評価するということもできるといいかもしれないのですが、それはちょっと仕事量的に無理があるかもしれず、体制構築以前のものをどう評価するかというのはちょっと検討の必要があろうかと思います。ただ、その議論に引っ張られて話が始まるのが遅くなったりするのもよくないだろうとも思います。

ちなみに、学術出版社が査読を行うという話は全然無理な話ではなくて、海外ではそういうことが割と広く行われていると仄聞したことがあり、また、個人的にも、ロンドンの某出版社から頼まれて共著書の査読をして薄謝ももらったことがあります。提供した労働力にはとても見合わない謝礼でしたが、関心ある分野についての学術書をよりよいものにすることを支援できた上にお金ももらえるということであれば、まあいいかなと思ったのでした。

長い割に雑な話になってしまって恐縮ですが、ということで、学術出版社の方々や、関連する研究者のみなさまに、ご検討をお願いできればと思うところです。

2021-09-20

Apache Solr8のnested documentの検索の仕方

Apache Solr デジタル小技

表題の件について、結構苦労して色々なパラメータの使い方を理解して、一人で暖めておくのはもったいないのでメモ。

Solr8では2段以上（上限不明）のデータのネストが可能。
スキーマの作り方は今のところ十分に理解できていないが、dynamicFieldを用いることで基本的なスキーマを用いた自動的なindexingが可能。
dynamicFieldは、以下のような感じでフィールド名の末尾に記号をつける。たとえばtitleだったらtitle_s という風に。このリストは server/solr/configsets/_default/conf/managed-schema で得られる。

    <dynamicField name="*_i"  type="pint"    indexed="true"  stored="true"/>
    <dynamicField name="*_is" type="pints"    indexed="true"  stored="true"/>
    <dynamicField name="*_s"  type="string"  indexed="true"  stored="true" />
    <dynamicField name="*_ss" type="strings"  indexed="true"  stored="true"/>
    <dynamicField name="*_l"  type="plong"   indexed="true"  stored="true"/>
    <dynamicField name="*_ls" type="plongs"   indexed="true"  stored="true"/>
    <dynamicField name="*_t" type="text_general" indexed="true" stored="true" multiValued="false"/>
    <dynamicField name="*_txt" type="text_general" indexed="true" stored="true"/>
    <dynamicField name="*_b"  type="boolean" indexed="true" stored="true"/>
    <dynamicField name="*_bs" type="booleans" indexed="true" stored="true"/>
    <dynamicField name="*_f"  type="pfloat"  indexed="true"  stored="true"/>
    <dynamicField name="*_fs" type="pfloats"  indexed="true"  stored="true"/>
    <dynamicField name="*_d"  type="pdouble" indexed="true"  stored="true"/>
    <dynamicField name="*_ds" type="pdoubles" indexed="true"  stored="true"/>
    <dynamicField name="random_*" type="random"/>
    <dynamicField name="ignored_*" type="ignored"/>

次に、親子関係を使ったクエリをいくつか調べてみたので以下に並べておく。なお、親子ともにhierarchy_sというフィールドを作成してあり、親にはparent、子にはchildの値を与えて区別している。

子を検索してその親だけを表示（hierarchy_s:parentは親、title_tは子）
curl 'http://localhost:8984/solr/skrt/select' -d 'omitHeader=true' -d 'q={!parent which="hierarchy_s:parent"}title_t:pra*&wt=json'

親を検索してその子だけを表示（condition_tは親）
curl 'http://localhost:8984/solr/skrt/select' -d 'omitHeader=true' -d 'q={!child of="*:* -_nest_path_:*"}condition_t:*pagination*&wt=json&rows=40'

親を検索してその子のタイトルだけを表示（hierarchy_s:parentは親、condition_tは子）
curl 'http://localhost:8984/solr/skrt/select' -d 'omitHeader=true' -d 'q={!child of="hierarchy_s:parent"}condition_t:*miss*&wt=json&rows=40&fl=title_t' 

親を検索して親も子も一緒に表示（msIdentifier-settlement_sは親）
curl 'http://localhost:8984/solr/skrt/select' -d 'omitHeader=true' -d 'q=msIdentifier-settlement_s:Tokyo&fl=*,[child]&wt=json&rows=40'

親を検索してから子だけを絞り込み表示。親は全部表示される（hierarchy_s:parentは親、title_tは子）
curl 'http://localhost:8984/solr/skrt/select' -d 'omitHeader=true' -d 'q=hierarchy_s:parent&wt=json&fl=*,[child childFilter=title_t:pra*]'

子を検索してその親と子を両方表示（hierarchy_s:parentは親、title_tは子）
curl 'http://localhost:8984/solr/skrt/select' -d 'omitHeader=true' -d 'q={!parent which="hierarchy_s:parent"}title_t:pra*&wt=json&fl=iiifmanifesturi_s,id,msItems,title_t,[child]&rows=100'

2021-09-02

人文学研究者必読の第六期科学技術・イノベーション基本計画のポイントを確認してみる

デジタル人文学オープンアクセス研究データ

科学技術基本法は、しばらく前までは「科学技術（人文科学のみに係るものを除く。以下同じ。）」という文言で人文学を除外していましたが、令和３年４月、「科学技術・イノベーション基本法」に変更されて施行され、これにともない、人文・社会科学が含まれることになりました。今後は、人文学に関しても政策的な研究事業のある部分はこれに沿って進められることになるようです。いわば、科学研究一般の一部として学術政策により強く組み込まれることになるのだろうと思っております。

では、人文学はどういう風に組み込まれたのでしょうか？ここでは、筆者がネットで調べられる範囲で、この基本計画にどのように人文学が組み込まれているのかを関連資料とともにみてみましょう。

内閣府の第6期科学技術・イノベーション基本計画の頁にこれまでの経緯や、今回の法改正を受けた基本計画の文書(PDF)などが掲載されています。全84頁のこのPDFファイルを「人文」で検索すると45件あるようです。

「人文」という語は文書の各所にちりばめられていますが、実施される計画を具体的にまとめているのは56頁のようです。「⑦ ⼈⽂・社会科学の振興と総合知の創出」として 7項目が挙げられています。とりあえず一つずつみてみましょう。

第一項目

(1) ⼈⽂・社会科学分野の学術研究を⽀える⼤学の枠を超えた共同利⽤・共同研究体制の強化・充実を図るとともに、科研費等による内在的動機に基づく⼈⽂・社会科学研究の推進により、多層的・多⾓的な知の蓄積を図る。

共同利用・共同研究と言えば、「全国の研究者に共同利用・共同研究の場を提供する、日本で4つの中核的研究拠点です。」というキャッチフレーズでおなじみの、大学共同利用機関法人が思い浮かびます。人文系だと、人間文化研究機構傘下の6機関（国立歴史民俗博物館、国文学研究資料館、国立国語研究所、国際日本文化研究センター、総合地球環境学研究所、国立民族学博物館）があります。これに加えて、国際共同利用・共同研究拠点や共同利用・共同研究拠点というのもあって、人文・社会科学系では、前者には日本文化資源デジタル・アーカイブ研究拠点として立命館大学アート・リサーチセンター、後者には、北海道大学スラブ・ユーラシア研究センター（スラブ・ユーラシア地域研究にかかわる拠点）、東京大学史料編纂所（日本史史料の研究資源化に関する研究拠点）、東京大学社会科学研究所附属社会調査・データアーカイブ研究センター（社会調査・データアーカイブ共同利用・共同研究拠点）、東京外国語大学アジア・アフリカ言語文化研究所（アジア・アフリカの言語文化に関する国際的研究拠点）、一橋大学経済研究所（「日本及び世界経済の高度実証分析」拠点）、京都大学人文科学研究所（人文学諸領域の複合的共同研究国際拠点）、京都大学経済研究所（先端経済理論の国際的共同研究拠点）、京都大学東南アジア地域研究研究所（地域情報資源の共有化と相関型地域研究の推進拠点）、京都大学東南アジア地域研究研究所（東南アジア研究の国際共同研究拠点）、大阪大学社会経済研究所（行動経済学研究拠点）、大阪市立大学都市研究プラザ（先端的都市研究拠点）、慶應義塾大学パネルデータ設計・解析センター（パネル調査共同研究拠点）、法政大学野上記念法政大学能楽研究所（能楽の国際・学際的研究拠点）、京都芸術大学舞台芸術研究センター（舞台芸術作品の創造・受容のための領域横断的・実践的研究拠点）、早稲田大学坪内博士記念演劇博物館（演劇映像学連携研究拠点）、大阪商業大学JGSS研究センター（日本版総合的社会調査共同研究拠点）、関西大学ソシオネットワーク戦略研究機構（ソシオネットワーク戦略研究拠点）が選定されています。基本的に外野なのでよくわかりませんが、体制の強化・充実を図るとのことですので、これらの拠点機関に対して何らかの措置が行われることを期待したいところです。

一方、「科研費等による内在的動機に基づく⼈⽂・社会科学研究の推進により多層的・多⾓的な知の蓄積を図る。」という点については、つまり、科研費等で自由に研究課題を設定することをこの基本計画で追認してくれている、という風に捉えれば良いのでしょうかね。ただ、最後まで読むと、内在的動機に期待されつつ、多層的・多⾓的な知の蓄積を図るということになっていますので、ここは研究者側が自発的に「多層的・多⾓的な知の蓄積」もしなければならない、ということでしょうか。あまり深読みすべきところではないかもしれませんが、何かご存じの方がおられましたらぜひご教示ください。

第二項目

(2) 未来社会が直⾯するであろう諸問題に関し、⼈⽂・社会科学系研究者が中⼼となって研究課題に取り組む研究⽀援の仕組みを 2021 年度中に創設し推進する。その際、若⼿研究者の活躍が促進されるような措置をあわせて検討する。

これは抽象的すぎて何のことかよくわからないのですが、2021年度中に創設し推進する、と書いてあり、しかも研究支援、と書いてありますので、もう始まっているものではないかと想像して学振のサイトなどをみていると、

学術知共創プログラム・課題設定による先導的人文学・社会科学研究推進事業

というのを発見しました。この説明を見てみると、以下のように書いてあります。

未来社会が直面するであろう諸問題に係る有意義な応答を社会に提示することを目指す研究テーマを掲げ、人文学・社会科学に固有の本質的・根源的な問いを追求する研究を推進することで、その解決に資する研究成果の創出を目指す。

「未来社会が直面するであろう諸問題」というあたりが同じですし、2021年度に始まったとのことですので、おそらくこれが該当するということでよさそうな気がします。この事業の現状については、文部科学省の科学技術・学術審議会学術分科会　人文学・社会科学特別委員会（第6回）会議資料にて盛山和夫先生が作成された資料（PDF）や、この時の議事録を見ると6月時点での状況はわかります。9月下旬に採択結果通知がいくようですね。どういう事業が採択されるか、要注目ですね。また、この事業は、同特別委員会が今年の8月に公表した「「総合知」の創出・活用に向けた人文学・社会科学振興の取組方針(PDF)」でも採り上げられていますので、こちらもご覧いただくとよいかと思います。

第三項目

(3) ⼈⽂・社会科学の研究データの共有・利活⽤を促進するデータプラットフォームについて、2022 年度までに我が国における⼈⽂・社会科学分野の研究データを⼀元的に検索できるシステム等の基盤を整備するとともに、それらの進捗等を踏まえた 2023 年度以降の⽅向性を定め、その⽅針に基づき⼈⽂・社会科学のデータプラットフォームの更なる強化に取り組む。また、研究データの管理・利活⽤機能など、図書館のデジタル転換等を通じた⽀援機能の強化を⾏うために、2022 年度までに、その⽅向性を定める。

これは、日本学術振興会で進められている人文学・社会科学系データインフラストラクチャー構築推進事業を指していると思われます。こちらの進捗状況も、上記の委員会で同時に報告と議論がなされたようです。この時の委員会の会議資料はこちらで一覧できますが、この中で「人文学・社会科学データインフラストラクチャー構築推進事業：背景、取組、成果および課題（PDF）」という資料が比較的最近の状況を報告しています。なお、このデータプラットフォームは、「人文学・社会科学総合データカタログ」としてすでに稼働しています。まだ人文学のデータは入っていませんが、社会科学の量的調査データに関する横断検索ができるようです。こちらは、今後さらなる強化が行われる見通しのようです。それから、この事業も、同特別委員会が今年の8月に公表した「「総合知」の創出・活用に向けた人文学・社会科学振興の取組方針(PDF)」で採り上げられていますので、こちらもご覧いただくとよいかと思います。

一方、「また、」と言って似たような話が続きますが、「研究データの管理・利活⽤機能など、図書館のデジタル転換等を通じた⽀援機能の強化を⾏うために、2022 年度までに、その⽅向性を定める。」と書かれているところ、ここだけみるとすべての分野についての話のように見えますが、人文・社会科学の項目に書かれていることですのでそこに特化された話なのでしょうか。研究データの扱いを図書館でもっと頑張ってくれるようになる、ように読めるのですが、図書館方面でこういった「支援機能の強化」の話が議論されているのかもしれませんね。あるいは、国立情報学研究所（NII）で現在進められているJAIRO CloudやGakunin RDM（研究データ管理基盤）、Weko3（公開基盤）等々のオープンサイエンス基盤研究センターによる一連の新しい学術情報流通サービスを指しているのでしょうか？研究データ利活用と言えば、最近リリースされたCiNii Researchで研究データの検索も一括でできるようになっていますね。

ただ、2022年度までに、ということで、もし人文・社会科学限定の話なのだったとしたら、そろそろこちらの方にも話が聞こえてきてほしいところです。なお、このテーマに関しては、研究データ利活用協議会というコミュニティがありますが、この件とどれくらい関係しているのかはよくわかりません…（直接には関係なさそうな気がします）。

第四項目

(4)「総合知」の創出・活⽤を促進するため、公募型の戦略研究の事業においては、2021 年度から、⼈⽂・社会科学を含めた「総合知」の活⽤を主眼とした⽬標設定を積極的に検討し、研究を推進する。また、「総合知」の創出の積極的な推進に向けて、世界最先端の国際的研究拠点において、⾼次の分野融合による「総合知」の創出も構想の対象に含むこととする。

今回の基本計画では「総合知」という言葉が頻出し、そこで人文・社会科学との連携への期待が語られるのですが、令和四年度の文部科学省概算要求を眺めていると、「総合知」という言葉があちこちに見られ、そこにはしばしば「人文・社会科学」という言葉も登場しています。たとえば、

災害状況の迅速な把握と、人文・社会科学の知見を活用した災害対応の判断支援を統合的に取り扱うため、人文・社会科学の「知」と自然科学の「知」が融合した「総合知」による研究開発アプローチを採用。

我が国が目指す未来社会（ Society 5.0 ）の実現に向け、科学技術リテラシーやリスクリテラシーの取組、科学コミュニケーターの能動的な活動を踏まえた科学館や博物館等における⼀般社会の意見収集や市民による政策過程への参画の取組、人文・社会科学と自然科学の融合による「総合知」を活用して行う課題解決に向けた対話・協働活動の取組など、多様な主体の参画による知の共創と多層的な科学技術コミュニケーションの強化が必要。

といった具合です。人文・社会科学と言ってもこういった事柄に直接関係するような研究分野・研究テーマはそれほど多くないと思いますが、むしろ、自分の分野やテーマがどのように関係し得るか、思考実験をしてみると面白いかもしれませんね。

第五項目

(5) 関係省庁の政策課題を踏まえ、⼈⽂・社会科学分野の研究者と⾏政官が政策研究・分析を協働して⾏う取組を 2021 年度から更に強化する。また、未来社会を⾒据え、⼈⽂・社会科学系の研究者が、社会の様々なステークホルダーとともに、総合知により取り組むべき課題を共創する取組を⽀援する。こうした取組を通じて、社会の諸問題解決に挑戦する⼈的ネットワークを強化する。

この件については、令和4年度の文科省概算要求で「科学技術イノベーション政策における「政策のための科学」の推進（ SciREX事業）(PDF)」というのがあって本年度からやっているようですので、前半はこれのことでよさそうな気がします。

後半は、上記の共創知プログラムの話でしょうか？あるいは、令和4年度の文科省概算要求でもこういったフレーズが

「大学の力を結集した、地域の脱炭素化加速のための基盤研究開発 (PDF)」「共創の場形成支援：共創の場形成支援プログラム・地域共創分野 (PDF)」「未来共創推進事業 (PDF)」「戦略的創造研究推進事業（社会技術研究開発） (PDF)」

あたりに登場しますので、こういったものにコンセプトがちりばめられていると考えておけばよいのでしょうか。

第六項目

(6) ⼈⽂・社会科学の知と⾃然科学の知の融合による⼈間や社会の総合的理解と課題解決に貢献する「総合知」に関して、基本的な考え⽅や、戦略的に推進する⽅策について 2021 年度中に取りまとめる。あわせて、⼈⽂・社会科学や総合知に関連する指標について 2022 年度までに検討を⾏い、2023 年度以降モニタリングを実施する。

こちらについても、前項であげた「戦略的創造研究推進事業（社会技術研究開発）」などはかなりあてはまりそうです。

また、令和4年度の文科省概算要求には「データ駆動型人文学研究先導事業～「総合知」創出に向けたデジタル・ヒューマニティーズの強化～ (PDF)」というものもあり、これは、ここまでみてきたいくつかの「データ」や「総合知」の話を反映したものでもありそうですが、総合知をもたらすための方策の一つとして期待されているようです。これについては科学技術・学術審議会学術分科会の人文学・社会科学特別委員会（第7回）会議にてヒアリングが行われ、筆者も少し話題提供しました。こちらもやはり、配布資料一覧と議事録が公開されています。そして、この件についても同特別委員会が今年の8月に公表した「「総合知」の創出・活用に向けた人文学・社会科学振興の取組方針(PDF)」でも採り上げられています。時系列でみると、この方針を受けて概算要求が行われたという形になっているように思われます。

さて、この項目で気になるのは実は後半です。というより、今回の基本計画で一番気になっているのはここです。 「⼈⽂・社会科学や総合知に関連する指標」が2022 年度までに検討されて2023 年度以降にはモニタリングが始まってしまうようです。「指標」って何に関する指標でしょうか。研究評価指標のことではないかと想像しているのですが、そうだとしたら色々確認したいこともあるのですが、これに対応する動向がどの件なのかよくわからないというところで止まっております。どなたかご存じの方がおられましたらぜひご教示ください。

人文社会科学の研究評価については、神戸大学でこういう話があるようで、

やっぱり衝撃の「専門書をいくら書いても業績にカウントしない事件」から、仕事をやる積極的な気持ちにならない。はじめから他人の業績を評価するつもりのない、執行部というのは本当にどうなのだろうか。
— Ninja DAO | CryptoNinja (@CryptoNlnjaNFT) 2021年6月28日

全体としてどこに向かおうとしているのかが非常に気になっているところです。

第七項目

(7) 上述の「総合知」に関する⽅策も踏まえ、社会のニーズに沿ったキャリアパスの開拓を進めつつ、⼤学院教育改⾰を通じた⼈⽂・社会科学系の⼈材育成の促進策を検討し、2022 年度までに、その⽅向性を定める。

こちらは大学院教育改革ですね。2022年度までに方向性が決まるとのことですので、来年度から始めるのか、来年度にやり方を決めて再来年度からということなのかよくわかりませんが、これは今までにも繰り返し取り組まれてきた普遍的なテーマのように思われます。来年度概算要求にも「科学技術イノベーション創出に向けた大学フェローシップ創設事業 (PDF)」というのが入っています。ただ、ここでは「総合知」という言葉が出てこないので、再来年度概算要求で「総合知」も含むさらなる促進策が出てくるのかもしれませんね。

ということで、恐縮ながらいくつかわからない点もありましたが、全体として、人文学と理系分野、そして政策との距離が少し縮まっていくような感じです。また、人文学への展開にあたっては、文科省科学技術・学術審議会学術分科会の人文学・社会科学特別委員会も一定の役割を果たしているように思われます。

この状況をうまく活用して若手育成などにつなげられるとよいのではないかと思うのですが、一方で、長い時間をかけて積み上げていくタイプの王道的な人文学研究をこういった流れのなかにどう位置づけていくのか、というのは重要な課題になっていきそうです。

2021-08-22

翻訳は研究業績にならないの？

少し前に、パワポ資料は研究業績にならないのか、という記事を書きましたが、最近、以下のツィートを拝見しましたので、今度は、翻訳はどうなのか、ということについて少し思うところを書いてみたいと思います。

いつからでしょう、学術の世界で翻訳が研究者の業績としてカウントされなくなってしまったのは。自分の世代で考えると、サイードやフーコーなどの翻訳がなかったら、多くの英米文学が翻訳で読めなかったら、今の自分はあるのかとか真剣に考えてしまう。翻訳文化は学術の基礎研究のはずなのに。
— Yoshiyuki Kido (@ykido66) 2021年8月20日

まず、細かいところに突っ込むようですが、しかしこの種の事柄を検討する上で大事なポイントだと思うので抑えておきたいのが、「研究者の業績」を「カウント」するということ自体が、少なくともここで問題になりそうな人文系においては割と最近のことだったのではないか、という点です。そして、そもそも「カウント」、つまり、個々の業績に点数をつけたり業績の種類に応じて重み付けをしたりするという業績評価スタイルが人文系に導入されたのは割と最近、この10～20年くらいのことで、未だにそのようにしていないところも結構あるのではないか、ということです。もう少し言い方を変えると、かつては翻訳が業績として「カウント」されずにもっと大まかな質的評価が行われていて、理工系のようなカウントシステムが導入されたときには理工系の論理で翻訳はカウントから外されてしまい、結局のところ、翻訳が「カウント」されたことはなかったのではないか、というようなことを漠然と思ったのでした。研究業績評価≒人事評価に関することはあんまり公表されてなくて、自分が関わったところと、それに加えてたまに公表したりしているところくらいしかわからなくて、あとは都市伝説めいた話になってしまうことが多いように思うのですが、具体的な調査が行われたこともあるようですのでちょっとみてみましょう。

三菱総研によるアンケート結果では

たとえば、文科省の平成26年度研究開発評価推進調査委託事業の報告書が、五輪前のコロナ感染者数予測で話題になった株式会社三菱総合研究所から出ておりまして、以下のPDFで読めるようになっています。

https://www.mext.go.jp/component/a_menu/science/detail/__icsFiles/afieldfile/2015/05/20/1357995_01.pdf

平成27年度行政事業レビューによればこの調査報告は840万円で実施されたようです。

内容としては大学研究機関にアンケートを行ったものをまとめたようで、個人業績評価の実態に関するアンケート調査ということで大学関係786件、研究開発型の独立行政法人33件に送付して、それぞれ575件、33件の回答を得たようです。回収率はそれぞれ、73%、64%です。

そうしますと、平成26年度の時点で、なんと個人業績評価を実施していない機関が49%、ほぼ半分のようです。アンケートに回答していない機関がどうしているのか気になるところですが、このアンケートだけを見ると、業績業績と詰めてくるところは、数としては半分くらいしかないということになるのでしょうか…？アンケートに答えた人がどういう立場の人で、その人はきちんと学内の事情を把握していたのかどうか、ということもちょっと気になるところではあります。いずれにせよ、業績評価の影響を考えるなら、それぞれの所属研究者数もみておきたいところではあります。

冒頭から少し気になるところもありつつ、「翻訳」が評価されるかどうかについて確認したいので、とりあえず「評価項目」をみてみます。 p. 34（PDFだと42頁）にリストされているのでみてみますと…いわゆる「研究」にカウントできそうな項目としては以下のようになっています。

成果の学術的価値
成果がもたらす社会・経済・文化的な効果の価値
論文・総説
論文掲載誌のインパクトファクター（IF）
論文・総説の被引用
報告書の執筆
専門書籍の編集、執筆
学会発表・講演
学会活動(役職等)
特許・実用新案の出願・登録・ﾗｲｾﾝｼﾝｸﾞ

「翻訳」はもしかしたら「成果の学術的価値」「成果がもたらす社会・経済・文化的な効果の価値」あたりに入れることは可能なのでしょうか？アンケート項目そのものがどうだったかわからないので、項目に「翻訳等」に入っていたのだろうか、あるいは、入ってなくて（その可能性がこの場合大きいような気がしますが）、もし入っていたらどうだったのだろうか、と色々想像してしまうところです。とりあえず、調査する側の視野に研究業績としての「翻訳」は入っていなかった可能性もあるというところにとどめておきましょうか。

ということで、

このアンケートだけだと、数字としては、個人研究業績を問題にするところは半分くらいしかないので、海外の学術書的な本の翻訳が業績になるかどうかというのはそれほど関係ないのかもしれない、という可能性も出てきますが、大規模機関も小規模機関も1とカウントされてしまうようなので、小規模機関がたくさんあって、評価対象の研究者数で見てみた場合にはまったく違う景色が見える可能性もあります。

一方、アンケートとしては、翻訳を研究業績にカウントするところは一つもないということになりますが、そもそもアンケート項目に入っていなかった可能性もありますので、そうすると翻訳が業績として評価されるのかどうかの調査はなされていないということになる可能性もあります。

結局、現状はあまりよくわからない…というのがとりあえずの印象です。

リサーチマップでの「翻訳」の扱い

別な観点から見てみると、近年、業績を掲載しておくデータベースとして国内でデファクト標準の地位を固めつつあるリサーチマップの入力ガイドでは、以下のように、翻訳も掲載できるようになっています。

f:id:digitalnagasaki:20210821220130p:plain — リサーチマップマニュアル

リサーチマップは、とにかく何でも記載できるようにしておいて、評価の対象にするかどうかは評価する側が考えるというスタンスのようですので、この点は好感が持てます。個人的には「単訳」という表現がちょっと見慣れないですが、これは私の世間が狭いためかもしれないですね？

翻訳を業績にして大丈夫？

さて、そのようなことで、翻訳が業績にならないかというと、必ずしもそうではないようだ、ということまでは言えるように思えてきました。もちろん、査読付き国際ジャーナルや、分野の中で誰もが認める日本語学術誌に掲載された論文に比べたら、業績としてカウントされるかどうかは微妙かもしれませんが、それなりに評価される場合もありそうです。

さて、では翻訳を業績にして普通にカウントして問題ないのか、ということ、次に気になるのが、業績を増やすために機械翻訳にちょっと手をいれただけのようなものがばんばん量産される事態に陥るのではないかという懸念です。そのあたりは、一流の研究機関の一流の研究者の方々の間ではまったく問題にならないわけですが、研究者・大学教員は一流の人たちだけで成り立つものではないので、一流でない人たちをいかにしてうまく評価して、適切に学術に貢献してもらいつつ自分の研究業績もあげてもらい、さらに自分の組織の維持発展のための仕事に従事してもらうか、そのための制度設計をどのように行うか、ということはとても重要です。ここで、翻訳は業績にカウントしてよい、という話になると、もちろん、一流の人たちは一流の翻訳書を刊行してくださるので何の問題もないのですが、そうでない人たちは、とりあえずルールの範囲でなるべく高い評価を得たいと思う人も少なくないですし、それは、子供がいて家のローンもあるので給料を少しでもあげたい、とか、いい年なので管理職系の仕事が多く回ってきて勤務時間内は研究時間がとれないのに介護が必要な親のために私的な時間を研究に使えなくなってしまった、というような切実な状況においては、それでは翻訳書をなるべく省力化して出しますか、ということになってしまっても仕方がないことではないかと思ったりもします。結果として、粗製濫造になってしまって、翻訳を業績カウントすることの問題がよりクローズアップされてしまって今より状況が悪くなるかもしれないとも思ってします。

翻訳を業績としてカウントするルールは可能か？

しかしながら、よい翻訳を業績としてカウントすることは、できるなら実現した方がよいに決まっています。とくに人文系の学術書の翻訳は、それまで日本語文化圏にはなかった概念を日本語の概念体系に移し替えていく仕事になります。時折、新しい言葉が定義され登場することもありますが、それも多くの場合は、日本語の概念体系の中にはどうしても収まりきらず、新たな言葉と定義を与えて日本語文化の中にそれを定着させるべく、熟慮に熟慮を重ねた上で、慎重に行われるものです。これを、きちんとやろうとすると非常にアカデミックかつクリエイティブな仕事になります。このあたりは、理工系とはかなり事情が異なりますし、これが学術的な仕事として認められないとなると、さすがにちょっとまずいのではないかという気がします。

そこら辺をなんとかしつつうまく話を前に進めるためには、「こういう翻訳（書）がこれくらいのレベルで翻訳されていれば業績とカウントすべき」というような基準が示されているとよいのではないかとも思います。基準そのものは、評価する側で作れればそれがベストだと思いますが、分野がずれるとよくわからなくなってしまうので、たとえば学会等で「この翻訳書は学術的意義が高い」などというようなリストを毎年作ってくれると、評価する側を助けることになるだけでなく、その学会の構成員の業績は高評価を得やすくなって分野が少し栄えることになるかもしれない、と思ったりもします。もちろん、学会誌に書評が載ることもありますのでそういう場合はその内容も参照できるとなおよいかもしれません。

もちろん、既存の学会の枠組みでは評価されないような、しかし重要な学術的著作の翻訳書というのもあるでしょう。それはそれで、何か別の方策が必要です。その種の本のなかでは、新聞の書評で紹介されることもあると思いますので、その書評の内容も含めて評価の際に参照するという手もあるかもしれませんが、そういうものはちょっと評価が難しいことがありそうですね…。

すでに、日本の人文系学会でも、そういう方面についての対策を考えたりまさにそういう基準を作っているところがあるかもしれないのですが、調査不足でまだそういう情報にはたどり着いておりません。

いずれにしても、割とちゃんとした翻訳書を出せるような人は、その言語に関する読解力やその本のテーマになっている事柄についての知見をかなり持っているとみなされることがおおいにあるようにも思いますので、研究としての評価はされなくても、公募採用人事等の評価においてはプラスに働く場面もそれなりにあるのではないかという気もします。

業績になるかならないか以前の問題として？

良質な海外学術書の翻訳が以前に比べて減っているのかどうか、そういう調査結果をみたことがないので客観的なことは何も言えませんが、海外の学会等に出て色々話を聴くと、こういうテーマの本もまだ日本語では出てないのか…と思うことは少なくなく、もうちょっとそういう翻訳書が出てくれればいいのに、と思うことがあるのは確かです。ただ、では、誰がやるのかというと、そもそも翻訳する人が減っていないだろうか、ということも気になります。また、あまり売れないかもしれない学術書の翻訳出版に付き合ってくれる出版社というのももしかしたら以前よりちょっと減ったりパワーダウンしたりしているかもしれないと思ったりもします。紙の学術書自体の売り上げが落ちてきているということもこの件には結構影響しているかもしれません。そのあたりも含めて少し大きな見通しを持ちつつ善後策を考えていく必要があるのかもしれません。

そもそもの問題として…

ただ、もう少し大きな枠組みでの問題も生じつつあるようで、これをどう考えたらいいのか、と悩んでおります。具体的には、以下のツィートの件なのですが、

大学の「研究に対する評価基準」から「書籍」がなくなった、というので昨日からかなり凹んでいる。もう学術書は要らない、書くな、という事だろうか。
— Kan Kimura (@kankimura) 2021年6月3日

こういうことになってしまうと、翻訳書が業績にならない、というようなレベルの話ではなくなってしまいます。理工系の業績評価の論理というより、もしかしたら、研究業績評価企業のマーケティング戦略が大学全体を覆い尽くしてしまっているのかもしれないと思いますが、これはさすがにまずいのではないかと思うところです。

「書籍」として評価されなくても、出版助成をとっていれば外部資金獲得として、本がたくさん売れれば社会貢献として評価されることはあり得るのかもしれませんが、翻訳書も含む学術書全般を刊行するためのインセンティブを大きく引き下げることになりそうな話であることは否定できません。

このあたりのことについては、いずれまたこちらのブログに思うところを書いてみたいと思っております。

2021-08-20

Ubuntu16環境でCUDAをPythonのOpenCVモジュールから使えるようにする

ちょっと色々あって、Ubuntu16環境でCUDAをPythonのOpenCVから使えるようにする必要が生じました。 GPU使って画像のディープラーニングやってる人なら何のことかわかると思います。

基本的には、こちらのサイトがとても参考になりました。ほとんどこれに沿って作業したらできました。ありがとうございます。

qiita.com

ただ、当方の環境はUbuntu16でしたので、必要なパッケージの名称が少し違っていたりして、そのあたりの調整が必要でした。それから、コンパイルのフラグもちょっと変更する必要がありまして、以下のようにしました。

CC=gcc-5 CXX=g++-5 cmake -D CMAKE_BUILD_TYPE=RELEASE -D OPENCV_EXTRA_MODULES_PATH=../../opencv_contrib/modules \
 -D OPENCV_GENERATE_PKGCONFIG=ON -D BUILD_opencv_apps=ON -D BUILD_opencv_calib3d=ON -D BUILD_opencv_core=ON \
 -D BUILD_opencv_cudaarithm=ON -D BUILD_opencv_cudabgsegm=ON -D BUILD_opencv_cudacodec=ON \
 -D BUILD_opencv_cudafeatures2d=ON -D BUILD_opencv_cudafilters=ON -D BUILD_opencv_cudaimgproc=ON \
 -D BUILD_opencv_cudalegacy=ON -D BUILD_opencv_cudaobjdetect=ON -D BUILD_opencv_cudaoptflow=ON \
 -D BUILD_opencv_cudastereo=ON -D BUILD_opencv_cudawarping=ON -D BUILD_opencv_cudev=ON \
 -D BUILD_opencv_features2d=ON -D BUILD_opencv_flann=ON -D BUILD_opencv_highgui=ON -D BUILD_opencv_imgcodecs=ON \
 -D BUILD_opencv_imgproc=ON -D BUILD_opencv_ml=ON -D BUILD_opencv_objdetect=ON \
 -D BUILD_opencv_photo=ON -D BUILD_opencv_stitching=ON -D BUILD_opencv_superres=ON \
 -D BUILD_opencv_ts=ON -D BUILD_opencv_video=ON -D BUILD_opencv_videoio=ON -D BUILD_opencv_videostab=ON \
 -D WITH_1394=ON -D WITH_CUBLAS=ON -D WITH_CUDA=ON -D WITH_CUFFT=ON -D WITH_EIGEN=ON -D WITH_FFMPEG=ON \
 -D WITH_GDAL=OFF -D WITH_GPHOTO2=ON -D WITH_GIGEAPI=ON -D WITH_GSTREAMER=ON -D WITH_GTK=ON \
 -D WITH_INTELPERC=OFF -D WITH_IPP=ON -D WITH_IPP_A=OFF -D WITH_JASPER=ON -D WITH_JPEG=ON -D WITH_LIBV4L=ON \
 -D WITH_OPENCL=ON -D WITH_OPENCLAMDBLAS=OFF -D WITH_OPENCLAMDFFT=OFF -D WITH_OPENCL_SVM=OFF \
 -D WITH_OPENEXR=ON -D WITH_OPENGL=ON -D WITH_OPENMP=OFF -D WITH_OPENNI=OFF -D WITH_PNG=ON \
 -D WITH_PTHREADS_PF=OFF -D WITH_PVAPI=ON -D WITH_TBB=ON -D WITH_TIFF=ON \
 -D WITH_UNICAP=OFF -D WITH_V4L=ON -D WITH_VTK=ON -D WITH_WEBP=ON -D WITH_XIMEA=OFF -D WITH_XINE=OFF \
 -D CUDA_NVCC_FLAGS=--expt-relaxed-constexpr -D CUDA_FAST_MATH=ON -D CUDA_TOOLKIT_ROOT_DIR=/usr/local/cuda \
 -D CUDA_HOST_COMPILER=/usr/bin/gcc-5 -D PYTHON_DEFAULT_EXECUTABLE=python3  ..

それと、ちょっとハマったのが、pyenvやらなんやらでPython環境が色々あって、どれがターゲットになってコンパイルやインストールが行われるのかわからなくなってしまう、ということがありまして… make install 時に sudoを使うと、root環境でのPython環境になってしまって、pyenvの環境にインストールできないがこれはどうしたら…といったあたりがハマりどころでした。

結局、今回は、Ubuntu16のデフォルトのPython向けにグローバル環境でインストールするという割り切りをすることでなんとか使えるようにはなりましたが、振り返ってみると、opencvのインストールディレクトリをユーザローカル環境に指定すれば、make install で sudoをする必要はなくなるはずですので、そのフラグをコンパイル時につけておけばよいのでしょうね。次に機会があればそういう風にしてみたいと思います。