日本学術会議の提言を読んでみる:学術情報流通の現在と未来 5/n

前回記事の続きです。もう5回目になってしまいましたがまだ半分終わってないような感じで、 長い道のりですね。

前回は「今後10年間に起こるジャーナル出版の大変革」という節を見てきて、今後10年間の見通しに ついて押さえてきました。その次の節ということになります。PDFは14頁目(表記では8頁)ですね。

http://www.scj.go.jp/ja/info/kohyo/pdf/kohyo-24-t297-6.pdf#page=14

(3)日本発のジャーナルの国際競争力向上のための戦略

② 日本発のトップジャーナル刊行を核とする英語論文誌の国際競争力向上

ここでは、日本発の国際的なトップジャーナルを出すことについての現状と課題が 述べられます。多くの日本の学協会が海外のジャーナル会社から出版して しまうため日本での学術出版サービスが絶滅してしまうのではないかという 危惧を示した上で、むしろ日本発のトップジャーナル発行により日本にジャーナル刊行の知識・経験を蓄積し 専門家を育成できるとしています。これにあたり、新たにジャーナル出版サービス法人組織を 設立すべきとしています。これがうまくいけば、この種の業務に関わる様々な分野の 専門家を育成できる上に博士人材の新たな活躍の場も創出できるとのことです。 筆者はこのあたりのことについてはあまりよくわからないのですが、世界中の大学図書館と 個別に契約を結ばなければ購読料金を集金できないという状況に比べると、今後National Site License で済む国が増えるのであれば、契約交渉にかかる手間はかなり減らせるようになってきている のではないかと思います。また、オープンアクセスでAPCが収入の主体になっていく のであれば、むしろ投稿者とのやりとりがメインになっていくことになり、 集金の仕方も楽になるのではないかという気もします。投稿費用に必要な予算を 持っている研究者が投稿したいと言ってくるところに料金表を提示するという 仕事は、世界中の大学図書館に購入希望を募ってタフなネゴシエーションに 付き合わされながら弱小出版社だからと値踏みされるのに比べたらずいぶん楽では ないかと思います。ただ、ジャーナル出版事業は、エルゼビア社が「もう商売にならない赤字事業だ」 と言っているようなものですので、超大手がそういう風に言っているということは実質的なダンピングを 仕掛けてくるような形になる(と言ってもそういう大手が日本の新法人を意識してそうするという わけではなく顧客との交渉で値下げしていった結果そうなるという意味で) 可能性もあり、収益化を目指してしまうと赤字が問題にされて にっちもさっちもいかなくなるのではないかということも微妙に心配です。 IFの高い国際ジャーナルを日本から出せるなら、学協会がジャーナルを出すことに ついての当事者意識を保つことをはじめとして様々な好影響が期待できますので それはそれで良いことだとは 思うのですが、そのためのコストをどれくらい許容するかということも考えるとなかなか 難しそうです。

この節は次の節の話とかなり深く関わるような気がしますので、このまま次に いきたいと思います。

③ 和文誌の多言語同時出版による国際的認知度向上

まず、日本誤ジャーナルの意義と現状、その課題について簡潔にまとめています。 技術者教育を担う重要な学術情報発信手段という位置づけではあるものの、 ほとんどはIFがないために業績として評価されにくく投稿数が減少しているとのことです。 また、翻訳されて学術情報として国際的に流通しているものもあるが、 それが正しく引用されないという問題もあるようです。 JaLC DOIが和文ジャーナルでは広く普及していますが、これが 国際的な学術出版社が引用情報作成で利用しないために被引用情報が 参照されないのだそうです。これを解決するには、1本1ドルの Crossref DOIを付与する必要があるそうです。

また、論文がPDFでしか 配布されず、XML化ができてないことも問題のようです。これは論文本文の XML化のことではないかと思います。たしかに、 この学術会議の提言もPDFでしか配布されていないので、もうちょっと なんとかなればなあと思うところではあります。とはいえ、書誌情報のXML化に 比べると色々ハードルが高く、もう少し時間がかかってしまうのではないかと 思います。 たとえばScholarOneのような論文査読システムではXMLを自動生成 する機能を持っているのでこれを活用すればよいのだそうですが、 しかしScholarOneのようなものは利用料金が高いのでこれもなかなか難しいところのようです。 あるいは、そもそもMS-WordはXML形式なのですから、そこから自動的に 論文用XMLスキーマに自動的にコンバートしてくれる仕組みをどこかで 無料で配布してくれれば問題はずいぶん解決するのかもしれません。 (すでにあるかもしれませんが)

さて、次の段落では、日本語ジャーナルの被引用インデックスを充実させるべきであると いう話が出ます。元々、NIIが引用文献データ作成事業を行なっていて、それを JSTが引き継いだのだそうですが、2016年度以降の同定処理が完了していない、 というやや衝撃的な話が書かれています。予算等の問題から、と書いてあります ので予算が足りないということなのだろうと思いますが、NII時代はいくら使っていて、 移行後はそれがどれくらい減ったのか、それとも拡張しようとしてお金が足りなくなったのか、 非常に気になるところです。どこかにそういう情報は公開されているのかもしれませんが、 不勉強でなかなかたどり着けません。いずれにしても、日本誤ジャーナルの価値の 低下を少しでもやわらげるためには、信頼清野ある被引用インデックスの作成は 必須でしょう。ここは、日本語の学術情報を守るためにかなりお金をかけてもよい ところではないかとは思います。皆が英語がすらすら読めるようになれば あまり気にしなくてもよくなるのかもしれませんが、技術情報は、技術者だけでなく 経営判断をする人達にもある程度周知される必要があります。また、一部のいわゆる 高偏差値層はどういうカリキュラムでも一定の能力を獲得してしまいますが、 昨今の英語教育はリーディングの比重を下げてきているため、読める人は 全体としては減っていく可能性があり、そういう意味でも日本語学術情報は むしろ重要性が高まっていくのではないかと思われます。

人文学の観点からは、日本語の学術情報はまた別の観点からも非常に重要です。自分の国の 社会や文化がどうなっているか、自分の国の言葉で語れるような基礎を形成しておく ことは重要なことですし、日本語をメインの公用語としているのは日本政府だけですので、 それについては日本政府が責任を持つようにしないことにはどうにもなりません。 法律、歴史、文学、言語、哲学、民俗、社会等々、日本語できちんと 語れるようにしておかねばならないことは非常に多くかつ多様であり、 とにかく、フルセットの言説空間を日本語で用意する必要があります。 実際にはフルセットであると思えるような、あるいは、フルセットにすることを 志向していると思えるような状況を維持していくことが重要なのだと思っています。 この段落の提言に引きつけるなら、そのために人文系の日本語論文被引用インデックスの作成が 一定の有用性を持つのであれば、なんらかの形で取り組んでみてもよいのでは ないかとも思っています。ざっと見た限りでは、被英語圏のジャーナルを対象として試行したプロジェクト としては「紀要を見直す―被引用分析を通じた紀要の重要性の実証と紀要発展のための具体的提言」 というのがあるようです。他にもご存じの方がおられましたらぜひご教示ください。

さて、また提言の方に戻りましょう。次の段落では、急に具体的な話になります。 AI翻訳を使って多言語学術情報発信をしてしまえばよいのではないか、ということで、 これは技術的にはすぐにできそうですし、費用もそんなにかからなさそうですので、 なるべくはやくに事業化してしまってもよいのではないかという気がします。

この節の最後には、やはりAi技術を用いることでジャーナル編集における 様々な局面を支援してもらえるのではないか、という期待と、それを 前節で述べられた新しい支援法人組織が利用すれば効率化が可能である ということが述べられます。今のディープラーニング技術は基本的に コンピュータが出した雑な結果を人間が適宜解釈する形で受容されており、 精度次第ではあまり助けにならないこととか、精度を高めるためには 一定の事項についてのまとまった量のデータが必要であることなど、 現業に関してどれくらい期待できるのかはやや未知数な面もあり、 また、次の技術パラダイムが出てきたときにどう対応するのかも 考えておかないと新しいガラパゴスを作ってしまうことになるかも しれないので、と、気になる事項を色々挙げればきりがありませんので、 予算がつくことがあれば、とりあえず、えいやっとやってしまうのが よいのではないかと思います。

ということで、第二章の「(3)日本発のジャーナルの国際競争力向上のための戦略」は ようやく終了して、次も(3)ですが、「(3)オープンデータ/オープンサイエンス」に 入ります…というところで、今夜は力尽きました。また次回に続きということで、 よろしくお願いいたします。

日本学術会議の提言を読んでみる:学術情報流通の現在と未来 4/n

前回記事の続きです。今回は、PDFの12ページ目(6頁となっていますが)からですね。

http://www.scj.go.jp/ja/info/kohyo/pdf/kohyo-24-t297-6.pdf#page=12

第二章第三節「(3)日本発のジャーナルの国際競争力向上のための戦略」 は、さらに3つの項目に分けられているようです。まず最初の項目をみてみましょう。

(3)日本発のジャーナルの国際競争力向上のための戦略

① 今後10年間に起こるジャーナル出版の大変革

ジャーナル発行に関わるこれから10年の潮流として挙げられているのは、 オープンアクセス(OA)化だけでなく、オープンデータ(OD)・オープンサイエンス(OS) 化を背景とするデータ出版の拡大、です。特に公的資金を用いた研究成果に関して、「その利益(成果)を市民が享受し、自由 に利用する権利が担保されるべきである」という原則が重視される傾向が強まるようです。 世界的な潮流としては、この方向が強まるような雰囲気は筆者も強く感じるところです。 先進国における公的資金の説明責任という観点はもちろんですが、途上国において 学術研究を適切に広め、多様な知のコミュニケーションを涵養していくためには、 オープンアクセス・オープンデータを基礎とするオープンサイエンスの普及がない ことにはにっちもさっちもいかない、という話を当事者の方々からうかがうことが 時々あります。ただ、日本の場合、「受益者負担」という考え方が割と根強く、 その点をどう乗り越えるかが大きな課題になりそうです。国立公文書館の 資料デジタル化提供の時でさえそういう話がでていたほどですが、 「自分に関係ないことに税金を使わないでほしい」「そこから何らかの 利益を少しでも得られるなら税金を使わないでほしい」という志向は 日本では割と強いような感じがしております。もちろん、一方で、 色々な産業政策に税金がどんどん投入されていますので、さじ加減の 問題なのだろうとは思いますが…

ちょっと脱線気味ですが、次の段落にいきましょう。理工系では Clarivate Analytics社の提供するJCR(Journal Citation Report)に掲載されるインパクトファクター(IF) が競争的環境の普及のなかで重視されるようになり、IFの値の高いジャーナルに 論文を投稿する動機になっているとのことです。これは比較的よく知られた 話ではないかと思います。人文系だとArts & Humanities Citation Indexというのものは ありますが、インパクトファクターは計算されて ないようで。ただ、エルゼビア社のSCOPUSを用いてインパクトファクターのようなものを 計算するサービスが提供されているようで、Scimago Journal & Country Rank などがそれにあたるようです。

次の段落は、ジャーナルのインパクトファクターが高騰していく様を 時系列で「牧歌的時代」「大宣伝時代」とした上で、現在は 「オープン化」の流れになりつつある、という風に理解すればよいでしょうか? この流れの詳細がこの後に説明されるようです。

「大宣伝時代」に入ると、それまでは論文発表の前の議論の場となってきた国際会議が、発表論文後にそれを 宣伝する場になってきたのだそうです。その流れで、SNSでの情報流通も研究成果のインパクト としてカウントされるようになってきたようです。

IFが重視される背景についても端的に述べていますが、これは、IFが簡便であるとともに、 これまでの業績評価に関する知識や経験の蓄積があまりなく、評価に関わる専門家も 少ないためにやむを得ずこれに頼っているようなニュアンスで説明されています。 これは非常に冷静で視野の広い見解だと思います。確かに、研究評価に関わる 専門家はごく少なく、専門家のピアレビューの集積を半ば自動的にカウントする 指標としてのIFは、対象となるジャーナルがきちんと収録されている分野においては 比較的便利だろうと思います。とはいえ、 IF偏重の弊害は最近も少し話題になりましたし、やはりなんとか解消して いただきたいことの一つではありますが、一方、予算の大枠を増やすことは 難しく、評価に関わる専門家を育成・配置すると その分研究者のポストを減らさねばならないことになってしまいがちですので、 どこをどうすればなんとかなるのか、多角的な検討の必要があるだろうと思います。

次の段落では、電子ジャーナル会社の雄、Elsevier社が、データ出版こそが今後の 収益の基盤でありジャーナル出版事業は赤字になっていくと予測していると 紹介されます。実験データの追跡可能性を担保するために 提出が求められるようになっており、適切なデータ管理の重要性が 注目されるようになってきているとのことで、これがデータ出版の動機付けと 内実ということなのでしょうか。 しかし、オープンデータ・オープンサイエンス化の潮流にのった データ出版が高収益事業の中心になる、ということなのですが、 重要性やその潮流については近いところにいるのでなんとなくわなるのですが、 そこからどういう風にマネタイズするのか、についてはちょっと想像がつかないので、 これから少しずつ勉強してみたいと思います。

このオープンアクセス化の波が学術情報流通の量的質的な拡大を もたらし、arXivのようなピアレビューを経ない論文の 大量流通へとつながっている、とのことです。arXivはご存じの方も多いと 思いますが、「アーカイヴ」と発音するのだそうで、 現在はコーネル大学図書館が運営するプレプリントサービスのようなもので、 「physics, mathematics, computer science, quantitative biology, quantitative finance, statistics, electrical engineering and systems science, and economics」分野の 1,776,352件(数字は今みたものです)の論文を掲載しているようです。新型コロナウイルス感染症に関する 論文も多数掲載されているようですが、いずれも査読を経ていないので扱いには注意が必要です。 また、これに触発されて生物学でもBioRxivというのがができているようです。 今回の提言では、これらのサービスの今後の評価についてはやや慎重な姿勢を示しています。 さらに、情報系分野でのソフトウェアのコードや開発したアプリの公開や、 その普及度や重要性をユーザが判断するような仕組みが提供されるという流れもでてきているとのことですが、 これはフリーソフトウェア運動やオープンソース運動などとの関連も気になるところです。

最後に、ハゲタカジャーナルへの注意喚起と、無査読論文の扱いに際しての課題を指摘し、 大学等の高等教育機関における現状の科学者倫理教育を高度化すべきと提起した上で、 この項目は締めくくられます。ここでの「倫理」は 法律やルールを守ることから、新しい発見の可能性の芽をむやみにつぶさないようにすること まで、かなり幅の広い言葉になりそうです。去年まで情報処理学会の論文誌編集委員をしていて、 会議のたびによく言われたのが「石は拾っても玉を捨てるな」ということで、 貴重な原石はどこに眠っているかわかりませんので、 基準に満たないからと簡単に切って捨てないような配慮をしなければ、という観点からの ギリギリの議論がよく行なわれていました。どこでもそういう議論はあろうかと 思いますが、それぞれに大変な、そういう一つ一つの小さな積み重ねが、 後に続く人たちを肩の上に乗せることのできる巨人を作り、さらに先を 見渡してもらえるようになるのだろうと 思うと、学術の未来のために大切にしなければならない現場なのだと思います。 大変ですが、がんばっていかねばと思います。

また2頁ほどしか進みませんでしたが、今夜はこれくらいにしておきます。

日本学術会議の提言を読んでみる:学術情報流通の現在と未来 3/n

本日も前回の記事の続きです。

今回は10ページ目の真ん中当たりからですね。

http://www.scj.go.jp/ja/info/kohyo/pdf/kohyo-24-t297-6.pdf#page=9

(2)一括契約による学術情報ジャーナル購読問題の解決

これこそ、日本語の学術情報と少し縁遠いところの例の問題です。冒頭、

学術情報の流通は、ジャーナル購読と無償論文の発行という形で行われるのが、商業学術出版産業がこれまで創り上げてきた購読型学術情報流通モデルである。

とありますが、「無償論文の発行」というのが何を指しているのか、ちょっとうまく意味がとれません。が、とりあえず ジャーナル購読はわかります。我が国全体で、各商業ジャーナル出版社にあわせて約300億円(!)支払っているそうです。 いわゆるビッグディール戦略のためにそうなってしまっているとのことです。すでに国内研究機関でも 電子ジャーナルを購読できなくなっているところが増えているようです。一方で、オープンアクセス(OA) も広がってきているようですが、オープンアクセス対応だと論文掲載料が高額で(10-30万円くらい)、これが研究費を圧迫するように なってきてしまっているとのことです。主要な研究大学の論文掲載料総額は数十億円になるとも言われているそうです。 元々、理工系だと論文掲載料はオープンアクセスになる前から支払っていた(ところが結構あった?)はずなので、 それがオープンアクセス対応になってどれくらい増額になったのかというあたりも気になるところです。

欧州では「従来の購読費にAPC経費も組み込んだオフセット契約と国単位の一括契約モデルへの移行」が 進んでいるとのことで、我が国も新しいシステムを構築する必要があるということで、 「これまでほとんど関与して来なかった科学者や学術コミュニティも、それぞれの立場から」関わるべき としていますが、欧州の場合、学者や学術コミュニティがどのような関わり方をしているのか、という のも気になるところです。とはいえ、自分たちが出している雑誌がメジャーな商業電子ジャーナル会社を 使っているのかそうでないか、というのは、それだけでも関与するインセンティブには大きく 影響しそうです。私もそれほどメジャーではありませんがオックスフォード大学出版局から 雑誌を出している学術コミュニティの運営に携わっていますが、会計を握られることにはなりますが、 会員管理をやってもらえて世界中の大学図書館から購読料を徴収してくれる、といったあたりは 学会を運営する上ではなかなか効率がよいことでもあり、これを切り離してオープンアクセスにして 独力でやるべきかどうか、というのは時々議論になります。要は、学会運営の話がそのまま 商業電子ジャーナル会社のジャーナルをどうするかという話になりますので、この件が学会運営上の 主要なテーマの一つにならざるを得ません。一方、特に日本の人文系の場合、そういう世界とは まったく離れたところで独自に雑誌刊行をしてきていて、現在も多くはそういう感じでしょうから、 大がかりな新しいシステムの構築に関わるということになるとモチベーションを高めるのは なかなか大変、ということになりそうです。それでも、志の高い人が数人でも集まっているような 学協会ならなんとかなるかもしれませんが。

さて、次の段落に行きましょう。 電子ジャーナル会社としても、ずっと今のモデルでいけると思っているわけではなくて、

電子ジャーナル購読契約は、国単位の一括契約とオフセット契約によるAPC定額制へと大きく変わり始めた。ドイツのマックスプランク財団(MPI)がこの突破口を開いた裏には…

とのことで、10年以上の時間をかけた交渉の成果とは言え、収益構造の変化の見通しが電子ジャーナル会社の態度を変えさせたという面もあるだろうと分析しています。 背景として、カリフォルニア大学やMTIとの交渉が決裂したり、といったことも挙げられています。 そして、欧州主要国ではジャーナルの購読のNational Site License(国単位の一括契約)が広がりつつあるそうで、国単位での一括契約により 教育研究機関の研究者すべてが自由に閲覧できるようになるとのことです。これは大変にうらやましいことですね。我が国もそういう 風になってくれるとありがたいところです。この提言でも「現時点で最も合理的で実現すべき解決策である」としています。 とはいえ、ここでも、この費用の中に、日本語の学術情報を支える要素はあまり含まれていないようにも思われます。 ドイツやフランスなど、非英語圏の比較的学術が進んでいる国がこのあたりをどういう案配にしているのか、この話を進める 時にはきちんと押さえておいていただきたいところです。(私も知りたいところです)。 欧州の一括契約をしている国では「概算では我が国に比べて1報当たり1/4程度のAPC(論文掲載料)経費」で論文を出せているそうですので、 そこまでいけると大変ありがたいことです。

もちろん、上述のように、300億円支払っていたものを一括契約にするというのですから、交渉で半額にできたとしても 150億円、これは各大学研究機関がそれぞれ支払っていたわけですから、それを各機関から集めるか、あるいは、なにがしかの これまでの予算を集めて流用するといったことをする必要があるでしょう。ここでは、契約・予算管理法人を新たに設立する必要があり、 そこにJUSTICEの参画をはじめこれまでの蓄積なども反映させるべきだとします。

次に、

このAPC定額制を含む一括契約を我が国で実現するためには、幾つかの克服すべき課題が存在する。

ということで、個別の課題の検討に入っていきます。 まずは、各機関の足並みをどうやってそろえるか、という話です。商業電子ジャーナル会社に関する ニーズは機関によって結構異なりますし、いきなりみんなで始めるということになると足並みをそろえる のも大変です。そこで、とりあえずはRU11や研究開発法人から始めるということが提起されます。 たしかに、このあたりであれば、電子ジャーナル会社に関するニーズは割と近いところが多いようにも思われます。 そこから順次広げていくとのことで、これは比較的妥当というか、他に方法があるとしたら国立国会図書館に すべておまかせ、くらいのことしか思いつきません。(それもかなり無茶な話かと思います)。 また、第二の問題として、交渉に継続的にあたることのできる専門家を配置することの必要性を 挙げます。たしかに、通常の公務員的な立場だと3年おきに人事異動で人が代わってしまって、 そのたびに一から勉強、一から人脈を作り直し、ということになると、なかなか厳しいものがありそうです。 これもなんとかなるとありがたいところです。 そして3つ目として挙げるのは財源です。ここでは、すでに研究者が直接の研究経費からAPCを 払っているのだから、その費用をうまくまわすことが望ましいということが述べられます。 できれば間接経費から徴収して…という雰囲気ですが、間接経費を3割から4割にして、代りに 2割分をこの法人に、という感じにするあたりが妥当でしょうか。間接経費は機関で一括して 処理できますので、一つの現実的なアイデアだろうかと思います。 ただ、上の方では、購読費用が300億に対してAPCは数十億、という話でしたので、これだけだと さすがに少し桁が違う感じです。そこで「一括契約が拡がった時点で、図書購読費相当額を一括してこの法人組織に交付することが望ましい」 ということになります。実際のところ、すでに300億円と言われる額をそれぞれの大学図書館が支払っている わけですから、それを一箇所にまとめることができれば、説得力のある交渉はできそうな感じがします。 ただ、これが実現すれば、大学図書館に回る費用の見た目はかなり減ることになりそうです。 それがどういう状況をもたらすかというのはちょっと見えませんが、学術情報の取得提供が 外部法人と電子ジャーナル会社の間で行なわれることになるのであれば、大学図書館の方は、 ラーニングコモンズ・リサーチコモンズ的な位置づけをより強めていくことになるのかもしれません。 この節の締めくくりは、経済合理性の高い契約を結ぶことによる充実した学術情報環境の効率的な 実現、ということになっています。この視点からの「経済合理性」は、目の前の研究課題に没頭する研究者には なかなか実感しにくいものかもしれません。あまり時間を費やすことなく、しかし「なんかちょっと 自分の研究がやりやすくなった」と思わせるような仕組みでないと、広く受容されるのは難しい のではないかと思います。その意味では、この件に限っていえば、費用負担を増やすことなく オープンアクセス出版ができるようになる、そして、オープンアクセス出版をしたことが 評価の対象になる、というあたりが妥当なのではないかという気が しますので、上記のように間接経費を増やすのではなく、むしろすでに持って行かれている3割の 間接経費の中から新法人の費用徴収が行なわれる、といったあたりが可能であるとありがたい ことだと思います。また、関係者の方々は当然考えておられると思いますが、科研費の 成果公開助成に関わる部分は新法人にかなりつぎ込むことになるのではないかとも 思います。ただ、そこではやはり、日本誤の学術情報流通への投資が急に激減するという ようなことがないような配慮もしていただきたいところです。

 なお、ここの節では「データ出版」という言葉も見え隠れします。ただ、まだあまり明確な象を 描いていないので、それはこの後にきちんと登場するのだろうと思います。

ということで、亀の歩みですが、今夜はこのあたりにしておきたいと思います。

日本学術会議の提言を読んでみる:学術情報流通の現在と未来 2/n

さて、前回の記事の続きです。

PDFを途中から開きたい場合は、PDFのURL末尾に「#page=9」という風につけると 9ページ目が開く、という感じなのですが、これはみなさんご存じでしょうね。(もし初耳という場合は 今後ご活用ください)。

というわけで、9頁目、第二章から始めましょう。

http://www.scj.go.jp/ja/info/kohyo/pdf/kohyo-24-t297-6.pdf#page=9

2学術情報環境の現状と課題、展望

いきなり冒頭の段落から強烈な自省が示されます。

旧態依然とした縦割り制度によって関連組織間の連携が成功しなかったために、それぞれの関係機関で の最適解の追求に終始することになり、学術情報システム全体の最適化に失敗した

「旧態依然とした」という表現でまとめてしまってよいのかどうか検討が必要だと 思うのですが、いずれにしても、変えなければ学術情報流通の専門家だけでは議論が なんともならない状況に追い込まれているにも 関わらず変えることができていない、という風に受け止めておきます。

個人的には、関係機関の最適解の追及が結果として全体に一定の効果をもたらすような 枠組みを用意できればとも思うのですが、それはみなさんわかっておられることで、 おそらくは予算的にも人員的にもそれができなかったということなのでしょう。

結果として現在に残された不完全なシステムの機能不全による障害が顕在化している

という認識が日本学術会議の分科会から出てきているということは、自省する 力を持った組織であるという捉え方もできるかと思います。

次の段落では、DX、AI、OA,、OD、 OS、といった、この種の話に良く出てくるキーワード で今後の展開がまとめられますが、「ピアレビューによる評価を経ない学術情報が溢れ、インター ネット市場が価値を決める新しい学術情報発信・流通システムが拡大する」なかで、 我が国がさらに周回遅れになることについての懸念が表明されています。実際のところ、 SNSで流れる大量の謎情報への対応は我が国ならずとも対応に苦慮しているところだと 思いますが、そこで、一定の評価を得た日本語の情報を適宜投入できないような 状況になってしまうと、学術のみならず、日本社会そのものがますますまずいことになるように思います。 そのあたりで、国債ジャーナルに論文を載せることだけでなく、日本語で様々な ステイクホルダーへの発信をすることも評価していく必要があるのではないかと 思うところです。

「時代遅れとなった古い組織やシステムを速 やかに再構成し、学術情報流通の大変革時代に相応しい新しい学術情報環境を再構築して 国際競争力を強化する必要がある。」

としておられるのが、どれくらいドラスティックな再構成を構想しているのか、この先で 示されることでしょう。

さて、次に、この章は、以下の項目に分けられます。が、どうも(3)が2回出てきているような 気がします。目次の方もそうなっているようです。

(1)学術情報環境の動向と関連する提言の総括 (2)一括契約による学術情報ジャーナル購読問題の解決 (3)日本発のジャーナルの国際競争力向上のための戦略 (3)オープンデータ/オープンサイエンス (4)学協会の機能強化に向けて

ここまで書いてみて、すでに気になっているのが、Web上での提言の参照しにくさです。学術情報の未来を論じる 文章がPDFの頁単位でしか参照できないというのは、なんとももったいないことです。学術振興会のWebサイト 全体のことなので、これだけどうこうするというわけにもいかないのでしょうが、他の提言等も、もっと 参照しやすい形にしてもよいのではないかと思ってしまいます。段落単位での参照くらいは できてもよいのではないだろうかとは思いますし、広く社会に発信すべきと考えて提言を作っているなら、 引用もしやすい形にしておくのがよいのではないかと思います。この提言自体がそういう志向を 持っているようにも思われますので、たとえば実験的にこの提言をそのようにしてみるといった こともあり得るのではないかとも思います。権利関係がどうなっているか等、難しいこともある のかもしれませんが…

というわけで、次は、第二章の(1)、

(1)学術情報環境の動向と関連する提言の総括

です。これまでの学術情報流通の状況について、厳しい評価がならびます。 「構成員のセクト主義や厚い壁の存在」「機能再生や再構築を進める仕組みが組込まれていない」 ということで、「学術情報を支える組織やその機能はこれからの大変革時代に対応できない。」 とされています。セクト主義や厚い壁の存在というのが具体的に何を指しているのかは、 この後で明らかにされるのかもしれませんが、壁を越えるためにはそれなりのコストや犠牲が 必要で、それを引き受けられるところ/人があまり多くなかったということなのだろうと思います。 個別の分野での対応については、前回の記事に述べたような色々な提言があり、なかには それなりに実現できたところもあるのではないかと思いますが、この提言はもう少しスコープが 大きいので、その観点からすると(全然)足りなかったということでしょう。

 そして、学術会議としては、すでに2010年には「包括的学術誌コンソーシアム」の設置を通じて アクセスと発信それぞれに対応したり専門家を雇用して対応したりすることを提案した ことを挙げています。組織を作ったり人を新たに雇用したりするというのは要望は できてもこのスクラップ&ビルド時代ではなかなか難しいところでもあり、大学図書館も どんどん人員を減らしているなかでは新規雇用は難しかったのかもしれないとは思います。 比較的身近な例だと、国立デジタルアーカイブセンターを作りたいという話を聞くことが ありますが、これもやはり、組織を作ったり雇用を発生させたりとなるとなかなか難しそうではあります。 とはいえ、URA(University Research Administrator)など、新たな職種が徐々に広がりつつあることもあり、そういった流れを 学術情報流通では作れなかった、ということは言えるのかもしれません。そのあたりの 大きな判断の流れについては、私のところからは全然見えません。見えてもどうなるもの でもないので、結果を受け止めるしかないのですが…。

 雑談めいた話が続いてしまって恐縮ですが、基本的に筆者が主観で 読んでいるだけなので、今後も雑談まみれになっていくことをご容赦ください。

 というわけで続けますと、次に「に大学図書館コンソー シアム連合(JUSTICE)」の設置の話が出てきます。JUSTICEは、学術データベースの 値下げ交渉でいくつか成果を上げているようで、人文系でもその恩恵を蒙っており、 たとえば、近藤和彦「ECCOからみえるディジタル資料の宇宙」『歴史学研究』2020.9 にて 感謝とともに記されています。ただ、何にどれくらい成功しているのかが外からは少し見えにくい のがちょっと残念なところです。

 この次に出てくるのは学術雑誌の刊行について科研費に大きく依存していた という件ですが、これは全体の割合からするとそんなに大きくないのではないか、 という気がします。私の関係する学会でも少し前までこの助成を受けていたところが ありましたが、一方で、科研費の支出ルールは論文雑誌出版のペースと相性が悪い ということで科研費に頼らない雑誌刊行を心がけているところも結構ありました。 その後、「出版事業支援」から「国際発信力強化」に名目が変わったとのことで、 実際に、要求される内容が結構変わったことを記憶しています。JSTがジャーナル 無料電子化事業を実施したのはこれよりも少し前くらいだったでしょうか? NIIでもNII-ELSという学術雑誌電子化支援事業に取り組んでいました。 提言に戻ると、「しかしながら、補助金を受けた学協会の 多くは海外の出版社に業務委託するという出版モデルから脱することがなかった」との ことで、理工系の大勢はそうだったのでしょうね。ここでは国内の 学術出版関連の人材育成にも結びつけたかったのにうまくいかなかった、 ということが述べられています。部分的には、たとえば学術情報XML推進協議会 が作られて技術の共有などをすすめてくれているおかげで、 学術雑誌を記述するための国際標準的な 規格であるJATSに準拠したXMLデータを作ってJ-Stageに アップロードする作業に対応できる印刷会社は結構増えてきていて、 つまりそういう人材が育成されてきているということで、また、 値段も下がってきているように思います。 とはいえ、「…の壁は厚く、国内の機関や学会が 一丸となって取り組むことができなかった。」 とあるように、個々の学会の動きはやはりそんなに軽快ではなく、 というより、一部の人達が大幅に仕事のやり方を変えなければならず 多くの人がそれにあわせて多かれ少なかれ対応しなければならない という状況は、なかなかハードルが高かったのだろうと思われます。 海外勢がどんどんデジタル化を進めていくなかで、我が国の研究者も 海外志向が強まっていたこともあり、結局国内学協会の学術雑誌は 海外の競争から取り残されてしまった、とあります。これに関しては、 国内学協会がそれに取り組むインセンティブが弱かったということに 尽きるだろうかと思います。主体はいずれも研究者ですが、海外ジャーナル での論文掲載が業績として高く評価されるという状況で国内雑誌に 力を入れるのはどうしても二次的にならざるを得ない、というのが 特に理工系では大きいでしょう。人文系の方は、少数の研究者が 手弁当で編集をするところから、商業出版社が刊行を引き受けて 書店にも並べてくれるところまで、非常に多様で、商業出版社は デジタルへの抵抗感が強いところが多く、少数の手弁当雑誌は 担当者の努力次第でデジタル公開される場合もある、というような、 個々に様々な状況があります。最近は、J-Stageが無料論文公開の ハードルをかなり下げてくれたおかげで、かなり楽に論文公開が できるようになっています。研究者でも、Webで成績入力できる くらいのITリテラシーがあれば、J-Stageで無料で論文雑誌公開が できます。そのくらいのことになっていますので、たとえば 日本歴史学協会が出している 「公開要望書 国立国会図書館デジタルコレクションの公開範囲拡大による知識情報基盤の充実を求めます」 や 「国立国会図書館デジタルコレクションによる学会誌のインターネット公開についてのご案内」 といったあたりの話も、前者で「学会・協会が独自に学会誌のデジタル化をすすめるのは費用がかさみ、対応できないという現実」と 書かれていますが、個々の研究者がワードで書いた文書をPDFにして出してもらって、それをJ-Stageにアップロードする、という 方法が、大規模な雑誌だと外注せざるを得なくて外注すると確かにお金がかかりますが、小規模なら頑張れば手弁当でも可能なので、 その方向も真剣に検討してみていただいてもよいのではないかと思ったところでした。

日本語の雑誌は、日本だけからアクセスできればよいというものではなく、海外の日本研究者 から期待される面も大きいので、デジタル化を進めるのは日本語論文雑誌においても、というより、 むしろ、日本語でも学術が行なわれているということを世界に見えるようにしておくために 必要です。そのあたりのことは、たとえば、少し前の本ですが 江上敏哲『本棚の中のニッポン 海外の日本図書館と日本研究』(オープンアクセスなのでリンク先で読めます)などを読んでいただくと 状況がわかるのではないかと思います。筆者も以前にそういうことをテーマにしたブログ記事を書いたことがありました。

digitalnagasaki.hatenablog.com

この方面の話は、いつまでも続いてしまうので、今夜はこのあたりにしておきたいと思います。「提言」はまだまだ長いので、引き続きお付き合いいただけますと幸いです。

日本学術会議の提言を読んでみる:学術情報流通の現在と未来 1/n

日本学術会議が急に世間で話題になっています。だからというわけではありません。話題になる前にでたこちらの提言

学術情報流通の大変革時代に向けた学術情報環境の再構築と国際競争力強化

をみんなで読む会をやってみたい、と、提言を見たときから思っていたのですが、

なかなか時間がとれないうちに日本学術会議が急に注目を集めるようになり、しかも10/1から自分も連携会員になってしまいました。 ただし、第一部会なので、第三部会が出したこの提言は、部会も違う上に関係者になる前に作られたということで、 利害関係者ではないということで、この提言を私の主観から読ませていただきたいと思います。

なお、筆者は学術情報流通については専門ではありませんが実践者として少し関わっており、また、出身が人文学系であり、 人文学も学術情報流通の話と無縁ではないので、人文学の視点も加味しながら読んでみる、という風にしてみたいと思います。

それから、一度に全部読むには長すぎるので、少しずつ読んでいきたいと思います。今回のブログ記事は「あれっ?」というところで 終わってしまいますが、ご容赦ください。

それでは、以下、読みながら気がついた点についてメモしていきたいと思います。

執筆に関わった方々

最初の2頁ほどに、執筆に関わった方々のお名前がリストされています。14名から成る分科会が作られており、9名の 会員と5名の連携会員が属しておられたようです。この提言の場合、この14名以外に21名もの協力者がリストされている ことが目を引きます。研究者のみならず、図書館員や学術情報に関わる企業からも参加があるところも興味深いところです。 学術情報流通がどのような人々によって支えられているか、そして、この提言がいかに幅広く目を配って作成されたか、 ということがあらわれているのでしょう。

要旨

要旨に挙げられている項目をみれば、大体内容はわかりそうな気がしますが、個別の情報を知らないと よくわからなかったり実際には役に立たなかったりするので、要旨はざっと見るだけにして本文にいきましょう。

1提言作成の背景:我が国の学術情報発信力の向上に向けて

まずは理学工学系の話に限定しつつ、日本の研究の国際競争力が落ちてきているところから話が始まりますね。 論文数が減っていることを「学術情報発信力の衰退」という表現にすることで、今回のタイトルとつながってくるようです。 学術情報(+データ)の流通と適切な管理・活用の重要性が熱く語られています。 「学術の基盤環境である学術情報流通のネットワークを通じた高度な学術情報のコミュニケーション」 ということで学術情報流通が、学術情報のコミュニケーション、という位置づけにされています。ただ、 学術情報流通という言葉はScholarly communicationの和訳らしくて、元々コミュニケーションを 含意する用語だったようにも思われます。昨年ノースカロライナ州で開催された2019 Scholarly Communications Institute | trianglesci.orgという イベントに参加した際には、Equity in Scholarly Communications.テーマの元で公募を通った5つくらいのグループが それぞれ持ち寄ったテーマで議論をしていました。(世界中から集まった40人くらいの参加者全員 にA. Mellon財団が旅費滞在費を出していたのはちょっとびっくりしました)。私が参加したグループは 要するにTEIガイドラインの国際化という話で、どちらかと言えばデータの話でしたが、他のグループは 学術情報をめぐる人のコミュニケーションが主なテーマになっているようでした。学術情報流通は門外漢なので あまりよくわからないのですが、Scholarly communication に学術情報流通という訳語を与えたことで議論の幅が結構変わったのかもしれないと思ったところでした。

また、学術情報環境(学術情報インフラ)の整備が必要であるにも関わらず経費高騰により 最低限必要なものさえ失われそうになっている、としていますが、これは人文学系でもまさに 同様で、わかりやすい例で言えば、大学図書館の人員と経費が削減されつつあるところがそれにあたるでしょう。 そして、「これまでの学術情報インフラの維持や管理については、理学工学系の科学者のほとんど が無関心であり、」としていますが、これは人文学系でも似たり寄ったりな面があると思います。 とはいえ、限られた人生の中の、しかも 年を取るほどに減っていく、研究のために費やせる時間の中で、自分の研究対象に向き合う 以外のことに時間を費やすのは、なかなか難しいことでもあります。ある種の役割分担のようなものも 必要なのかもしれません。ただ、近年は、競争的研究資金の審査や大学研究機関の認証評価など、 競争環境を作り出すために専門家が割かなければならない時間がどんどん増えてきてしまっている ようにも思えますので、その点についても何らかの効率化を図る必要があるのかもしれないとも 思っています。 いずれにせよ、本提言では、そこを巻き返して、いわば学術情報のエコシステム全体を再構築すべきときに来ている、ということが述べられているようです。

一方、いわゆるガラパゴス化により、国内学協会の存在意義や持続可能性が問題になりつつあるとの見解も示されています。 私見では、この点は、特に日本語読者を意識する場合、ガラパゴス化をさけられない状況があり、むしろそれによる メリットをきちんと成果として評価されるような枠組みを用意していく必要があろうかと思っています。そして、 そのためには、話者人口規模の近い非英語圏先進国と手をとりあっていくことができるとよいのではないかとも思っています。 思っているだけで、実際に何ができているのかと言われるとなかなか難しいところではありますが…。周囲をみてみると、 J-Stageでは日本語論文誌も無料で公開してDOIも付与してくれるようになっており、さらに論文索引(サイテーションインデックス)も 搭載しているため、論文を掲載する学会側がきちんと論文索引を作成すれば、指標化はできるようになっているはずです。(実際には 論文索引があまりきちんとできていなくて集計もうまくできないということがあるようですが…)。あるいは、 筑波大学で試みている新たな評価指標もあります。一方、フランスでは、 人文社会科学向けのオープンアクセスプラットフォーム Open Edition が提供されているようです。 こういった取り組みについてはもっとよくご存じの人がいると思いますので、ご教示をいただけるとありがたいところです。

結果として、「過去 20 年間に起こった世界的な電子ジャーナル化の波に我が国は対応できずに周回遅れになった」 とのことですが、一方、それを「挽回する「最後の好機」でもある。」とのことです。関連する全ての構成員が 協働すべし、とのことですので、私も機会があれば、と思います。

本章の最後では、これまでに出されてきた学術情報流通に関連する提言を振り返ります。数年おきに、5件の 提言がでていたようです。以下にリンク付きでリストしてみましょう。

筆者もこれらはその都度拝読して、その都度感心して期待しておりましたが、実現した事柄はごくわずかだったそうです。 なお、ここでは紙数の関係で挙げなかったのかもしれませんが、学術情報・データの流通に関しては個別分野からも色々な 提言が出ていて、たとえば以下のようなものが見つかります。

(日付やリンクが間違っていたらご指摘ください!)

タイトルから推測して目次をみたくらいですので、まだかなり漏れがあるかもしれませんが、学術情報やデータの整備・拡充に言及している提言をざっと 探しただけでこれくらいあります。デジタル社会で学術をいかに展開していくかという話は多くの(おそらくはほとんどすべての)分野で重要になっている ようです。自分に関係のある分野の提言はぜひ押さえておきたいところですね。 なお、「科学的エビデンスを主体としたスポーツの在り方」には、柔道の山口香氏や日本サッカー協会会長の田嶋幸三氏も名前を連ねてらっしゃって、 なかなか興味深いところです。

さて、今回の提言に戻ると、今回は、これまでの提言を踏まえて、以下の4点について議論するとのことで、 「その多くは日本の学術全体に共通する課題に対しても有効であると認識している。」としてこの章が締めくくられますが、 まったく同感です。

  1. ジャーナル購読・学術情報の流通・受信
  2. ジャーナル発行・学術情報の発信
  3. 理学工学系におけるオープンデータ/オープンサイエンスの課題
  4. 我が国の学協会の学術情報機能の強化

始まったばかりですが、今日はこの辺でひとまず終わりにします。また機会をみつけて続きを読んでいきたいと思います。

KHコーダで 「#大学生の日常も大事だ 」を分析してみた(ちょっと追記)

#大学生の日常も大事だ というハッシュタグがツィッターを席巻したことがありました。そこで、しばらくこのハッシュタグのついたツィートや、そのツィートをしたアカウントのツィートをツィッタAPIで収集しておりました。 7/10から7/29までに取得した173GBのツィートのデータから、当該ハッシュタグのついた88,082件ツィートを、Pythonであれこれ整形して、さらにKHコーダを使ってちょこちょこいじってみて、なるほど、こういう感じかな、と思ったのが以下の図です。

f:id:digitalnagasaki:20200801014548j:plain
コーディング:MDS

「今後」と「辛さ」、「施設」と「費用」がそれぞれ近いということ、それから、「横の人間関係」が「勉強・研究」と比較的近いことが興味深いところです。

なお、今回の分析の仕方だと、否定表現も肯定表現も区別できていません。「辛くない」というツィートがあったとしたら「辛い」として カウントされてますので、上の図はそういうものだと思って見てください。

ただ、そうだとしても、やはり、今後のことを心配しているであろう人が多そうであること、施設が十分に使えないのに費用がかかることについて色々な意見が出ているで あろうこと、友人やサークル、人との出会いなどが大学生のなかでは勉強・研究とならんで重要であること、など、ツィートをじっと読めばわかることではありますが、このようにして 見やすい形で確認することができました。

感情表現もとってみたいと思ってAmazonのそういうAPIなども試してみたのですが、あまりよい結果にならなかったので今回はここまでとしておきました。

なお、今回使ったデータの頻出語リストは以下のような感じでした。

f:id:digitalnagasaki:20200801235448p:plain
頻出語リスト

HSH_1 というのはハッシュタグの置き換え、RT_PATI1 というのは、「大学生は、いつまで我慢をすればいいのでしょうか。」というリツィートを置き換えたものです。なぜこのような 置き換えをしているのか、というのは下の方で説明します。これが次のURLとほぼ同数なのは、 このURLが示す画像(マンガ的なもの)と一緒にリツィートされたものが多かった、ということです。このツィートのツィッタ画面上でのリツィート数はもっと多いのですが(11万くらい?)、APIでツィート収集をすると アクセス制限をかけているツィートを取得できないため、このような数字になっています。ということは、この件に関心を持っているユーザのうちアクセス制限をしている割合が相当数に なる、ということでもあります。アクセス制限下で、表に出せない本音を共有している人達がかなりの数いるかもしれないと思うと、この点もちょっと気になるところです。

ここまでのやり方

以下、どんな風にしてここまでたどり着いたか、逆にたどっていってみますので、同じようなことをしてみたい人のご参考になればと思います。

KHコーダをある程度使ったことがある人ならご存じかと思いますが、「コーディング」機能を使って人力クラスタリングを行なった上で、さらに多次元尺度法のデフォルト設定であるKruskal/Jaccardを使って みました。他の方法も一通り試してみましたが、これが一番しっくりくるような感じでした。

コーディング

「コーディング」は以下のようにしてみました。KHコーダでは、このようにして、自分で 出現単語を分類して、分類単位での分析を行なうことができます。

*大学生
大学生 or 若者 or 学生 or 新入生

*大学・教員
大人 or 先生 or 教授 or 教員 or 大学

*横の人間関係
友達 or サークル or 会える or 先輩 or 交流 or 出会い or 部活

*辛さ
辛い or 限界 or 我慢 or 孤独 or 不満 or リスク or 不安 or 鬱 or 嫌

*勉強・研究
レポート or 課題 or 勉強 or 研究

*施設
図書館 or 施設 or キャンパス or 学校

*今後
後期 or 今年 or 秋 or 来年

*コロナ感染症
コロナ or 感染 or 対策

*授業形態
オンライン or パソコン or 対面 or 授業 or 単位 or 実習 or ゼミ or 実験 or 講義

*費用
学費 or お金 or 支援

*日常生活
日常 or バイト

大量のリツィートの扱い

普通にツィートを集めると、大量のリツィートが入ってきてしまいます。これを丸ごとKHコーダにかけると、大量にリツィートされた文章に含まれる単語に分析結果が大きく引きずられてしまいます。それはそれで良いということもあるかもしれませんが、今回の場合、単なるリツィートだと、書いた人の事情を表しているというよりは単に賛同しているに過ぎない場合が多いかもしれないということで、リツィートはなるべく外して、自ら書いたものを分析対象とすることにしました。

APIで取得したツィッターの構造化データにはリツィートであるという情報も含まれているのですが、どういう構造になっているのかをきちんと検討する時間が惜しかったので、Pythonで「同じテキストが5つ以上あったらリツィートとみなす」という風に処理するプログラムを書いて処理しました。ただし、リツィートしつつ何か自分で付け足している場合も考えられるため、リツィートの文は記号+連番に置き換え、未知語としてKHコーダの分析対象にできるようにしました。

データの整形

KHコーダに読み込ませるデータはCSV形式である必要があります。そこで、Pythonのプログラムをちょろっと書いて、集めたツィートを「日付, ID, ScreenName, TweetText」というCSV形式に変換しました。最初は、全データをCSVにしてみたり、「当該ハッシュタグのついたタグ+その後5件まで」というようなことをやってみたのですが、KHコーダに読み込ませたら2日経っても読み込みが終わらない、という状況になってしまったので、それは諦めて当該ハッシュタグ付きのみとしました。

ツィッタの収集

ツィッタの収集は、ツィッタAPIの利用申込をすると、無償で225回/15分のツィート検索&取得ができます。利用制限回数はこちらにまとめられています。前述のようにJSON形式の非常に詳細な構造化データが落ちてきます。どれくらい詳細かというと、試しに一つ数えてみたら7322文字ありました。140字ツィートするだけでこれだけのデータが保存され、やりとりされるのだと思うとなかなか圧倒されますね。

取得用プログラムは、API認証を行なわなければならないのですが、Python3では oauth2 というライブラリがあって、それを使ったら割と簡単に書けました。

さらに、「ツィートした人のその後のツィート」も収集したかったのですが、これは900回/15分取得できますので、大量取得となってもこの規模だとまあなんとかなりました。取得したタグ付きツィートからuser IDを取り出してリストしておいて、そのリストを読み込んで定期的に収集…という形になりました。15分…ぴったりだとちょっと短いかもしれないので、time.sleep(1000) という風にして、一定時間ごとに勝手に取りに行くようにしました。

おわりに

ツィッタの文章は短い割にコントロールされていないので分析に使うには良し悪しがあると思いますが、テキスト分析やWebでのデータ取得の練習をするには良い教材になると思います。大学生の皆さんは、誰でも基本的な技能として身につけておいて損はないと思います。オンライン・オンデマンドの授業に参加できるようなパソコンと通信回線があれば、あとは無料でいくらでも勉強できます。ツィッタに限らず、電子テキストはあちこちに大量にありますので、うまく一定の基準で取得してそれを分析してみるようなことができれば、将来的にも色々役立つことがあると思います。興味がわいたら、KHコーダを作っておられる樋口耕一先生に感謝しつつ、今からでもぜひお試しください。

なお、KHコーダを本格的に使おうと思ったら、樋口先生の御著書を一度読まれることを強くおすすめします。チュートリアルの題材は漱石の『こころ』で、それ以外にも新聞記事を分析する事例など、色々興味深い内容です。コンピュータを使って日本語の文章をどういう風に処理し、理解の助けとするか、という実例として読んでみても、とても面白いです。

また、プログラミングも、今の大学生のみなさんはぜひ習得しておくとよいと思います。私は、インド哲学を勉強していたド文系の学生でしたが、大学4年生で卒論のためにパソコンを買って、その後大学院にあがってから、23歳くらいで初めてプログラミングを始めましたが、それでもそこそこできるようになりました。当時はWeb検索システムとかWeb掲示板を作ったりといったことが主でしたが、今の皆さんは、人工知能技術を簡単に使えるようになるプログラミング言語を無償で習得することもできます。正直、とてもうらやましいです。「Python 入門」で検索すれば色々な入門サイトがヒットします。ある程度Pythonを使いこなせるようになったら、最終的にはDeep Learningというキーワードで勉強すべきことを学んでいただくとよいと思います。

ツィートを分析しながら生のツィートをたくさん読ませていただいて、これもみなさんの多くの嘆きのうちのほんの一部に過ぎないと思いつつ、その大変さを改めて痛感しました。なかでも、人に会えないし新しい出会いもなかなか作れないというのは、特に新入生のみなさんには本当にきついことだと思います。課題が多過ぎる等の具体的な問題はある程度解決される部分があると思いますが、大学という場で人に会うことがもたらしてくれるかもしれないセレンディピティへの期待を代替するのはなかなか難しいことだと思います。私自身は大学では非常勤講師に過ぎないので何の権限もないのですが、そのための対応も、組織としての大学や個々の教員が、それぞれに真剣に考えてくれていると期待しています。

一方で、この状況だからこそできることもあるかもしれません。たとえば、ここでみなさんがテキスト分析やプログラミングを勉強してくだされば、社会に出てから割と直接的に役立つことも多いですし、そういう人がこの時期から劇的に増えたとしたら、IT後進国日本も、ようやく遅れを挽回できる時がくるかもしれません。もちろん、そこまで肩肘張らずとも、他にも色々なことができると思いますし、その中には、やってみたら実は面白かった、ということもあるかもしれません。この希有な体験を少しでもプラスに持っていくにはどうしたらいいか、夏休みの間に色々考えてみていただくとよいかもしれません。

MLAのウチとソト

MLA、と言われて、「文系」の人が思いつくものにはおそらく2種類あります。一つは、Museum, Libraries, and Archivesの略であり、博物館・美術館・図書館・文書館等のことを 総称し、そういった文化的なことがらに関わる機関が連携して活動することを志向して使われ始めたものではないかと想像しています。もう一つは、 Modern Language Association の略語であり、Wikipediaでも紹介されていますが、 19世紀からある割と古い学会であり、どちらかと言えば比較文学的な方向性が強いと聞いたことがありますが、いずれにしても、米国の文学系学会の中ではかなり大きなものの一つのようです。 2014年に開催されたものは日本語でイベントレポートが読めます。(なんと、今や各方面で有名な北村紗衣先生が訳してくださっています。)参考文献のスタイルで「MLA形式」というのを 聞いたことがある人もいると思いますが、そのようなものを作って公表し、世界的に使われるようになってしまうような程度の力を持っている学会でもあります。とりあえず、前者をMLA (J)、後者をMLA (U) としておきましょうか。

このようにしてみてみると、重なるところもあるものの、なんとなく棲み分けできそうな気がしないでもないです。ただ、これが、デジタルが前面に出てきたことで少々ややこしいことになりつつあります。

「MLAでは、デジタル研究やデジタルメディアにおける制作物を評価するためのガイドラインを策定しています。」

さて、どちらでしょうか?MLA (J) も、今や デジタルアーカイブの世界では非常によく出てくる言葉になっており、そういうものを作っていてもおかしくないのでは、関係諸機関も頑張っているのですね、という 気持ちになりそうです。しかしながら、よく考えてみると、MLA (J)は、それ自体で ガイドラインを策定するような主体ではない(おそらく)ということで、MLA (U) であることがわかります。

ただ、MLA (J) が、そのようであることを知っている人はどれくらいいるでしょうか? と考えると、デジタルがそれほど前面に出てきてなかったころに比べると、混乱度がやや高まるのではないか という気もします。

ちなみに、MLA (U) は、2000年にそういうガイドラインを策定・公表し、改訂もしてきている ようです。2000年から、ということはつまり、Digital Humanitiesという言葉ができる以前のことであり、すなわち、2004年頃に始まる国際的なDigital Humanitiesの潮流を形成する主力を成したコミュニティの一つでもありました。 上にリンクしたイベントレポートでもその一端がうかがえると思います。日本で言うところのデジタルアーカイブの構築や利活用に文学研究の観点から本格的に取り組んで既に20年以上経っている学会、ということでもあります。 (取り組み始めたのはおそらくかなり前だと思います)

もう一ついってみましょう。

「MLAでは、文化研究のためのオープンアクセスの研究や教材を共有し、分野横断的な研究を支援するWebサイトを運営しています」 これも、上記のようなMLA (J) の状況を知っていれば、MLA (U) であることがわかりますね。MLA (U) は そのようなサイトとして、Humanities Commonsを運営しています。

さらにもう一つ。

「MLA コモンズというオンラインコミュニティサイトがあって文学研究のためのオープンな研究や教材を共有したり議論したりしてますが会員限定です」

というのを聞いて、もし私がMLA (J) の実際の状況をよく知らなければ、「どこにいけばMLA (J) の会員になれるのだろう」と一瞬思ってしまいそうです。 その後に MLA Commonsでググればすぐに事情がわかるとは思いますが。

では、MLA (U) の世界でMLA (J) のようなものがどう呼ばれて共存しているのかというと、LAMとか、GLAMなどと呼ばれるようです。順番が違っていたり、ギャラリー(G)がついていたりする ようですね。

一方、MLA (J) の世界でも、最近は、SaveMLAKにおいて公民館のK がついてMLAK(むらっく)という略称が使われるようになったり、また別の発想として、 大学と産業界を含めてMALUIという呼び方もされることがあるようです。いずれもその背景や使っている人達の想いをよく表現していて 素敵だと思います。MALUIの方は、耳で聞くとデパートの丸井との区別が少し難しいかもしれませんが、表記は異なっていますね。 文脈的にはデパートと間違えることはあまりなさそうな気がしますが・・・(どうでしょうか?)あるいはまた、Open GLAM JapanGLAMtechなど、GLAMをそのまま使うこともあるようです。

しかしながら、MLA (U) を知っている編集者がたくさんいそうな出版社でも MLA (J) をタイトルにつけた本を刊行したりしているので、 むしろ、敢えて重ねている人達もおられるのかもしれないとも思うのですが、このまま行って大丈夫かな・・・と、ちょっと気になったりも しています。とりあえず、授業でこういう話をするときは、上記のような混乱のしやすさがあるので聞く時も話す時も注意するようにと伝えるようにしていますが、 みなさん、このあたりはどういう風に意識しておられるでしょうか?