立命館大学GCOEセミナー 番外編 第九

戊子歳季冬拾八日

壺中の天 −デジタル環境下における国文学(研究手法)の孤独−(講演レジュメ)

千葉大学 高 木  元 

概要 国文学研究における伝統的な研究手法は、デジタル環境の整備によって本質的な変化がもたらされたとは考えにくい。たしかに文献書誌情報や本文テキストや注釈の成果など、研究史上に蓄積された情報や知見、さらには一次資料が画像データとしてインターネット上に公開され、世界中から参照しやすくなった。さらに必要な情報に到達するまでの時間やコストは格段に低くなったし、嘗て一生掛かっても触れられなかったほどの情報量にアクセスできるようになった。だが、それだけのことでしかないのかもしれない……。

一、悲しき玩具(パソコン=私的電子計算機)

 使うこと自体(環境整備)が自己目的化。使えるまでには相応のコストが不可欠だった。

 某先生曰「手で書いた方が早い」(笑)。しかし本質的問題は「速度」ではなかった。

MS-DOS      日本語処理上の障害 パソコン通信 メール BBS
MS Windows3.1  出来損ないのGUI …… MacOS (Bomb!)
MS Windows95  インターネット WEB
IBM DOS/V    NEC-PC98 の呪縛から解放
MS Windows XP  ブローバンド 大容量記憶媒体
Apple OSX    ボーダーレス Linux

前インターネット(スタンドアロン)時代は、主として自分で入力したテキストの処理しかできない孤独な時代であった。外部記憶装置の容量は少なく、アプリケーションは高価で汎用性に乏しく、使い難かった。データはエディタで入力したテキストとして持ち、UNIXから移植されたフリーのツール類を使っていた。一方、画像データは圧縮フォーマットが規格化されておらず、スキャナもデジカメも普及していなかった上に、大きなデータを扱うにはマシンが非力過ぎた。

公衆電話回線を利用した音響カップラで、大型電子計算機(メインフレーム)のデータにアクセスできるように成った時の感動は忘れがたい。尤も、電光掲示板(死語?)より遅い通信速度ではあったが…。その後、モデムが安くなり、パソコン通信が普及し始めてからは、BBSの情報交換用の掲示板や電子メールが一般化して、(国内では)時空を超えた情報交換が可能になった。ただし、パソコン通信サービスを提供する会社が使っているメインフレームの中だけと云う閉じられたシステムであった。

その後はインターネット網の普及に拠り、情報処理端末としてのパソコンの位置がより明確化した。マシン自体のスペックの上昇に相反して、価格は猛烈な速度で下がってきた。現在ではメインメモリが2G、ハードディスクが1T等と云う、嘗ては想像だに出来なかったマシンも珍しくなくなった。また、大きく重かったディスプレイも同様で、液晶が普及してからは狭い机を占有することもなく、さらに高性能なグラフィクボードの出現で、ディスプレイを九十度回転させたり、複数並べて広い画面を使うことも容易になった。一方、スキャナやデジカメの高性能化と価格の低下は目を見張るものがあるし、持ち運びできる記憶媒体も大容量化した上に安価に手に入るようになった。

つまり、斯様なデジタル環境の進歩は価格性能比(コストパフオーマンス)の向上のみならず、従来実用的ではなかった画像処理や大量データ処理などの作業が、個人の書斎に備えられるハードの力で充分に可能になった。同時に、インターネット環境の進化に拠って文字通り世界中のマシンがIPアドレスを用いて網の目のように繋がり、サーバさえ用意すればデータを一箇所に集中させる必要がなくなったのである。

二、国文学の研究手法

さて、ハードウエアの著しい進捗の結果が、国文学研究にもたらした研究環境の変化とは何であったのか。

嘗て「手書きの時代は終わった。これからの時代はパソコンなしでは研究が出来ない」と語られていた。昨今の印刷会社は、電子化されていない手書原稿の場合、入力代を請求するようになった。要するに今や入力代は別であって、組版と印刷製本代がデフォルトの料金なのである。しかし、原稿が手書きか否かは、製品である印刷物にとっては本質的な問題ではない。本質的な差異は入力した文字列が機械可読テキスト(テキストデータ)として手許に残ることである。これは、その後の様々な使い回しが可能になったと云うことを意味している。そのままテキストデータとしての配付や、HTML化、論文資料集として再構成する時にも使える。勿論 XML化してデータベースとして用いることも容易である。何よりもフルテキストは索引を内包しているとも云えるため、正規表現などが使えれば自在な検索や加工ができる。

拙サイト(レンタルサーバ)には、小生の著編作データや論文のほぼ全てを載せてインターネット上にテキスト(HTML)として公開してある。ログを見ると昨今のアクセスは国内よりも海外の方が多いが、国文学研究の趨勢を反映しているのかも知れない。何れにしても、放っておいても文字通りワールドワイドなサーチエンジンの勤勉なロボットが、日々絶え間なく索引を作ってくれている。お蔭でサイト内の索引としても使える。 紙媒体では PDFなど画像データにはできるものの、テキストを貼り付けるための OCRの精度が低いので、とてもフルテキストには及ばない。尤も、これも時間が解決してくれる問題かも知れない。

一方、嘗てのように各種のデータベースや電子化された辞書類が使えない環境での研究では、何をするにも手間と暇とが掛かるであろう。しかし、これも謂わば労力と時間との問題であって、やはり本質的な差異とは云えないだろう。尤も、デジタルデータでは見落としなどのない一意的な精確さは求められるが、紙媒体のような一覧性が求められないので冗長性に欠ける点は、イメージが着想に直結することの多い文学研究にとっては欠点とも云える。

データベースも各種存在するが、寧ろ信頼しうるリンク集を見つけるのが近道かも知れない。海外の漢詩文や中国古典のデータベースなどは確かに重宝ではある。機械可読化されたのは定型の詩歌が早かったが、和歌や俳諧はデジタルデータとして市販されている。これらは、特定の検索インターフェイスを強要される点に難点がある。本文自体も暗号化されていてテキストとして取り扱うことが出来ない。その『国歌大観』なども、一般に索引としての利用しか考えられないので、大部で高価な書籍の方は投げ売り状態になってしまっている。一方、フルテキストとしては、実に長い時間が掛かったが、岩波書店の旧版日本古典文学大系が国文学研究資料館のサイトで公開されている。『国書総目録』もやっと公開され、こちらも書籍の利用価値は甚しく低くなったものと思われる。

さて、伝統的な国文学研究が一体何をしてきたかを一口で云えば〈訓詁注釈〉である。目前にある研究対象テキストに用いられている語句について、過去の文献を渉猟してその用例を博捜し、その文脈に於ける意味を調べた上で、テキストを注釈的に読解すると云う営為の積み重ねこそが、とりわけ古典文学研究の王道であると一般化できるであろう。精確な文脈的意味把握なくしては読解も批評も不可能である。ただし、伝統的ではない国文学研究(の一部)には、単なる印象批評(感想文とも云う)や、言語学などから将来したドグマを当嵌めての屁理屈なども散見したが、現在では影を潜めている(ような気がする)。寧ろ、歴史学(メディア史や文化史)と文学との間に架橋して、作品論や作家論を越えようとする研究が盛んになってきているように思う。

一方、〈文系基礎学〉としての書誌文献学も国文学が担ってきた分野である。具体的なモノとしての書物を研究対象として、物理的なありようを記述することを基本課題とし、国内のみ成らず世界中(と云っても北半球)の国々に散在する和本を実見してデータを記述する必要がある。また、真っ当なコレクションの目録を作成するためには、その文庫の書誌調査のみ成らず、他に所在する同一標目との比較が不可欠であり、所在情報の整備が肝要である。『国書総目録』は、その紙ベースでの達成であった。しかし、現在は『国書総目録』に未登載の標目が多数存在していることは知られており、短絡的に「『国書』未載だから稀覯本だ」とするのは不勉強な古本屋くらいのはずである。写本は一本毎に唯一の存在であるが、板本や版画は複製技術の成果であるから嘗ては複(多)数存在したはずであり、世界の何処にそれが残存していたとしても驚くには価しないからである。尤も、海外にもたらされた文献書籍等は、その経緯自体が文化史研究の対象になるはずである。

この書誌調査に関しては劃期的な変化があった。手書きの書誌カードで書誌を取る場合には、一日にせいぜい十数標目の調査が限界であった。また、写真撮影が許された場合も、重くて厳つい銀塩カメラと撮影スタンドに照明装置まで持ち運んでの撮影は一人では大変だったし、時には移動に車両が必要であった上に、撮影結果は現像してみなければ分からず、紙焼まで作成するとかなりの費用が掛かった。つまり、一コレクションの悉皆調査には大勢の人手と日数が掛かり、当然費用もかなりの額に及んだ。嘗て、国文関係科研費の使途のほとんどが、これらの調査に用いられていたのである。しかも、調査から戻って手書きのカードを改めてデータ入力しなければならず、書き間違いや打ち間違いによるミスも少なくなく、さらに表紙の色や模様などを文字で記述するので個人差が多くて良く分からないこともある。

ところが、ノートパソコンと高性能なデジカメを手にした我々は、小規模のコレクションであれば一日で調査を終えることも可能になった。その上、現地で他のコレクションの画像を参照することも、書誌データ自体の入力も可能だし、色や模様について悩む必要もなくなったのである。錦絵など画像資料については、よりメリットが大きかったはずである。さらに海外調査の場合には一層の労力と経費と時間との節約になった。

三、課題

デジタル環境下の国文学研究にとって、(本発表のタイトルの如く)本質的な変化は何一つなかったと云って片付けることも可能であろう。しかし、デジタル環境に拠って労力と時間と費用の大幅な縮小がもたらされた結果、従来は予想も付かなかった程の膨大な情報量を得ることが出来るようになってしまった。昨今の忙しない〈大学改革〉の嵐の渦中、それが幸せなことであったかどうかは分かりかねる。何故なら、我々に過重な仕事量をもたらしただけであるとも云えるからである。長閑であった文学研究が、それ故に目に見える成果を要求され(誰にだ?)、悉く数値目標を出さなければ成らない昨今、百万件のデータベースを整備するためのコストは下がったものの、それだけ担当者の時間と体力とが収奪されているわけで、これが本当に幸せなことかどうか……。

だがしかし〈量〉が〈質〉を凌駕すると云うことも事実であり、データベースとアーカイヴの加速度的な整備に拠って、国文学研究は本質的に変質して行くのかもしれない。それでも、小さな壺の中で、孤独な営為としての文学研究に浸ってることが幸せであった時代への憧憬は捨てきれないのであるが……。

追補 悲しいかな素人にはデジカメ撮影のノウハウがなく、手控えとしては充分でも、そのままアーカイヴしたり整版して印刷する画像データとしての品位を求められると甚だ困る。その点、立命館アートリサーチセンターは多くの経験の蓄積を持っており、是非ともスキャニングとアーカイヴスに関する啓蒙的な活動もお願いしたい。


#「壺中の天 −デジタル環境下における国文学(研究手法)の孤独−」(講演レジュメ)
# 立命館大学GCOEセミナー 番外編 Vol.9(2008/12/18)
# Copyright (C) 2021 TAKAGI, Gen
# この文書を、フリーソフトウェア財団発行の GNUフリー文書利用許諾契約書ヴァー
# ジョン1.3(もしくはそれ以降)が定める条件の下で複製、頒布、あるいは改変する
# ことを許可する。変更不可部分、及び、表・裏表紙テキストは指定しない。この利
# 用許諾契約書の複製物は「GNU フリー文書利用許諾契約書」という章に含まれる。
#                      高木 元  tgen@fumikura.net
# Permission is granted to copy, distribute and/or modify this document under the terms of
# the GNU Free Documentation License, Version 1.3 or any later version published by the
# Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-
# Cover Texts.
# A copy of the license is included in the section entitled "GNU Free Documentation License".

Lists Page