「六万四千漢字」への批評、あるいは問いかけ

はしがき

 「六万四千漢字」発表会に至るまでの関係者の御尽力に心から敬意を表したいと思います。
 私たちは、鈴木一誌への来賓挨拶の招請を、「六万四千漢字」プロジェクトが外部の批判に対しても開かれた場を用意したものと考え、この小冊子を制作いたしました。基本的な様々な疑問をとりあえず集めることによって、さらなる知的対話実現の契機となったらと考えたからです。JISコード批判に端を発し、「漢字が足りない」という素朴なユーザーとしての不満から、「文化問題」化した日本文藝家協会とマスコミによる「漢字が危ない」あるいは「漢字を救え!」は、私たちに、文字とは何か、漢字とは何か、文字コードとは何か、といった問題にとどまらず、では、言葉とは、文章とは何なのか、テキストを、作品を、読みかつ書くとはどういうことなのか、それが印刷され、あるいはオンラインの画面上に流通して読まれるということはどういうことなのか、といった幅広く本質的な、歴史的でありしかも現在と未来に関わる問題について、改めて考える契機ともなりました。
 そこで今回の「六万四千漢字」発表会の鈴木一誌への来賓招請を機に、時間的には二か月足らずの短い時間でしたが、様々に多様な立場で、文字、漢字、言葉、テキスト……といったものと深くかかわりを持ち、日々、そうした文字、漢字、言葉、テキストを、それぞれの現場(組版、校正、編集、印刷、製版、文字デザイン、ブックデザイン、著作、研究)で読み書く職業と行為を続けている有志が集まり、研究活動を行いました。もとより、一つの統一的な見解を見い出すための集まりではありません。
 この小冊子は、有志によって提出された「六万四千漢字」への、批評、批判、あるいは「素朴な疑問」の、ささやかな第一歩と言えるでしょう。なにしろ、私たちには、まだ東大明朝=六万四千漢字の全貌を知るに至っていないからです。「東大明朝」=「六万四千漢字」が、いわばデジタルの漢字の現状を救うことを期待された権力として、あるいは文化=文字の多様性の名のもとに、「しかも、この権力が行使されるためには、すべてを可視的にするが、その場合自らを不可視的にするという条件付きでその性質をそなえた、永続的で、尽きざる、遍在的な監視を、その権力は自分に付与しなければならない。その監視は、全社会体を知覚の一分野に変形する、言わば顔を欠く視線のようでなければならない。」(M・フーコー『監獄の誕生』田村俶訳)ものとして宣伝されている、と考えるのは、私たちだけでしょうか。

井上明、太田温乃、金井久美子、金井美恵子、日下潤一、隈元斗乙、小池和夫、小宮山博史、柴田忠男、すが秀実、鈴木一誌、高野幸子、當山日出夫、豊島正之、直井靖、府川充男、太等信行、前田晃一、前田年昭、向井裕一、日本語の文字と組版を考える会

【連絡先】〒162-0822 東京都新宿区下宮比町2-18-1102 日本語の文字と組版を考える会 HCC00672@nifty.ne.jp
     〒162-0815 東京都新宿区筑土八幡町6-9 鈴木一誌 prospero@nn.iij4u.or.jp




「テクストは文字の集合」か?
〜「六万四千漢字」発表会来賓挨拶 〜 (30分版)

鈴木一誌 記
1998年6月10日現在



 四月のある日、蓮實重彦さんから電話があり、六月十七日に東大明朝の発表会があるから、そこで発言しなさいとのことでした。それには伏線がありまして、東大明朝が、情報処理学者、デザインや組版、書体設計者や印刷史の専門家のあいだで話題になっていますと、学長としてのではなく知人としての蓮實さんに、二か月ほど前に手紙で知らせておいたわけです。またそれは、日本文芸家協会の要望書やトロン・プロジェクトといっしょになった文化的に注目してもよいひとつの動きだ、ということもつけ加えておきました。少なくともJISコード批判という点では歩調をそろえています。新聞各紙が同じ論調で取りあげているのは、私には異様な風景と写りました。
 文字コード問題に関して、私よりはもっとふさわしい方がいると言いかけたら、蓮實さんから、いや一デザイナーの立場でよいと一蹴されまして、こうしてここに立っているわけです。
 蓮實さんの考えは、東大明朝「六万四千漢字」が悪いものであるはずはないけれども、内輪でほめあっていてもだめだから、外部での考えをきかせることができるならやってみなさいというものであると思います。
「六万四千漢字」の実物を全体として見た人は、いままで開発当事者をのぞいてひとりもいません。ですから、「六万四千漢字」についての批評は、断片的に発表されてきた資料に基づいています。『TRONWARE』号(一九九八年四月、パーソナルメディア株式会社)がわれわれが入手できる最新の資料ですので、特に断らない限りこの号からの引用ということでお話しします。
 この『TRONWARE』号のなかで、「文章を書くためのコンピュータ」と題されたシンポジウムが掲載されています。池澤夏樹さんが、インターネットで「『山海経(せんがいきょう)』のあそこのところ、なんだったっけ、ちょっと引きたい、だけど漢字が化けてしまう」という例を引いて、「慨嘆」しています。慨嘆する気持ちはよくわかります。では、その慨嘆をどう解決するか。話はここからはじまります。
 慨嘆の内容は人によってちがう、まずこれを確認しておきたい。『山海経』を、文学者が作品に引用したいのか、部下をもつ課長が明日の朝礼で枕に使いたいのか。読み上げるなら漢字が化けていても役に立つ。ただし読みがどのくらい同定されるのか。白文が読みたいのか、読み下しなのか。白文ならば、中国の字形でなければならず、明朝体がふさわしいかどうかも一概に決められない。その読み下し文がどの時代のだれの解釈なのかによっては、変体仮名が必要になってくる。刊本の異同を調べるのか、翻刻版の字形を調査したいのか、インターネットで『山海経』が参照しきれないという慨嘆は、多様性をおびている。テキストは、そこに実在しているのではなく、「幾通りにも読める可能性」(家辺勝文)として開かれているのだと思います。
 田村毅さんがお訳しになった『ドゥルーズの思想』の訳者あとがきで、田村さんはこうお書きになっています。

 語り手の語り口に耳を傾けるものにテキストは開かれるわけです。ユーザーの慨嘆はあるが、それは無数の内容としてある。ユーザーの慨嘆という無名のものがあるわけではないと思います。JISコードが何とかなれば解決する問題ではない。端的に言えば、需要と供給の問題でしょう。実際、『新潮文庫の100冊』というCD-ROMでは外字は出ています。
 それを解決するには、と考えたとたんに、その人はつくり手の立場に反転するのではないでしょうか。また、そうならないと解決策は生みだせないのではないか。ユーザーの立場のままで、慨嘆するだけで事態は解決できるのか、という問題が立ちます。何が表現できていないのか、何が理解からこぼれ落ちるのか、その吟味がなくて事態は解決できるのか。吉目木晴彦さんは講演でこう話されています。 「文字が出ないことに関していくら経緯や考え方を説明されても、結果として出ない文字は出ない、それが困るのです。」
 吉目木さんは、ユーザーの立場に徹しようとしています。東大明朝もまた、ユーザーの立場のままで事態を解決しようとしているようです。慨嘆の質を見極めないで、六万四千字という膨大な字形を集めて使用に供しようとしている。慨嘆の多様性を、六万四千字という膨大さのなかに取り込んでしまおうというわけですね。『TRONWARE』号に収録されているシンポジウムで、中沢けいさんが

と発言され、それを受けて坂村健さんが

と、おっしゃっているのは、大によってさまざまな多様性を包もうという発想と理解します。では、大は小を兼ねるのか。東大明朝に関しては、この命題は成立しないと思います。なぜなら、東大明朝の六万四千字には、体系性がないからです。東大明朝六万四千字に体系性がないというのは、非難でもなんでもなく、東大明朝を特徴づけるものです。田村さんは、「東京新聞」で、

と、発言されており、他の文章でもたびたび「漢字データ・ベースの構築」という言葉をお使いになっています(「漢字六万四千字のフォントセット公開に向けて」、パンフレット『豊かな文字文化を創りあげるために』所収、以下「漢字六万四千字」と略称)。いつでも使用可能な状態で待機している漢字字形の貯金箱、といったイメージで私は東大明朝をとらえます。六万四千字もあれば、だいたいの要望には応えられるだろうという姿勢です。吉目木さんは講演のなかでこうおっしゃっています。

 規範はいらないと言っています。その六万四千字ですが、パンフレットのなかであるいはネット上でも、田村さんは、

と、お書きになっています(「漢字六万四千字」)。坂村さんは、

と、おっしゃっています(『世界通信基盤としての多国語処理』)。おふたかたの発言を串刺しにして理解するなら、六万四千字はたまたまの数字にしかすぎない。理念としては、今日以降毎年五千字とか一万字とか増やしていくべきものでしょう。
 坂村さんの

という記述(『世界規模通信基盤としての他国語処理』)や、中沢さんの

との指摘(東京新聞、1998年1月28日)に沿えば、その文字セットはいつも未完成のままです。未完成であることに特徴がある。規準がないのだから、未完成という概念もない。いったいなん文字必要かとの問いに対して、吉目木さんは講演で、

と、話されていますが、日本近代印刷史研究家の府川充男さんの調査によれば、日本の印刷会社は1万字を越えない範囲でほとんどの仕事をしてきています(『ユリイカ』1998年5月号)。それでも確かに外字は出る可能性はある。出現しても一パーセントを下回る確率でしょうが、田村さんはネット上で、

と記されています。未来の外字のために無数の漢字が用意されなければならないことになります。未来のために現在が待機しているという構図があります。
 東大明朝とはなんなのだろう。東大明朝のめざす核心はなにか。田村さんは、先ほどのネット上の文章を、こう結んでいます。

 JISコードは、字体を指し示しているわけですから、東大明朝は、字体が足りないという点に批評の立場を置いていることになります。つまり、現在のJISコードの問題はコードの不足だと言っていることになります。
 概念としての具体的なかたちをもたない抽象的な文字を、一般的には「字体」とよんでいます。具体的な文字のかたちを、「書体ないしは書風をとおして実現された字形」と呼称してよいと思います。定義がゆれている側面もありますが、文字を考える際の補助線として字体と字形をこのように把握しておきます。
 さて、規準がないものにコードが振れるのか、これが私の疑問です。どんどん総数が増えていく宿命にある文字セットに、どうしたらコードが振れるのか。ここで東大明朝は明らかにぶれていると思います。
 田村さん自身、「漢字辞典」と言っている。「漢字辞典」である以上、それは作品・著作であり、六万四千字であることに主義主張がなければならない。六万四千字が膨大な数であるとしても、有限であるからには、田村さんがおっしゃる「精選」(「漢字六万四千字」)「析出」(東京大学総合研究博物館web「活字から電子文字へ」)の規準が求められる。小さな文字セットの集合は、大なる文字セットにはなりません。集合の規準と方針がちがうわけですから。六万四千字は、すべて一次資料から収集されなくてはならないはずです。現時点では、六万四千字であることの規準も一文字ずつが同定されるための典拠も示されていません。先ほど引いた吉目木さんの発言、「文字についての規範を求めているのではなく、あらゆる文が記述できる交換可能な符号化文字体系が欲しい」についても、規範がなくて体系がありうるのかと問いたいのです。
 坂村さんのように、

という立場もあります。ただこの坂村さんの発言を文字数についての発言として引用するのは少し酷なところもあって、これが語られている文脈では日本・中国・韓国の漢字をユニフィケーションしないと言っているのですが、坂村さん自身が「ユニフィケーションという文化破壊につながる問題」と著述されているのですから、あえてこう引用します。ユニフィケーション、つまりは包摂という概念を抜きにして「精選」「析出」ができるのか。東大明朝は、いわば田村発言と坂村発言のあいだでぶれている。ぶれてもかまわないのです。私は観客としてそのぶれを楽しんでいるのです。
 東大明朝は、漢字数の多さは誇れるが、一つの体系性をもった大きな文字セットではないのではないのか。明朝体という書体によってデザインされた字形の貯金箱ではないか、これが私の疑いです。「多い」ということと「大きい」ということはちがいます。
 吉目木さんが、つい最近の『一冊の本』という(1998年5月号、朝日新聞社)小冊子のなかでこうお書きになっています。

「文字処理の最小単位」とはなんだろうかなどと疑問がわく文章ですが、今は措いておきます。もうひとつ、文章を紹介します。東京大学総合研究博物館が発行した『歴史の文字』(1996年)という本で、坂村さんが「デジタルの世界」というタイトルでお書きになっているなかでこういう一節があります。

 このふたつの文章に共通しているのは、まず具体的なかたちをもたない抽象的な文字の集合としての文字がまずあり、あとで具体的な文字のかたちをあたえようという発想です。
 まず具体的なかたちをもたない抽象的な文字の集合としての文字がまずあり、あとで具体的な文字のかたちをあたえようという発想自体は、目新しくはないです。JISコードやユニコードなどがそうです。ただ、東大明朝が特異なところは、具体的な「書体ないしは書風をとおして実現された字形」を用意しようということでしょう。吉目木さんは、講演でこうもおっしゃっています。

 引用した発言は、ふたつの文章から成り立っています。はじめの「基本的には、コンピューターの文字表記があらかじめ番号を振られた固定的な字形データーを呼び出す方式をとっていることで発生している問題だと認識しています。」は、だからJISコードなど既存の文字コードにのりながら書体切り替えで対応しようとする、というように読めますが、二番目の「コンピューター間で文字を送受信する場合に字形データーそのものではなく、この文字番号をやりとりすることによって情報の交換を行っていることから生じる問題だと考えております。」というくだりは、文字番号をやりとりしたらいかんということですから、コードであることそのものへの過激な批判と理解できます。手書きの文字しか認めないと読めます。ユーザーの立場に徹すればこうなる可能性はあります。コードがだめという立場は、田村さんや坂村さんへの批判となっています。こうして、東大明朝は三者のあいだでぶれています。
 そのぶれを眺めながら、それでも三者に共通した過ちがあると感じます。それは、「テクストは文字の集合」という考え方です。「テクストは文字の集合」というスローガンは、パンフレット「漢字六万四千字」の見出しからの引用ですが、お三方とも、文字を一文字ずつ集めていけばテクストになるとお考えになっているようです。テクストという全体像めざして文字は集合するのです。それぞれのテクストにふさわしい文字集合があるはずです。紙をデジタルデータに置き換えるとすると、その段階で劣化します。目的意識を持って劣化させることがデータの書き換えなのではないでしょうか。
 テクストは、それが紙であれモニターであれ、具体的な形状であるかたちやたたずまいをともない読者の前に現われなければならないはずです。吉目木さんも、そこはよくおわかりになっていて、

と、講演されています。田村さんも、

という見解(「漢字六万四千字」)を示されています。作品が公開されるならば、その書体、組み方が、どんなに不本意であれ、「原著者が意図したとおりの最良のテクスト」(田村「漢字六万四千字」)なのだと思います。その具体的な作品のかたちを不本意にしないために、原著者はがんばるべきです。テクストは具体的なかたちをともなってしか読者の前に開かれません。だからこそ、読者は左ページのあの辺に感動した文章があったことを覚えているのではないでしょうか。ところが、田村さんも吉目木さんもわかっていながら、「テクストは文字の集合」というように転倒する。
 字体がまずあってそれに具体的な字形をあたえていくという発想は、無色透明な文字があるということを前提にしています。無色透明な文字の集合が無色透明なテキストだということになります。無色透明なテキストの集合が、無色透明なデジタル・アーカイブになるというわけです。田村さんがお書きになるテクストの三段階理論、写本の電子コピーである「第一のテクスト」、電子テクスト化された校訂版「第二のテクスト」、わかりやすく加工された「第三のテクスト」は、精度の差はあるがおたがいが透明性を媒介にして階層化されている点で、やはり転倒しているように感じます。
 しかし、われわれが作品に出会うとき、無色透明な文字に遭遇したのちに具体的な文字に行き当たっているわけではない。いきなり、「書体ないしは書風をとおして実現された字形」にぶちあたっているのです。いや、ひとつひとつの文字に出会っている暇もなく、一挙に作品に包まれている。文字がそこにあるという事態もない。一文字でも、文字がスクリーンやページにあるとき、何かの文脈をともなっている。無色透明なテキストが必要なときもある。たとえば検索のときですね。でも、検索という文脈において必要なのだし、ある時代のある文書では、たとえば大きいという漢字と太いという漢字が区別されていなかったともききます。「大」と「太」を区別することすら障害になる場合もある(星野聰「『続日本紀』の場合」『人文学と情報処理』第10号「文字コード 現状と未来」勉誠社、1992年)
 字体が文字の骨格ともいえる字形になってそれに肉付けがされて、はじめてわれわれの目に触れるという図式そのものがちがいます。字形は、書体ないしは書風をとおしてしか実現されないのです。それが、「書体ないしは書風をとおして実現された字形」といっている意味です。書風とは、書きぶりですね。文字は書かれ印字され印刷され描画されなければ存在しません。
「字形データーそのもの」は、なんらかの書体でなければならない。ということは、「字形データーそのもの」のやりとりは字形数かける明朝やゴシックや楷書やらの書体数になるから、とんでもない数になります。とんでもない漢字数を制御するために、坂村さんは「文字感」という概念を提唱されています。時代やパラダイムで文字セットを輪切りにしようという発想ですね。でも、「文字感」には、「書体感」が貼りついています。甲骨文字の時代に、明朝体による字形を持ちこむことはできない。結局は、文字は書体から離れられない。
「天」という字も、横棒2本の上と下のどちらが長いかは書体によるのだそうです。そうした事情を無視して、もともと明朝体にはなかった字形を文字セットに逆輸入してさらにそれに文字コードをあたえるというようにどこまでも転倒していく。発想の転倒は、やはり文字に確実に反映されます。
 字形には、さまざまな多様性があり、書風がありデザインがある。それらのちがいを乗り越えて、私たちは他の字ではなく「その字」だと理解する。現実にいろいろな字があるからこそ、それらを重ね合わせ、結果的におぼろげに浮かんでくる字のイメージが字体とよばれるものでしょう。確かに、私たちは言葉を聞くと、頭に文字のイメージを思い浮かべる。だが、最初に文字のイメージがあってそれを具体的な書体に当てはめたのでは決してない。私たちの文字のイメージ、イコール字体は、多くの具体的な文字の記憶の集合なのではないでしょうか。字体はあるのではなく、私たちひとりひとりの内部で生成する。だからこそ、文字がコミュニケーションのツールになりうるのではないですか。
 東大明朝の発想は、私たちの文字の実体とまったく逆立ちをしています。テクストを文字という要素に分解して発想するようになる。ここに転倒があります。ほんとうに「テクストは文字の集合」なのですか。われわれは文字をひとつずつ読んで、それを集合させてテクストを読んでいるのですか。
 それは開発の手順であって、文字のありようとは関係ないという反論があるとしたら、その論法は正しいでしょうか。ここで冒頭の、ユーザーの立場のままで慨嘆するだけで事態は解決できるのか、という問題にもどりました。文字の実体とまったく逆立ちをしている以上、それはユーザーの立場に立っているとはいえないと思います。結局、ユーザーの立場という無名性の背後に開発者の論理があるのです。
 多くの文字コードは、概念としての具体的なかたちをもたない抽象的な文字「字体」と具体的な文字のかたち「書体ないしは書風をとおして実現された字形」とはちがうという立場をとっています。抽象的な文字「字体」にしか責任を持たないということです。あとは、使用者の多様な解釈にまかせるということに他なりません。それがよいことか悪いことかは別にして、ある種の安全地帯に立っているわけです。ところが、東大明朝は、川上から川下までの文字の一貫した流れを制御しようとしています。川上が、字体で、字体が具現化するのが書体や字形だという発想です。東大明朝は、現実をコントロールしようとしている。具現するテクストが問題だから、文字を何とかしようというのが出発点です。「テクストは文字の集合」というスローガンはテクストという現実に影響を与えようという宣言です。「文化を救え」という文脈に立つなら、どのように救うのかという文化や歴史への解釈が要請され、すでに送り手の立場に立っています。
 東大明朝は現実に影響を与えようとしている。ところが、規律や規則によって、帝国主義的には現実に影響を与えたくないという気持ちがある。どこかで民主主義でありたいという気分がある。現実に影響を与えようとしているが、かたほうでは民主的でありたいというジレンマが、いろいろな局面に出てきている。複数の字形をなるべく多く集める。どの字形を選ぶかはユーザーに任せる、それが東大明朝の発想の原点だったと予想します。それが東大明朝の提案する民主主義です。すると、選択肢は多ければ多いほどよいわけだから「無限の」文字セットが理想となります。ところが、いざ実装となると、理念としての無限と現実としての有限かのあいだでゆれざるをえない。ユーザー主体なのか開発者主体なのか。この漢字の貯金箱は、体系性をもつのか、横並びのデータベースなのか。ユーザーの立場に立つなら、現実に直結したものにならざるをえないし、開発者の視点を入れるならばどこかで規範性をもたざるをえない。東大明朝、トロン・プロジェクト、日本文藝家協会の三者は、現実の前でほぼ分裂状態にあるとしか私には見えません。
 東大明朝「六万四千漢字」は、ひとつの作品だということが忘れ去られてはいないでしょうか。「テクストは文字の集合」だとする発想が、文字セットにも現われている。透明な文字の集合である文字セットも透明だと言っているように見える。透明な文字セットなのだから、典拠や規範から逃れられると言いたいようなのです。
 コードは、やさしく言えば、伝達におけるおたがいの約束事、ということだと思いますが、約束事は見えなくては困るのです。透明であることは、情報交換にとって決してよいことではないのです。一文字一文字は、どこかで彫られ書かれ使われた現実の痕跡でなければならない。実際の痕跡が記憶によって字になるのです。個別をとおして普遍性が獲得できるのです。透明であることはすなわち普遍的であるわけではありません。
 透明な文字セットというイメージが、東大明朝のコード表と言われているものを横並びの番号付けなのか符号化文字集合なのかをわからなくさせています。
 辞書・辞典はもちろん、あらゆる文字セットは、作品でありテクストです。テクストだから現実に影響を与えるのです。決して透明な文字の集合ではありません。少なくとも、透明であることを標榜する不透明で今ここにある漢字の集合なのです。規範を忌避したにせよ、規準を欠いた漢字の集合として現前しています。
 東大明朝が、いま現実にこうしてあります。文字は存在したとたん、共通性をめざします。文字はコミュニケーションの意志だからです。ビジネスの側面から考えれば、デファクト・スタンダード、標準化をめざします。標準化をめざすのに、公的か民主的かの区別はないと思います。文化的な水準では、作品としてすぐれているかどうかです。
 東大明朝は、コードとしての普遍性をめざしているのか、書体としての普遍性をめざしているのかは、今のところ分明ではありませんが、少なくともひとつの権力としてあります。それは、東大明朝に東京大学や学術振興会がタッチしているからではなくて、規準がない非公開なものとして見えていることによっています。規準の開示がないコードは権力です。だからこそ、文字の収集は権力の示威だったのです。体系性がないことは批評を封殺します。
 漢字フォントは六万四千字はないと商品化できないという暗黙の圧力が発生します。さらに、東大明朝で出ているのですから出してください、という外字作成の要望が印刷現場に増えることは容易に想像できます。太い明朝やゴシックはどうなるのでしょうか。東大明朝のおかげで外字が増えるという笑えない事態が起きます。
 東大明朝は、字形の規範としてひとり歩きしていきます。現実にいろいろな字があるからこそ、それらを重ね合わせ、結果的におぼろげに浮かんでくる字のイメージが字体とよばれます。ひとり歩きした字形の規範は、文字イメージが多くの文字のずれの集積だという私たちの現象を息苦しくします。出入り自由で規準の明示のない文字の収容は、一見、多様性の尊重に思えますが、現実の文字生成の多様性を殺すことになりかねません。民主的と思われる手続きが、民主制を圧迫する皮肉があります。スクリーンフォントで六万四千字の差が表現できるのかという疑問もあります。目の悪い人にその差異をどのように表記しアクセスしてもらうのか。六万四千字の半分以上はある読めない漢字を、「ノーマライゼーション」「バリアフリー」といった観点からどう表示するのか。
 JISコードが、コードであることによって批判されるなら、まったく別の場が必要だと思います。吉目木さんの講演から引きます。

 まさに多様性をどう捉えるかということです。多様性は具体的な個別性のなかに潜んでいます。多さイコール多様性ではありません。ちがいを強調しすぎることは、同じものをちがうものにしてしまう危険性があります。多いことによる弊害も考えるべきです。六万四千字あろうとも、さまざまな漢字を同じかちがうかという弁別をしていることにかわりはありません。「一度一緒にしちゃったらもう元にもどりませんからね」という事態は、「六万四千字」でもというか、現状の「六万四千字」だからこそ起きるのです。未来にはできるからといって現状が肯定されるわけではないのです。あらゆる書物をオリジナルな字形によって収容する「デジタル・アーカイブ」は、たかだか六万四千字では絶対に無理です。おそらく「多さ」の問題ではないのでしょう。
 コードは、ノイズを排除しながら伝達という目的を遂げようとします。ですが、ノイズを否定しているわけではないのです。コードがノイズという概念を生むのです。コードが、異体字や俗字、誤字を根のように生み出すのです。
 最後に、『われわれはどんな時代を生きているか』(1998年、講談社現代新書)という蓮實さんと山内昌之さんの共著ですが、その最終章でおふたりが対談しています。蓮實さんの発言を引いて終わりにしたいと思います。

 価値観がちがうコードががばらばらにあるのではなく、おだやかに共存することは技術的に可能なのではないのでしょうか。それは、シフトJISにのるのらないの話ではなく、文字集合の典拠と基準を公開することから対話は生まれます。まだ決して遅くありません。