コンピューターによる文学研究メモ―宮沢賢治『注文の多い料理店』の場合―
一 はじめに
コンピュータの普及により、電子データ(コンピュータで処理できるデータの意味で使用)を用いた新たな文学研究の方法が模索されている。その一方、最初に電子データがあり、ここからなにが明らかになるかと問いかけるのは、本末転倒であり、個々の作品のもつ固有の声に耳をかたむけた結果として、電子データの使用が有効かどうかを判断しなければならない、という声もある。正論である。が、個々の作品に即したとしても、従来の発想の中には、電子データという要素は含まれていないのであるから、ひとまず、最初に電子データありき、からはじめてみることも過渡的段階では必要ではないか。
本レポートは、私も参加した電子データをめぐる共同研究(1)において作成した宮沢賢治『注文の多い料理店』の電子データをもとに、そうした試みへにむけての簡単なメモである。
二 校訂の問題
『注文の多い料理店』を電子テキスト化する作業の大きな壁は、本文、およびよみをどう決定するかであった。ただし、これは、電子テキストだけの問題ではなく、活字での編集でも同じである。
単行本は複製本もあり、また複製で不明瞭なところは原本にあたることもできる環境にあれば、さほど問題はないように思える。だが、誤植が多いのが壁となる。例を二つほどあげる。
(例1)
ブラシを板の上に置くや否や、[そつ]がぼうつとかすんで無くなつて、風がどうつと室の中に入つてきました。(「注文の多い料理店」、[ ]記号引用者)
ここで「そつ」をどう考えるか。「注文の多い料理店」に草稿類は存在しないので、賢治の意図に沿って正しく改めることはできない。『新校本 宮沢賢治全集』は、「そいつ」として「い」の欠落とみているが、その根拠は不明。「それ」ではどうか。「つ」と「れ」では字形が違いすぎて活字を拾う際に間違う可能性は低いとか、語感が悪いとか否定的な意見が考えられるが、それでもあり得ないわけではない。
(例2)
「あなた、支那反物よろしいか。六神丸たいさんやすい。」(「山男の四月」)。
この支那人の会話文中の「支那反物」には、「しなたんもの」とふりがなが付されている。読み方に誤りはないので、このまま「しなたんもの」が賢治の意図を反映したふりがなとみてよいか。
「山男の四月」には草稿が残されており、初期形として『新校本 宮沢賢治全集』に収録されている。そこでは、すべて「支那たもの」となっている。引用した箇所に相当する初期形の部分は、「あなた、支那反ものよろしいか」とあり、「支那反」には、「しなた」とふりがながある。要するに「しなたもの」と読んでいるのである。「しなたんもの」とよむケースは、初期形には皆無であり、単行本所収のものは、引用箇所だけである。したがって、童話集の「しなたんもの」は誤植とみるのが妥当であろう。『宮沢賢治全集』(校本、新校本ともに)では、そのまま「しなたんもの」であるし、私たち共同研究の電子テキストでも「しなたんもの」としているのだが(2)。
誤植だけではない。名詞を抽出し、分類するという作業のさい、名詞の意味に複数の解釈がなりたつ場合がある。有名な「おなか」(「注文の多い料理店」)のように、意図的に二重の意味を持たせる場合は、それなりに処理のしようもあるが、次のような場合はどうだろうか。
(例3)
入口にはいつもの魚屋があつて、塩鮭のきたない俵だの、くしやくしやになつた鰯の[つら]だのが台にのり、軒には赤ぐろいゆで章魚が、五つつるしてありました。(「山男の四月」、[ ]記号引用者)
「つら」が問題である。この意味を私たちのデータでは「顔」としている。しかし、私は「連なり」という意味の「つら」の方が適切と考える。『広辞苑 第二版補訂版』では、「つらなること。ならぶこと。また、そのもの。」と説明がある。ここでは目刺のイメージであろう。ただし、このような意味の「つら」は他の童話では使用されていないようだ。一方顔という意味の「つら」は「サガレンと八月」「税務署長の冒険」「シグナルとシグナレス」などで使用されている。名詞の意味を決めるのも簡単ではないという一例である。
以上のことから述べたいのは、私たちの討議が不十分だったというのではなく(もしそういう印象が強いとすれば、共同研究という方法の問題である)、論者によって同一の結論にならない場合が大いにありうるという当然のことである。『注文の多い料理店』の場合、厳密にいうなら電子データ、印刷データをとわず、特定の生産者によって生産されたものであり、生産者のマークが刷り込まれている。私たちのマークのものもあれば、賢治全集というマークもあることを忘れるべきではない。
では、次に、いつくかの視点から電子データをながめてみよう。
三 電子データの考察
■ひらがなと漢字の計量
『注文の多い料理店』の作品と序文の、カタナカ、ひらがな、漢字を計量し、かな(カタカナとひらがな)と漢字の比率をもとめた結果は下の通りである。
作品名 | かな(%) | 漢字(%) | 各字数(かな/漢字) |
@序 | 90.4 | 9.6 | (481/51) |
Aどんぐりと山猫 |
85.8 |
14.2 | (4799/792) |
B狼森と笊森、盗森 |
78.8 |
21.2 | (3920/1054) |
C注文の多い料理店 |
81.2 |
18.8 | (3882/900) |
D烏の北斗七星 |
75.6 |
24.4 | (3264/1055) |
E水仙月の四日 |
80.2 |
19.8 | (4118/1014) |
F山男の四月 |
83.6 |
16.4 | (4226/831) |
Gかしはばやしの夜 |
84.1 |
15.9 | (5735/1081) |
H月夜のでんしんばしら |
84.5 |
15.5 | (3304/607) |
I鹿踊りのはじまり |
82.4 |
17.6 | (4373/933) |
これでみると、「序」がもっともかなの割合が高い。おそらく子ども読者に語りかけるスタイルをとっているからであろう。他の作品は、直接子ども読者へ語りかけるスタイルをとっていない。具体的にいえば、「序」は、「あなたのためになるところもあるでせうし」と語りかけているが、作品は、語りであっても語りかけではなく、たとえば、「巨きな巖が、ある日、威張つてこのおはなしをわたくしに聞かせました。」(「狼森と笊森、盗森」)とあるばかりで、「わたくし」は、誰にむかってその話を聞かせているのかははっきりしない。
童話集を出す時点での序文は、明らかに子ども読者を意識している。しかし、作品の執筆段階では、「一つの文学としての形式」は意識したかもしれないが、具体的に、「少年少女期の終り頃から、アドレッセンス中葉に対する」読者というものをどれほど考えていたものか。童話が大人のための文学形式の一つと意識されていた時代でもあったことを考え合わせる視点も必要だろう。
作品の中でもっとも漢字が多く使用されているのは、「烏の北斗七星」である。軍隊という堅苦しい世界を描くことと漢字の多用は相関すると説明してよいだろうか。一見悪くない解釈のようだが、二番目に多用される「狼森と笊森、盗森」を同様の理由で説明することは難しい。二作品をひとつの解釈で説明する必要はなく、「狼森と笊森、盗森」には、〈堅苦しさ〉ではない別の理由があるとする考えもあるかもしれない。しかしそのような考え方では、どのような現象でも恣意的に解釈できてしまう。従って、ここでは、「烏の北斗七星」における漢字の多用と作品との接点を堅苦しさに見出すことは困難だと判断すべきであろう。
■地の文の長さ
文長の測定方法はいろいろあるだろうが、ここでは文の長さを地の文で計量したい。その理由は、会話文は登場人物の性格などに合わせてどういう喋り方をするかなど、作者の意識的操作が地の文よりも入り易いと思われるので不適切。一方地の文は、そうした意識的操作が会話文よりも少ないと考えられる。すなわち意識的操作が少ない分、作家の特徴が把握できるだろうという仮定に基づいている。
ここで地の文というのは、原則として、「 」(かぎかっこ)で示された会話文、およびそうした会話文を含む文、以外の文である。ただし、( )で示された独白、歌の部分、葉書の文面、扉の文言、「 」で示されたオノマトペ、のようなものも対象外にする。一文は文頭から句点までとして、計量結果を次に示す。
作品 |
行数 |
字数 |
平均文長 |
標準偏差 |
@序 |
10 |
573 |
57.3 |
20.71 |
Aどんぐりと山猫 |
98 |
3487 |
35.6 |
19.08 |
B狼森と笊森、盗森 |
113 |
3873 |
34.3 |
19.52 |
C注文の多い料理店 |
68 |
2245 |
33.0 |
18.31 |
D烏の北斗七星 |
98 |
3645 |
37.2 |
23.66 |
E水仙月の四日 |
105 |
3985 |
38.0 |
20.70 |
F山男の四月 |
69 |
2948 |
42.7 |
23.74 |
Gかしはばやしの夜 |
89 |
3038 |
34.1 |
19.33 |
H月夜のでんしんばしら |
62 |
2366 |
38.2 |
17.58 |
I鹿踊りのはじまり |
95 |
4325 |
45.5 |
25.24 |
※字数には句点、読点等の記号類を含む
平均文長の最小は33.0字で最大は「序文」の57.3字である。「序文」は偏差をみるとわかるように、一文が長いにもかかわらず、ばらつきは少ない。長短の地の文が混在するのではなく似たような長さの文が多いのである。これは、文数がすくないことが関係しているからと思われる。
作品での平均文長の最大は、「鹿踊りのはじまり」の45.5字である。この作品には短い会話文が多い。例えば、
「おう、煮だ団子だぢよ。」
「おう、まん円けぢよ。」
「おう、はんぐはぐ。」
「おう、すつこんすつこ。」
「おう、けつこ。」
というような箇所がいくつかある。このため、地の文を長くし、全体のバランスをとるというようなことがあったのかもしれない。数字からみると結果的にはそう意味付けてみることも不可能ではない。
■会話文と地の文の比率
会話文の文字数(「 」で囲まれた部分のみで、「 」を含む文は地の文は含まない。記号類を含む)を計量し、先ほどの地の文の字数との比率を調べてみると、次のようになる。
作品名 | 地の文(%) | 会話文(%) | 各字数(地の文/会話文) |
@どんぐりと山猫 | 60.2 | 39.8 | (3487/2309) |
A狼森と笊森、盗森 | 77.5 | 22.5 | (3873/1126) |
B注文の多い料理店 | 45.3 | 54.7 | (2245/2713) |
C烏の北斗七星 | 78.1 | 21.9 | (3645/1023) |
D水仙月の四日 | 70.9 | 29.1 | (3985/1639) |
E山男の四月 | 55.7 | 44.3 | (2948/2345) |
Fかしはばやしの夜 | 45.3 | 54.7 | (3038/3663) |
G月夜のでんしんばしら | 61.5 | 38.5 | (2366/1480) |
H鹿踊りのはじまり | 75.2 | 24.8 | (4325/1430) |
会話文の比率の最も高いのは「注文の多い料理店」である。『注文の多い料理店』の中では、「どんぐりと山猫」と並んで最もよく読まれている作品であるが、内容以外にその理由を考えてみるなら、会話文の多用による読みやすさをあげられるかもしれない。ただし、さほど読まれていない「かしはばやしの夜」も会話文の比率が高い。これは、歌を会話文に含めたためである。
会話文が少ないのは、「烏の北斗七星」「狼森と笊森、盗森」「鹿踊りのはじまり」である。後者の二作品は、神話的世界を描いていることとの関係をみることもできるかもしれない。世界の構造を示そうとする観念性が優先したため、特定の具体的主人公の言動は描かれにくく、その結果会話文が少なくなった可能性も否定できない。
■読点をめぐって
読点の使い方は作家によって極めて安定しているという説がある。賢治の場合はどうだろうか。先述のように、会話文よりも作家の無意識が表れやすいと思われる地の文を対象に、読点に焦点をあわせてみたい。
まず、読点から読点まで(文頭から読点、読点から句点までも同様にあつかう、以下この部分を便宜的に「読点文節」という)の長さをみる。読点が三つあった場合、読点文節は四つあることになる。
文長には句読点を含まない。それぞれ一文づつの計量したものを平均した。
作品名 | 文長平均 | 読点数平均 | 読点文節平均 |
@序 | 53.1 | 3.2 | 13.2 |
Aどんぐりと山猫 | 32.8 | 1.8 | 12.7 |
B狼森と笊森、盗森 | 31.8 | 1.5 | 13.3 |
C注文の多い料理店 | 30.7 | 1.3 | 14.6 |
D烏の北斗七星 | 34.8 | 1.4 | 15.7 |
E水仙月の四日 | 35.5 | 1.5 | 16.3 |
F山男の四月 | 40.1 | 1.6 | 16.4 |
Gかしはばやしの夜 | 32.2 | 1.0 | 17.8 |
H月夜のでんしんばしら | 36.0 | 1.2 | 17.2 |
I鹿踊りのはじまり | 42.9 | 1.6 | 17.7 |
読点の数は、「序」が他にくらべて多い。一文が長いからであろう。
読点文節の長さは12.7字から17.8字までバラツキがみられる。長い作品には歌が組込まれる傾向があり、特に17字以上の二作品には歌が含まれる。文章のリズムと歌のリズムとが何か関係しているのかもしれない。
読点文節の長さは、地の文に関する限りそれほど安定しているとはいいがたい。したがって、たとえば執筆年代の推定する方法としては有効ではないだろう。
ただし興味深い現象があることも述べておく。それは、「山男の四月」の草稿(一部欠落有、全集では「初期形」)と童話集の地の文を比較すると、読点文節の長さが異なるのである。条件をそろえるために童話集の方から草稿の欠落部分に相当する部分を削除して計量すると次のようになる。
| 文数 | 文長平均 | 読点数平均 | 読点文節平均 |
草 稿 | 53 | 32.4 | 2.1 | 11.7 |
童話集収録 | 57 | 40.9 | 1.7 | 16.1 |
草稿よりも童話集収録の方が、地の文は長く、しかし読点は少なくなり、その結果読点文節の平均の長さが増加する。この変化が執筆時期に関係するのか、推敲過程の問題なのか、それとも「山男の四月」に偶然生じた変化なのか、これだけでは、いずれとも決めがたいのは残念である。
次に、読点数、読点文節数の標準偏差を示す。
作品名 | 読点数 | 読点文節 |
@序 | 1.78 | 2.05 |
Aどんぐりと山猫 | 1.63 | 4.74 |
B狼森と笊森、盗森 | 1.44 | 4.53 |
C注文の多い料理店 | 1.38 | 6.72 |
D烏の北斗七星 | 1.52 | 5.82 |
E水仙月の四日 | 1.49 | 6.81 |
F山男の四月 | 1.44 | 6.14 |
Gかしはばやしの夜 | 1.17 | 6.27 |
H月夜のでんしんばしら | 1.04 | 4.90 |
I鹿踊りのはじまり | 1.56 | 5.97 |
読点文節の長さで、「序」が一番バラツキが少ない(標準偏差が最小)のは、最も短い文章だからと思われる。これでみるかぎり、読点文節の長さのちらばりはあまりない、といってもいいようだ。
参考までに他の作家の場合を見てみよう。新美南吉「手袋を買ひに」(3)は次のようになる。
読点数 | 平均=1.6 | 標準偏差=1.52 |
読点文節 | 平均=14.8 | 標準偏差=5.99 |
とくに、賢治の場合が特徴的というわけではなさそうである。
読点の定量的分析の一例は以上のとおりだが、どういう意味合いを持たせて読点を使用するか、またその計量的考察という、定性的計量は、検討の必要があることを述べておく。
■名詞
各作品の名詞のうち、10回以上出現したものをあげてみよう。名詞の下の数字は出現回数である。
@「序」なし
A「どんぐりと山猫」 |
B「狼森と笊森、盗森」 |
C「注文の多い料理店」 |
D「烏の北斗七星」 |
一郎 |
41 |
みんな |
50 |
二人 |
25 |
烏 |
39 |
どんぐり |
22 |
森 |
36 |
扉 |
20 |
大尉 |
29 |
馬車 |
18 |
方 |
14 |
ぼく |
17 |
大監督 |
11 |
別当 |
15 |
栗 |
13 |
中 |
14 |
雪 |
11 |
やまねこ |
15 |
|
|
こと |
10 |
山鳥 |
11 |
山ねこ |
14 |
|
|
ここ |
10 |
|
|
木 |
13 |
|
|
|
|
|
|
山猫 |
13 |
|
|
|
|
|
|
E「水仙月の四日」 |
|
F「山男の四月」 |
|
G「かしはばやしの夜」 |
|
H「月夜のでんしんばしら」 |
|
雪童子 |
34 |
山男 |
39 |
木 |
34 |
恭一 |
18 |
雪 |
28 |
支那人 |
25 |
清作 |
34 |
でんしんばしら |
16 |
方 |
16 |
おれ |
16 |
画かき |
30 |
ぢいさん |
15 |
風 |
16 |
陳 |
14 |
柏 |
25 |
みんな |
10 |
雪狼 |
11 |
丸薬 |
10 |
みんな |
16 |
|
|
雪婆んご |
10 |
みんな |
10 |
林 |
14 |
|
|
|
|
|
|
メタル |
12 |
|
|
|
|
|
|
うた |
12 |
|
|
|
|
|
|
月 |
11 |
|
|
|
|
|
|
方 |
10 |
|
|
I「鹿踊りのはじまり」 |
鹿 |
46 |
嘉十 |
26 |
みんな |
18 |
手拭 |
17 |
すすき |
13 |
それ |
10 |
通常重要な語は繰り返し出現する。キーワードとなる名詞は、もっとも頻出する名詞と重なる場合が多い。また、小説(童話)におけるキーワードは作品名に含まれる場合が多い。題名に示された語は、一般的に作品中に多くあらわれる。その一方、作品全体を収斂させる題名として、作品に現われない、あるいは現われてもまれな語が使用される場合もある。『注文の多い料理店』の場合は、どのように題名はつけられているのか。
「注文の多い料理店」「水仙月の四日」以外は、作品名に含まれる語は、作品の頻出語に重なる。「鹿踊りのはじまり」は、鹿そのものは題名にないが、「鹿踊り」として、鹿が含まれている。こう考えてみると、具体的には登場人物が題名になり、しかも作品中に頻出することがわかる。登場人物が頻出語になるのは当然といえるが、そのうち誰を題名に含むかに作品の意図をうかがえるだろう。
「どんぐりと山猫」では、「一郎」が最頻出語であるが、題名には含まれない。「月夜のでんしんばしら」の「恭一」や、「鹿踊りのはじまり」の嘉十も同様である。
題名は、作品の中心は向う側の世界にあるという道標になっているかのようである。道標に導かれて山猫やかしわ大王のいる不思議な世界へ赴くのは、こちら側の住人であり、読者には案内人の役割を果たしている。あちこちに案内人の名前を散りばめることにより読者を、案内人ともども向う側の世界へ誘う。
「烏の北斗七星」「山男の四月」などは、主人公がそのまま烏や山男であるから、当然出現する回数も多くなる。読者は、いきなり向う側の世界の住人の立場にたってしまい、向う側の世界にもこちら側の世界と同質の〈思念〉を発見する。読者には、「戦ふものゝ内的感情」や「一つの小さなこゝろの種子」(広告ちらし)という〈思念〉は表面上の世界の違いを越えて、普遍性をもって存在すると了解されるのではないか。
「注文の多い料理店」や「水仙月の四日」は、物語世界を統合するようにつけられた題名であるが、題名の語句がそのまま作品中にあらわれるのは、前者が一回、後者が五回である。「水仙月の四日」が五回も繰り返されるのは、特別な日であることの強調であり、異常な天候を正当化するための方法だからであろう。
童話集全体をとおしてもっとも多い名詞は何であろうか。童話集での出現率の上位10位までを多い順に並べると次のようになる。
名詞 |
出現数 |
名詞 |
出現数 |
みんな |
126 |
風 |
44 |
方 |
74 |
こと |
42 |
木 |
66 |
雪 |
41 |
それ |
53 |
声 |
41 |
鹿 |
47 |
一郎 |
41 |
おれ |
45 |
森 |
40 |
「みんな」が最も多い。二番目と比べても圧倒的に多い。「みんな」は、童話集の性格を示す指標のひとつと考えてもよいと思われる。万人の幸福を本気で願った作家は、個人と個人の差異や個人の内面などというものに拘泥しないようである。個をきわめつくすことで世界に繋がるという近代文学の方向をとらず、いきなり「みんな」ととらえる。世界全体が幸福にならないうちは個人の幸福はないという転倒した論理は、童話集においても貫かれている。
「みんな」のことを考えるのに、個人という入口を考えない文学とは何か。賢治にとって、それは童話であった、というのは乱暴であろうか。「みんな」が頻出することと、童話の形式をとっていることとは無関係ではないと思われる。いまここでいう童話とは、ファンタジーなどと同じ、文学の一形式の名称であり、子どものための、というニュアンスは含まない。
「どんぐりと山猫」は「必ず比較をされなけれはならないいまの学童たちの内奥からの反響」(広告ちらし)だという。「反響」は誰が聞くのか。「反響」というからには、明確な伝達を意図していないことになるが、童話集に収録する以上聞き手がいないはずはない。「反響」を聞いて、「学童」たちの現状を打破してくれるのが、暗黙のうちに想定されている聞き手のように感じられる。
四 最後に
本レポートをみれば一目瞭然のことながら、電子データだけで『注文の多い料理店』を論じることは甚だ難しい。その理由のひとつは、計量的統計的手法では、比較が有効な方法であるが、他の作家との比較がデータ不足でできなかったことにある。しかしここでのこころみもまったく無意味というのでもなく、いくつかのヒントはあったのではないか。電子データは、研究への視点の提供という点で有効性をもつ、というのが本レポートの結論である。(一九九九年九月二三日)
注
1 大阪国際児童文学館における共同研究「パーソナルコンピュータを使用した児童文学作品分析支援システムの開発」。メンバーは、上田信道・遠藤純・大藤幹夫・向川幹雄(五〇音順)
2 本文は、http://nob.internet.ne.jp にて公開(一九九九年九月一六日確認)。
3 http://nob.internet.ne.jpよりダウンロード(一九九九年三月一六日)、底本は『校定新美南吉全集』
(掲載=「ビランジ」5号、1999.12.20)
戻る