常用漢字のための頻度調査の偏り

今日は妻がチキン南蛮を作ってくれた。おいしい。それはともかく。

朝日新聞のサイトを見ていたら、次のような記事を見つけた。執筆者は朝日新聞東京校閲センターの福田亮氏。

 今回も新しい常用漢字表の話です。26日に文化審議会の国語分科会漢字小委員会が開催されました。27日付社会面で報じたとおり、12日の1次素案からは特に進展はありませんでした。
 26日の席上でも少し話題になったのですが、今回は字種選定の基盤になっている漢字の頻度調査の問題点について考えてみます。というのは、候補漢字の選定手順が決まっていて、この頻度調査が大変重視されているからです。
 今回の審議のために文化庁国語課は、三冊の頻度調査資料を作りました。タイトルはいずれも「漢字出現頻度数調査」。ピンクの表紙の「調査(3)」、緑の表紙の「調査(新聞)」、青の表紙の「調査(ウェブサイト)」です。
 「調査(3)」は、2000年に国語審議会(当時)が答申した「表外漢字字体表」審議の際に作った二冊の頻度調査に続くもので、凸版印刷の書籍・雑誌の組み版データから漢字の出現頻度を調べたものです。
 「新聞」は、朝日と読売の2006年10・11月紙面に現れた漢字の頻度調査結果です。これには我々も協力しています。「ウェブサイト」は、「フレッシュアイ」というポータルサイトの協力で作成したものです。
 現在漢字小委では、これらの調査結果を「調査(3)」の頻度順を軸にした一覧資料にして検討しています。少し古いバージョンですが、実物はこのような表です(71ページあるので4MB近いサイズです)。
 初めに書いた基幹資料の「調査(3)」の問題点とは、最も比率の高い単行本データに偏りがあると感じられることです。
 凡例によると「辞典・古典類」(総文字数約2210万字)、「単行本」(同8818万字)、週刊誌(同2347万字)、月刊誌(同3297万字)、教科書(同329万字)という調査母数になっています。一番比率の高い単行本は7社発行の540冊が対象です。
 7社のうち朝日新聞社発行の単行本を例にとると、46冊中43冊を司馬遼太郎街道をゆく」が占めています。司馬作品はざっと見ただけでほかにも「故郷忘じがたく候」 、「功名が辻」4巻、「義経」2巻(いずれも文芸春秋刊)があるので、これだけで53冊、全体の9.8%を占めます。
 540冊の発行元は朝日のほか、多い順に文春(204冊)、集英社(115冊)、廣済堂出版(111冊)、新潮社(30冊)、講談社(26冊)、小学館(8冊)です。
 大手が多い中で目を引くのが廣済堂出版です。2006年の新刊書発行点数が140冊ほどの規模の会社で、娯楽小説の文庫や新書を多く発行しています。
 111冊のうち、同社ホームページである程度内容を確認できた101冊の内訳は、時代・歴史小説49冊、大人向けのいわゆる官能小説24冊、ミステリー・実用書など28冊でした。
 この出版社の本からは同一作者の作品が複数入っているのも目立ちます。安藤仁9冊、木谷恭介8冊、稲葉稔7冊、末廣圭、喜安幸夫各6冊などです。
 なぜこのように偏りがあると思われる書籍の選択になったのか。
 「凸版印刷の持つ組み版データの中から提供してもらえるものをなるべく多く調べた結果」(文化庁国語課)ということでした。偏りについては「週刊誌、月刊誌などのデータと合わせることで解消されると考えた」としています。
 しかし常用漢字表が対象としているのは「法令・公用文書・新聞・雑誌・放送など」であって「専門分野や個々人の漢字使用にまで立ち入ろうとするものではな」いのですから、特定作家の漢字使用を反映した頻度データを根拠に候補字種を決めてよいのか疑問が残ります。
 国語課が作った過去の頻度データでも偏りが指摘されたことがあります。「漢字出現頻度数調査」(1997年)のうち「県別百科事典」データの割合が大きかったため、特定の地名に使われる字の頻度が高くなりました。
 そのため「調査(2)」(2000年)は、収録する書籍の分野のバランスを考慮したと凡例にあります。このときは出版社28社の256冊が対象でした。朝日新聞社発行の35冊のうち「街道をゆく」は2冊で、全体に今回調査ほどの偏りは感じられません。
 書籍や新聞や雑誌の発行部数の比率などを反映し、社会全体で使われている漢字の縮図になるようなサンプルを集めて頻度を調べることが出来れば、議論の信頼性も上がるのではないでしょうか。

まさにその通りで、あまりにも少なく、また、偏ったサンプルから常用漢字の補正を行おうとしていることにびっくりした。その気になれば、もっと幅広い範囲での文字使用を調査できるはず。以前書いた「丞」の高順位は、ひょっとすると司馬作品によく出てくる名前だからなのかもしれない。
学術書は対象に含まれていないのだろうか?常用漢字の中で、凸や凹の頻度が低いのが気になったが、数学や、経済学の書籍を含めていたら、こんなに頻度が低くなることはないはず。関数などでいくらでも出てくるからだ。

日本『島旅』紀行

タイトル通り、さまざまな島への旅行記だが、屋久島や奄美といったメジャーな島だけではなく、寒風沢島、櫃島、蓋井島など相当マイナーな島も含まれていておもしろい。カッパドキアのような縦長のカルストの見られる神島(鳥羽市)や、まるでエーゲ海のような風景の保戸島津久見市)など、行ってみたいなあ。定期航路のない島もあります。
日本《島旅》紀行 (光文社新書)

プライバシーがなくなる日

日弁連の編集した、住基ネット反対のための書。既に5年前の本なので多少古くなっているところもあるが、資料としてはまだ役に立つ(500ページを超える本だが、後半は条文などの資料編だ)。住基ネットの業者に正面から取材を申し込んで、警戒され、あっさりと断られているところは笑えるが、いや、よく考えてみたら、笑ったらいけないな。
プライバシーがなくなる日