WSDの詳細

はじめに

「ワードサーチ英語検索辞典」 (WSD) は、リスニング環境において、耳で聞いた音声から、未知の英単語を検索発見するための辞典です。
本辞典では、リスニングから目的の英単語を効率的に検索するための、さまざまな工夫がなされています。

リスニングにおいて、耳で聞いた英語の音声の中に、未知の単語らしいものがあった場合に、その単語を知ることは、一般に簡単ではありません。

英単語は、記述上、綴りによって他の単語と区別されます。したがって、英和辞典など、通常の辞書類は、スペリングにしたがって構成されています。ところが、英語の場合、音から綴りを知ることは、しばしば簡単ではないのです。

正確に聞き取ることの難しさ

第一に、よく言われることですが、日本人にとっては、英語における音の区別を瞬時に正確に行うことはなかなか難しいことがあります。

よく言われる “r” と “l” の違い、”b” と “v” のようなもののほか、”s” “sh” “th” の違いや、母音の違いなどは、綴りに決定的な影響を持つにもかかわらず、我々にはしばしば聞き分けが曖昧になりがちです。そもそも、実際の発話環境では、発音する側が、教科書的な発音ではないことも多く、聞き取りはさらに曖昧になります。

既知の単語の場合は、前後関係から推定して埋めることもできますが、知らない単語で、しかも意味的なキーワードとなるような場合は、調べなければわかりません。

音の認識が曖昧な中で、音から綴りを再構成することは、なかなか難しいことが多々あります。

発音とスペリングの関係の複雑さ

第二に、英語という言語は、綴りと発音との関係が最も錯雑とした言語のひとつといわれます。綴りと発音との間に何の法則性もない、とは言わないまでも、「綴りを知っていることは、その発音を確信を持って予測することをなんら可能にしない」(Longman Pronunciation Dictionary 2008) といわれるほどです。

ここでいくつかの例を挙げると、

読まない文字が(とくに冒頭に)含まれるもの : knit, wrest, psalm, gnash など

綴りから想定できない変則的な発音 : bury, plaid, worsted など

同じ母音を作り出す膨大な綴りの組み合わせ : blew, blue, food, fruit, prove, rheumatic, shoe, soup, truth, two など、すべて /u:/ の母音を含む

などが問題になります。

上二つは、数は比較的に限られますが、その綴りを思いつくことが困難です。

さらに問題は、母音と綴りの組み合わせで、これがそれぞれの母音について、多種多様なのです。これは膨大にあります。

これらの可能性を考えると、たとえ正しく発音を認識していても、その単語の正しいスペリングを直ちに再構成できるとは限らず、むしろ、あてずっぽうにいくつか調べることにならざるを得ません。
例えば、「抜け目のない」をあらわす 「シュルード」があったとき、一発で、 shrewd を再構成できたかどうかは、運任せになります。

実際には、発音そのものの認識に曖昧さが加わりますから、さらにありうるスペリングが増えてしまいます。

まとめ:発音から綴りを再構成することは一般に困難

これらの困難から、発音からスペリングを再構成して英和辞典で調べる、というのは、非常に手間のかかり、しかも成功率の低い作業となります。これは、時間を浪費し、ストレスのかかる作業でもあるので、調べようという意欲そのものも阻害します。

他の方策について

そこで、他の方策を探しますと、電子媒体環境を利用した、スペルチェックと、音声認識、そして、本辞典の方式、が考えられます。

スペルチェック

スペルチェックは、誤った綴りの入力があった場合に、正しい単語の候補を示す、という校正システムの応用といえます。
これでうまくいく場合も多々ありますが、うまくいかないパターンもいろいろあるようです。r と l の違いにかなりクリティカルに反応することや、一覧性に乏しいこと、そしてとくに問題なのは、「偽りのジャストミート」が生じることです。打ち込んだスペルが、同音・類音の別の単語の正しいスペルになってしまっていることで、別の単語なのに、検索としては成功とみなされて終わってしまう現象です。

スペルチェックエンジンの設計次第ともいえますが、総じて言えば、音的・綴り的に孤立した単語は拾われやすく、紛らわしい綴りや発音の単語が多数ある場合は使いにくい、といえると思います。
個人的には、一覧性の乏しさは、かなり利便性を損ないます。

音声入力

耳から聞こえたとおりしゃべってみて、それで辞書の側が要領よく反応してくれれば一番早いかもしれません。しかし、現状では、曖昧な音を単独で発音して、電子辞書の側が正しく認識できるかは、いささか心もとないと思います。
また、音を出せない状況や、音に出すことに憚りがある場合はつかえません(要するに恥ずかしいということ)。

私の手元にある端末に関する限り、スペルチェックも音声認識も単語の検索には十分実用的とはいいがたい状況です。

本辞典の方式

そこで、本辞典の方式が登場します。技術的には素朴でコンベンショナルなものに見えますが、実用性はかなり高いと思います。

WSDの方式

検索用の見出しとして、カタカナを採用します。ユーザーは、聞き取った曖昧な音声認識を、素朴かつ大胆に、カナに変換し、本辞典で検索します。

検索用カナ見出しで、例えば「シュルード」を見つければ、直ちに、shrewd とその正確な発音、簡潔な語義説明を得ることができます。この単語が、聞き取った音と、語義と文脈に整合性からこれだと確信できれば、これが知りたかった単語であった、ということになります。

カナ見出しは、検索用の見出し(インデックス)であり、英単語の発音をもとにしつつも、検索の便宜のため、かなりモディファイされています。r と l の区別はもちろん、b と v の区別も意図的に捨象されています。

本辞典では、同音語・(日本人的意味での)類音語は、同じカナで並んで表示されることになります。そして、紛らわしい音の単語があっても、正確な発音や、さらに語義(意味・品詞)まで一覧比較することで、文脈に即して同定することができます。この一覧性の高さが、本辞典のひとつのウリとなります。

カナ検索でジャストミートすれば、かなりの快感を得ることができます。

この検索方法は、耳で聞いた音からダイレクトに検索しているので、印象度が高く、スペルを経由した検索に比べ、調べた結果(音と意味の結びつき)が記憶される効果が大きいと感じます。

カナ見出しの辞書について

カナを見出しに立てた辞書(英和辞典)じたいは、他に例がないほど珍しいものではありません。

しかし、他の辞書は、「英語初心者のための辞書」というコンセプトが強く、本辞典のような、「耳から聞いた音から英単語を検索発見する」という明確な編集意図を持っているわけではありません。
そのため、カナ見出しの選択・収録において、曖昧さへの対応・配慮が無いか非常に乏しく、項目の配列も通常の辞書と同様で、一覧性という点でも複数の候補を比較対照しにくい構成です。また私の知る限り発音記号を収録しているものはなく、これは、カナを見出しに立てる「辞典」としては大きな問題点です。

WSDにおけるカナ見出しの立て方

本辞典では、カナ見出しのカナは、当該英単語の発音に沿いつつも、識別性を高めるため、明快で音の省略の少ない、その意味でカタカナ語に近い表示となっています。

カナ見出しは、検索用のインデックスですから、ユーザーがこの単語を聞いたとき、どういうカナに変換するかを考えて、いろいろな可能性(ゆれ)の中から、編集者の判断で選択収録することになります。

ひとつの単語について、いろいろなカナの可能性(候補)があります。例えば、top は、素朴なほうから、「トップ」「タップ」「トプ」「タプ」「タープ」くらいが考えられます。さらに、「プ」を省略するとより英語っぽく響くかもしれません。

本辞典では、明快で音の省略の少ない、いわば素朴なカナを優先的に採用し、よりリアルな(英語らしく響く)カナは、必要に応じ適宜収録、という形をとっています。カナを見出しにする以上、そのカナが英語らしく響くかどうかよりも、検索に便利かどうかが重要だということです。一部の例外を除き、まず識別性の高い明快な表記で一貫させることが検索効率を高めるとの考えです。
そのようなカナは、いわゆるカタカナ語に近くなりますが、インデックスとしてのカナは、英単語の発音を反映していますので、カタカナ語(日本語)とは必ずしも一致しません。

英音と米音は、当然両方に対応するカナを用意します。

本辞典(第3版)では、top については「トップ」「タップ」「タープ」が収録されています。収録が多すぎると冗長になってかえって検索効率が損なわれるので、そのあたりは「さじ加減」となります。

このあたりの工夫(配慮)は、他のカナ英和の類にはない、本辞典独自の創意と考えます。

現時点でも完全な見出しになっていないと思います。使いやすいカナ見出しはどうすべきかは、これからも課題となり続けるでしょう。

WSDの内容抜粋

本辞典の抜粋(本文880ページ)を以下に示します。同音語・類音語が一覧比較できることがお分かりいただけると思います。

なお、原稿をJPG化しているため、印刷よりも若干画質が落ちていることをご了承ください。

WSD p880:ワードサーチ英語検索辞典 880ページ

こちらは1005ページです。

WSD p1005:ワードサーチ英語検索辞典 1005ページ

発音について

発音記号については、辞典の目的から、多くの発音に対応するため、多目の収録としています。発音記号フォントは自作で、内外の多くの辞典類を参考にしつつ、私が標準的と考える流儀で記述しています。

語義について

語義は、単語検索の目的から、簡潔な記述をとりつつ、語義の範囲は広めにとっています。
一覧性を保つ観点からも、語義説明を過度に厚くはしていません。

詳しい語法・用法(文型・熟語など)には及んでいませんので、それらの点については、ユーザー諸氏の側で別途お手持ちの(あるいはネット上の)辞典類で調べていただくことになります。

媒体について

現時点では、本辞典は、書籍版(紙媒体)のみです。辞典全部をネットに上げることは、諸般の事情から行っておりません。

書籍版については、詳しくは、こちらからお問い合わせください。

WSD-Lite として、簡易版をアップいたしましたので、ご試用いただければ幸いです。簡易版の注意点など、詳しくは、WSD-Lite のTopページをご参照ください。