エスペラント語日本語翻訳システム"Ermitejo"を開発する上で参考とした文献を、以下の通り示します。
参考文献としての網羅性はまだ全く備えておりませんので、書架に積まれている文献を適宜追加して参ります。なお、楽屋落ちの補足ですが、ここに挙げられていない文献は書架に“並べられている”わけではありません。以前は書架にすら積まれておりませんでしたが、少々部屋を整理してようやく書架に回帰出来たという次第です。
それぞれの文献については、取り敢えずリンクは設けておりません。また、書誌情報の抜け部分・内容紹介・所感等は、適宜追記する予定です。
自然言語処理という広い海について、体系的に幅広く言及されている良書です。各処理の考え方・アルゴリズム例に加え、特に機械翻訳ではシステムの実例についても紹介されており、“実用書”として一番参考にしています。
紙幅も薄く、内容も平易であり、さらりと自然言語処理の何たるかを知るのには良いかと考えます。
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
柴田氏の取り組み(US式英和翻訳プログラム)は、Perlでいうところの正規表現を山ほど用意して力業で対訳を行い、翻訳文をこしらえるものであると理解しています。基本的な文章対訳は出来ますが、書き換え規則が存在しない構造の文章は翻訳が出来ません。
もっとも、柴田氏自身が「基本的な文章からきちんと訳せるように、順を追って書き換え規則を追加していく」旨の記載をしていますので、一つの方法論として捉えるのが良いかと考えています。後述の『統語論入門(上)』のp.29辺りでも言及がありますが、パターン照合の意義と限界をわきまえた上では有用かと思います。
こうした「盆栽」的な取り組みは、私のような趣味プログラマとしては大変共感出来ます。しかし、さすがにO(n!)オーダでの影響分析が必要な書き換え規則の保守はぞっとしないので、Ermitejoでは根幹の処理への適用は行わないこととしました。
その代わり、まさに「きちんと」訳すという部分について、つまり、いわゆる「機械翻訳された不格好な文章」をいかに撲滅するかという点についてはとても参考になります。CFGの書き換え規則結果について、単語・熟語等を英和対訳する流れですが、最後に訳語についても書き換えを行う処理をしているためです。パターン照合の方法は今更語るまでもありませんが、その実際の使い方のヒントや、英文に適用した場合の実例が、同氏の書籍には豊富に記載されています。
現在の"Ermitejo"はまだ構文解析処理の開発中でありますが、いずれは構文生成後、つまり翻訳の文単位での最終盤(文をまたいだ文脈解析等がさらに後ろに存在するため、翻訳全体での最終盤でないという理解です)である単語列や形態素の生成処理に於いて、つまりモジュール単位での援用では、大いに参考にさせていただこうと考えています。
ウェブサイト「トラちゃんの部屋」にて、エス和の逐語訳を提供する機械翻訳ソフト「トラちゃん95」を公開されている山野氏のページです。派生語・合成語を分解して分析する処理の設計にあたり参考にさせていただきました。
(紹介文・所感等は未記述です)
あ~ぁ、遂に原書に手を出してしまいました。郡司氏が翻訳してくれないので(責任転嫁)……。
Ivan A. Sag & Thomas Wasow, "Syntactic Theory : a Formal Introduction" (first edition), CSLI Publications, 1999の訳書(上下巻分冊)であり、HPSGを念頭に置いた統語論の入門書として、スタンフォード大の学部生向けの講義用として書かれています。なお、原書は第2版が2003年に出ています。
最序盤では学校文法用語から始まって伝統的なCFG(文脈自由句構造文法)も持ち出して言語現象について説明しており、以降、HPSGの持つ素性構造・諸規則(rules。現在のHPSGではschemas)・諸原理(principle)を説明しつつ、下巻で受動構文や長距離依存(照応関係等)といった英語の言語現象をHPSGで解いていく応用編に繋げていく構成になっています。
このように、私のような畑違いの初心者でも順を追って理解をして行ける構成となっており、HPSGについて勉強出来る邦語文献(自体の数は少ないですが)の中でも随一の内容だと考えます。とはいえ、やはり内容は(茶化しますが価格も)“専門書”然としていることは間違いなく、“入門書”として考えると火傷をすること請け合いです。
元々HPSG自体がコンピュータと相性の良い理論であることも手伝って、統語論をソフトウェア処理に組み込むことを念頭に置いた記述もなされています。このため、翻訳ソフトのうち構文解析処理・意味解析処理を実装する上での“実用書”としても扱え、大変役立っています。
上記文献の下巻です。
Carl Pollard & Ivan A. Sag, "Information-based Syntax and Semantics, Vol. 1: Fundamentals", CSLI, 1987の訳書であり、HPSGの入門書です。
上記の『統語論入門』と比べて、より言語学関係者向けられた内容となっています。ソフトウェア処理についてはソの字くらいが出て来る程度ですので、“実用書”としては期待せず、むしろHPSG自体の言語学的な知見を広めるよすがとすることがよろしいかと考えます。無論、そうした知見を“実用書”として使えるはずなのですが、恥ずかしながら、私の理解がまだそこまで追いついていないのが現状です。
なお、原書が昔のHPSGの理論を元に記述されている点には留意が必要です。例えば、SYN素性とSEM素性は現在はSYNSEM素性になっていたりといった点です。ただし、左記の旨は訳者後書きにてきちんと言及されています。
2007年8月追記:どうにか素性構造とは何ぞや、といった点が理解出来始めてきまして、いざ久しぶりに読んでみるとかなり読解出来ます。これからこの本の真価を発揮出来そうです。
(紹介文・所感等は未記述です)
エスペラント・エスペラント辞書の最高峰、PIV2005です。1970の初版・1987年の増補改訂版・2002年の新版La Nova Plena Ilustria Vortaro de Esperanto(NPIV, PIV2, PIV2002; ISBN 2-9502432-5-8)に続く、最新版。2002年のNPIVの改訂増補版という位置付けです。用例も豊富で、エスペラント的な言い回しを調べることにも役立ちます。
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
英語・エスペラント辞書、CEEDです。調べた限りでは最大のもののようです。本当は革装(ISBN 0-939785-02-1)の方が良かったのですが、取次の日本エスペラント学会には紙装しかなかったので、紙装版を入手しました。情報技術ネタは邦語訳に直し難い単語もあり、英単語をそのままエスペラント単語で調べられるので重宝しそうです。
(紹介文・所感等は未記述です)
エスペラント文法書の権威とされる、PAGです。名古屋エスペラントセンターのご厚意により、入手することが出来ました。
オンライン文法書、PMEGです。PoMEGo(でかリンゴ)という愛称もあるようです。
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
大阪府豊中市のエスペラント会です。『文法の散歩道』著者の小西氏や、「トラちゃん95」開発者の山野氏等、高名な方も所属されていらっしゃいます。広範なリンク集があり、このサイトへもリンクいただいております。
広高正昭(ハンドル:Vastalto)氏のウェブサイトです。Ermitejoでも使っている辞書データを「Vastaltoのエスペラントの部屋」にて「実用エスペラント小辞典(PEJV)」として公開されている他、「実用エスペラント小辞典」のページではオンラインで辞書引きが出来ます。
大場正輝(ハンドル:鍋田)氏のウェブサイトです。「日本語<->エスペラント語 単語変換オンライン辞書」にて、実用エスペラント小辞典(PEJV)のサブセット版をJavaScriptによって辞書引き出来ます。辞書データをダウンロードするので読み込みに時間が掛かりますが、ダウンロード後はインターネットに繋がっていなくても辞書引き出来ますので、Ermitejoと併用すると便利です。
また、同氏は「鍋田辞書」というオフラインソフトも公開されています。PEJVのデータをそのまま取り込めますので、エスペラントの辞書引きも簡単に行えます。
ハンドル:papageno氏が「将来実用的な翻訳機が登場した場合に、国際共通補助語としてのエスペラントや、事実上の国際語の立場にある英語がどこまで必要か」という趣旨を論じているブログです。
また、エスペラントの言語的・文化的な疑問についても論じられています。エスペランティストはその理想故か偏狭な考え方に至る場合もありますが、こうした視点からもエスペラントを見つめ直すと良いかと思います。
エスペラントについて、改造論やら政治・思想やらを含む一切のタブーなしに議論する場として設けられた、国内の掲示板です。私も出入りを始めました。
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
買い求めて読み始めたばかりですが、早速赤面して現在の本サイトに於ける各種の実装を見直そうと思いました。翻訳システムはウェブアプリという桎梏を感じさせないフロントエンド処理を実現するためにAjaxを活用する予定ですが、そのヒントとして。
(紹介文・所感等は未記述です)
翻訳システムのフロントエンド処理のために。
(X)HTMLとCSSについて、2005年時点でのWeb標準の準拠方法を事細かく記述してある良書。後述の『正しいHTML4.0 リファレンス&作法』が「僕たちの戦いはこれからだ!(W3C先生の次回作をご期待ください)」と幕引きしているその後を、思想面でも技術面でも広く守備範囲としています。
(御多分に漏れず、本サイトに於いても)大票田であるところのIE7.0についての記述がないのは致し方ないが、仕様書側ではXHTML 1.0 第2版(2002年)・XHTML 1.1(2001年)・CSS level 2 (1998年)と、2005年当時と何ら変わりがないので、情報の価値は殆ど減じられていません。
ただ、本書は仕様書に重きを置きつつも、現実問題として立ちはだかる「各UAの実装の尻拭い」方法についても(CSS hackを含め)丁寧に記述してあるので、それは別途Webで調べる必要があります。
書籍としては古いですが、昔お世話になった書籍。ここ7年来、HTMLやらCSSやらについてはウェブで知識を得ています。
Web標準を題した書籍が生まれる気配がぺんぺん草も生えない程度であった太古の時代に、Web標準に準拠することの意義を謳った檄文の書。リファレンスとしては、HTML4.0時代の仕様書のエッセンスのみがまとめられており、詳細は「あとは仕様書を読んでね」という姿勢です。古い書籍なので技術的には見るべきところが薄くなっていますが、檄文については(Web標準がそうであるように)普遍的な価値があります。
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)
(紹介文・所感等は未記述です)