機械翻訳の歴史

機械翻訳の歴史はインターネット上で数多く紹介されています。たとえば、Asia-Pacific Association for Machine Translation (AAMT) は、日本国内での機械翻訳黎明期から現在に至るまでの歴史を紹介しています。 コンピュータが出現して以来、人間を介さない翻訳の実現は夢でした。この夢は果てることなく現在にまで連綿と引き継がれています。

機械翻訳の技術とは

機械翻訳の技術は日進月歩の状況にあります。

ルールベース機械翻訳
(Rule Based Machine Translation、RBMT、または RMT)

登録したルールに基づいて構文を解釈して翻訳する方法。古い機械翻訳の手法と言われ、現在ではあまり使用されていませんが、コーパス(過去の翻訳資産)がなくてもある程度翻訳することができる、訳抜けがないというメリットがあります。

統計的機械翻訳
(Statistical Base Machine Translation、SBMT、または SMT)

大量の対訳データ(通常「コーパス」と呼びます)を登録し統計的手法により訳文を生成する方法です。ルールや辞書の開発の必要がなく、原文と訳文の両方の言語の性質に縛られにくいため、多言語化が容易だとされています。

ニューラル機械翻訳
(Neural Machine Translation、NMT)

今までは前述の2つ、またはそれらを組み合わせた技術がメインでしたが、ニューラルネットワーク、ディープラーニングによる   ニューラル機械翻訳(Neural Machine Translation、NMT)が生まれ、2016年11月にGoogleが発表したNMTを採用したGoogle翻訳は、機械翻訳の品質が格段に向上したことで、各界に大きな衝撃を与えました。NMTでは人間が言葉を理解するのと同じような構造で訳文を出力するといわれ、エンジンによってはTOEIC 900点以上の訳文も生成可能といわれています。

日本語では機械翻訳の使用は難しいとされており、現段階ではまだ完ぺきというレベルではありませんが、「翻訳」というカテゴリーが何かのカテゴリーに吸収される道筋にあります。