• 翻訳

2023.05.30 UP

機械翻訳の基礎知識

機械翻訳の基礎知識
※「通訳者・翻訳者になる本2022」の記事を再編集

時代の変化に加え、2020年以降のコロナ禍により、通訳・翻訳業界の環境も大きく変化した。
通訳業界においては遠隔通訳が急速に普及、翻訳業界では機械翻訳(MT)への注目度が一層高まっている。機械翻訳(MT)はどのような技術であって、翻訳業界にどのような影響があるのか、基本知識を紹介する。

機械翻訳とは

機械翻訳(Machine Translation;MT)とは、人間ではなく機械(コンピュータ)が実行する翻訳のことであり、プログラムがコンピュータを制御して異言語間の変換を行うことである。1940年代から研究がすすめられ、1980年代には商品化が始まった技術だ。

以前からの技術としては、入力を文法ルールに従って分析して、対訳辞書と変換のルールとを使って翻訳する「ルールベース翻訳」(RBMT)と、大量の対訳データから確率付きの対訳辞書を作り、ほかの確率と組み合わせて翻訳する「統計翻訳」(SMT)の2つがある。

現在の主流となってるのが、脳の神経細胞を模した“ニューラルネットワーク”を使った「ニューラル機械翻訳」(Neural MT;NMT)である。2016年にGoogle翻訳が新技術のNMTを利用するようになって以降、その高精度が注目を集め、翻訳を発注する企業側もMTの利用に関心を持つようになってきた。

NMTの特徴とは? PE(ポストエディット)とは?

NMTにより翻訳精度は飛躍的に向上した。また、RBMTやSMTなどと比較すると「訳文の流暢さ」が際立っている。ただし、NMTの大きな欠点として、原文の情報の一部が訳文に表れない「訳抜け」がある。精度が向上したといっても、まだMTはプロの翻訳者には遠く及ばない。したがって、MTの訳文をプロ並みの品質の良いものにする作業「ポストエディット(Post Edit;PE)」が不可欠である。
MTの普及につれてPEの需要がどんどん増えていくと思われる。

MTの精度はどう違う? MTを産業翻訳に使うには?

さまざまな企業・組織が機械翻訳を開発しており、Google翻訳、NICT(国立研究開発法人情報通信研究機構)のTexTraのほかにも、DeepL、Microsoft、Amazon等がリリースしているNMTがある。
翻訳エンジンの性能は、アルゴリズムと対訳データで決定される。しかし基本のアルゴリズムはどのMTでもほぼ同じものが使われているため、MTの精度の違いは、対訳データの質と量の違いによるところが大きくなる。

MTを導入する企業は、MTのエンジンに製薬、金融、自動車などの各専門分野の対訳データを参照して訳出をさせるべく“アダプテーション”をすることで、さらなる高精度を実現している。
MTエンジンをアダプテーションして専用化することで翻訳精度は高くなるので、多くの企業、翻訳会社がMTの導入に積極的であり、今後はさらに多くの分野でMTが導入されていくと予想される。