翻訳のクオリティを上げるためのポイントとして「機械翻訳の質」に焦点が当てられがちですが、あることをするだけで翻訳の質が大きく向上することをご存じでしょうか。
それは、翻訳前の日本語文をわかりやすく作成することです。機械翻訳が得意な書き方で日本語の文章を作成することで、翻訳後の文章の誤訳が減少し、人的チェックの時間を大幅に減らすことができます。
本記事では、機械翻訳の精度を高めるための日本語の書き方【10のポイント】について紹介します。
日本語の特徴について
普段私たちが使う日本語は、世界で3本の指に入るほど難しいと言われるほど外国人にとっては習得が難しい言語です。ひらがな、カタカナ、漢字という3種類の文字があることに加え、語順に関するルールが少なく、なんとなく作った曖昧な文章でも相手に伝わります。また、多様な方言や敬語、回りくどい表現など、世界の数ある言語の中でも、非常に特殊な言語と言えます。
しかし、日本語が難しいのは外国人だけではありません。日本語は、機械翻訳にとっても難しい言語と言われているのです。その証拠に、英語ースペイン語、英語ーイタリア語などの翻訳に比べ、日本語ー英語の翻訳の精度は低いと言われています。
この難しい日本語を正しく翻訳することは、近年急速に進化している機械翻訳の力を持ってしても簡単ではありません。そのため、期待した内容と異なる文章や誤訳が生まれてしまうのです。機械翻訳が日本語を別の言葉に変換する際の難しさもありますが、AIが日本語の文を正しく理解する際の難しさも存在しているのです。
機械翻訳の精度を上げるために重要なのが、翻訳前の日本語文の作り方をマスターすることです。機械翻訳の得意な形で日本語の文章を作成すれば、機械翻訳は最大限の力を発揮し、優れた翻訳文を作成します。その後の人的チェックの負担を大きく減らすことができ、総コストの削減にもつながります。
では、機械翻訳が得意とする日本語の書き方とはどのようなものでしょうか。
機械翻訳の精度を上げる日本語の書き方【10のポイント】
ポイントを押さえることで機械翻訳の質が大きく向上するため、意識しながら日本語の文章を作成してみるといいかもしれません。機械翻訳の精度を上げるための日本語の書き方【10のポイント】についてご紹介します。
誤字脱字の確認
人間による翻訳であれば、誤字脱字があっても前後の文脈から理解し、正しく翻訳します。しかし機械翻訳では、誤字脱字があった場合に修正せず、AIは文字通り翻訳します。そのため誤字脱字がある文章では、翻訳後の文章がおかしくなり、チェックに時間がかかります。翻訳前の日本語文に誤字脱字がないかのチェックは、機械翻訳を使う前に必ず行うことをおすすめします。
漢字表記を用いる
ひらがなだけを用いて文章を作成した場合、別の意味も持つ文章になることがあります。例えば「わたしはしらない」と言うひらがなの文があった場合、「私は知らない」と「私走らない」の2通りの可能性があります。人間の翻訳であれば前後の文脈から判断しますが、機械翻訳は全体のイメージ把握は苦手であるため、誤訳の可能性が高くなります。機械翻訳を正しく行うためには、漢字表記を適切に用いることが大切です。
文章を短くする
文章が長くなると、文章中の主語と述語の関係がわかりにくくなり、間にある修飾文の位置づけも曖昧になります。そのため、長い文章の際には途中で文を切り、2つの文で作成すると翻訳の精度が大きく向上します。
話し言葉や方言・省略語を避ける
機械翻訳はデータベース内の日本語を元に翻訳を行いますが、話し言葉や方言を用いた言葉はデータベースに登録されていないことが多いため、AIは混乱し、誤訳が生じます。同じように省略語に関しても誤訳を生み出す原因となるため、避けるのがよいでしょう。
話し言葉や方言が多く含まれる文章を翻訳したい際には、すべての言葉をです・ます調で揃えたり、方言を一般的な言葉に置き換えたりした後に機械翻訳を行うとよいでしょう。
敬語は極力使わない
敬語は日本語特有の表現であるため、敬語ばかりの文章は機械翻訳が苦手とする分野です。もし相手を気遣った文章やビジネス用の文章を翻訳したい場合は、「丁寧語」のみを利用するようにし、「尊敬語」や「謙譲語」の利用はできる限り避けるのがベターです。
シンプルな言い回しにする
日本語は文章の語尾が長くなる表現を多く持ちます。例えば、「~することができます」や「~という感じになります」などの助長表現は、機械翻訳を混乱させます。「~です」「~できます」というシンプルな言い回しで日本語文を作成することで、翻訳の品質を高めることができます。
主語や目的語を省略しない
日本語は、場の雰囲気で理解が促される言語であるため、すでに主語が明白な際は主語を省くことがあります。しかし、他の多くの言語では主語は必須です。主語のない文章では誤訳が多く発生するため、主語はすべての文章に含めるようにするとよいでしょう。
また、主語と同様に、日本語は目的語を省略することもよくあります。日本語では目的語なしで伝わることもありますが、他の言語に翻訳する際には正しい文章にならない場合があります。目的語も正しく使っているか確認しましょう。
慣用的な表現を使わない
日本独自の慣用語やことわざなどは、機械翻訳が最も苦手とするところです。機械翻訳は内包された意味ではなく、言葉通りに訳すため、誤訳を生み出す大きなきっかけとなります。多様な表現を利用したい気持ちもあるかと思いますが、意味に焦点を当て、ストレートな文章を作成することが機械翻訳の精度を上げるためには重要です。
擬音語や擬態語を使わない
擬音語や擬態語は、非常に多くのレパートリーがあるため、機械翻訳が正しく翻訳できない場合がほとんどです。機械翻訳は、それらの言葉が擬音語や擬態語だと気づかずに文字通り翻訳してしまうため、結果的に誤訳が増えることになります。擬態語や擬音語を翻訳したい場合は、機械翻訳でなく、人力翻訳が適していると言えます。
主語と述語の関係をわかりやすくする
日本語は主語が長くなることも多い言語ですが、長い主語を翻訳することは機械翻訳の苦手とするところです。また、主語と述語の距離が大きく離れてしまったり、間に修飾文が多く入ったりする場合も、機械翻訳は正しく訳せません。主語と述語の関係がわかりやすい文章の作成を心がけましょう。
機械翻訳に適した日本語で翻訳の精度を向上させよう
翻訳の精度を向上させる方法はいくつかあります。例えば、自社が扱うジャンルに強い機械翻訳を利用したり、AIの学習機能を用いて適用力を高めたりすることが挙げられます。
しかしながら今回紹介したように、機械翻訳にとってわかりやすい日本語文を作成することで、翻訳後の文章の誤訳を減らすことができます。結果として人間によるチェックが減少し、総コスト減にもつながるため、機械翻訳を用いる際にはぜひ取り入れてみてください。