between-easy-japanese-and-google-translation

「やさしい日本語」でGoogle翻訳の精度UP

「やさしい日本語」とGoogle翻訳の相性が良いってご存知ですか?

昨今、精度が上がったと話題のGoogle翻訳

少し前までは、単語や文節など部分的に翻訳したものを組み合わせていたため、文章全体を見たときに不自然な部分が多く見られましたが、機械学習のアルゴリズムの1つ、ディープニューラルネットの技術導入で、単語の意味だけでなく接頭辞や語幹、単語の位置なども考慮され、文章全体の流れを捉えたより自然な翻訳が可能になったそうです。

とはいえ、日本語から英語に翻訳した際に、不自然さを感じることもあります。

その不自然さの原因は、システムの問題だけでなく、例えば、私たちが日本語を入力する際、無意識に文章の構造を複雑にしていたり、主語と述語や文章全体が曖昧な表現だったり、日本語と外国語で意味の異なるカタカナが使ってしまったりといった、人為的な問題もあるようです。

「やさしい日本語」は、誤解を招かない・簡単な言葉を使用・シンプルな表現方法です。この「やさしい日本語」から外国語へ訳すと、意味の通じる訳文になりやすく、その結果、Google翻訳をはじめとした機械翻訳の精度も上がります。

では、「やさしい日本語」についてご紹介します。

「やさしい日本語」の起源

「やさしい日本語」とは、普通の日本語よりも簡単で、外国人にもわかりやすい日本語のことです。

1995年1月の阪神・淡路大震災では、日本人だけでなく日本にいた多くの外国人も被害を受けました。

“震度はいくつだ” や、“避難所はどこだ”、“生活物資の配給” などといった、地震や復興支援に関する情報に使われることばが、外国人にとっては非常に難しく、どうすればいいか分からず、必要な情報を受け取ることができない人も多くました。

阪神・淡路大震災では、行政による外国人対応は震災後3日目になってようやく始まり、それまでの間、外国人被災者はとても困った状況におかれていたそうです。

日本人でも “災害がおこった” という混乱状態において、聞きなれない災害用語を理解するのは、難しいことですが、日本語に慣れていない外国人にとっては、もっと難しいです。

そこで、そうした災害発生時に誰もが理解ができて、適切な行動をとれるように考え出されたのが「やさしい日本語」の始まりです。

そして、「やさしい日本語」は、災害時のみならず平時における外国人への情報提供手段としても研究され、行政情報や生活情報、毎日のニュース発信など、全国的に様々な分野で取組が広がっています。

「やさしい日本語」の特徴

「やさしい日本語」の下記のような特徴があります。

    • 簡単な単語が使われている(日本語能力試験出題基準3級・4級(最も初級)程度)
    • 1文は短く、文章の構造がシンプル
    • 曖昧な表現はしない
    • 二重否定の表現はしない
    • 文末表現を統一する
    • 動詞を名詞化しない
    • カタカナの外来語は使わない(例「ライフライン」日本語では、電気・ガス・水道などの生活に必要な設備のことを意味しますが、英語では「命綱」を意味するので、外国人には誤解されやすい)
    • 擬態語や擬音語は使わない
    • 時間や年月日を外国人にも分かるようにする(元号を使わずに西暦表記など)
    • 使用する漢字の分量が少ない。すべての漢字にルビ(ふりがな)をふる

例文としては、

当社の就業開始時間は9時ですので、5分前には仕事が開始できるように出社してください
↓↓↓
会社かいしゃは、9からはじまります。9時にるのはダメです。8時55ふんにきてください。仕事しごと準備じゅんびをしてください

余震が起きるおそれもあるため、余震に対して十分に注意してください
↓↓↓
しんあとで  る しん)に をつけてください

使われている言葉と、文章の構造は変わっていますが、十分に伝わります。

「やさしい日本語」使った時の翻訳の精度

日本語は英語等の外国語に比べると主語・目的語に対する重要度が低いと言われています。

例として、「何時に起きる?」を翻訳してみると・・・日本語に慣れている人からすると、相手に起床する時間を聞く質問と安易に想定ができますが、Google翻訳では、このように訳されてしまいました。

何が起こるのでしょうか???

同じ内容ですが、主語を「誰」特定してあげるだけで、翻訳の精度があがるのが分かります。今回は、主語を「You=あなた」としましたが、もしかしたら質問者が起床する時間を聞きたかった対象者は「She=彼女」の可能性もあります。また、「They=彼(女)ら」と複数の対象者の起床時間を確認したかった可能性もあります。

日本語は、主語を省くことが多いですが、複数形と単数形の違いも明確にありませんので、明確にするだけでも翻訳の精度があがります。

他、比喩表現や擬音語も国や文化によって異なるので使わない。カタカナも日本特有の使い方がありますので、使わずに表現した方がよいでしょう。

翻訳精度を上げるテクニックは、細かいことを言い出せばキリがないですが、誤解を招かない・簡単な言葉を使用・シンプルな表現方法の「やさしい日本語」を使うことが、Google翻訳の精度UPの近道です。

 

他、「やさしい日本語」でニュースや時事を知ることがサイトをご紹介します。(※随時、更新)

■ NHKワールド日本「やさしい日本語で”今週の日本”」
4月6日(土曜日)11時50分~(再放送)18時50分~
https://www3.nhk.or.jp/nhkworld/ja/radio/

■ NHK 「NEWS WEB EASY」
https://www3.nhk.or.jp/news/easy/

■ 西日本新聞「コーナー:やさしい日本語」
https://www.nishinippon.co.jp/theme/easy_japanese/

関連記事:
Do you know “J-ALERT” ?:Jアラートについて
業務に必要な「日本語の能力」とは?
コラム:「やさしい日本語」とは?
Job title ; Japanese-English contrast :肩書を英語と「やさしい日本語」にしたら?

 

関連記事一覧

  • コメント ( 0 )

  • トラックバックは利用できません。

  1. この記事へのコメントはありません。