top of page

日本語という言語

機械学習における日本語特性について

2022年7月8日

日本語の言語構造は、他の言語と異なると言われますが、機械学習においても大いにそれは影響してると思います。


下記のフレーズがあるとします。


ー「私は、端的な物言いをするあなたの話し方が好きではありません」


これを分解してみると…


  1. 「私は」

  2. 「端的な」

  3. 「物言いをする」

  4. 「あなたの」

  5. 「話し方が」

  6. 「好き」

  7. 「ではありません」


一番伝えたい「私は好きではない」ということが、一番最後まで聞かないと分かりません。


一方で英語はどうでしょう。


ー「I don't like your way of speaking in a straightforward manner」


冒頭「I don't like...」で最初から分かってしまいます。


AIが会話を理解する際、言葉の根幹部分を先に読み取れるほうが、正確さ、タイムリーさにおいて有利なように感じます。


しかし、苦労が多い分だけ乗り越えたときの成果が大きいとポジティブに捉え…

私どもは、クオリティを追求したデータ製作に今日も勤しみたいと思います。


では次の情報でお会いしましょう。

bottom of page