「親愛なるロシア人」(dear Russians)と英語で入力した時に、グーグル翻訳が「死んだロシア人」(dead Russians)と提案してロシア人ユーザーを脅かした
AIの弱いところ。
学習には主に統計データを取り込むため、グーグルの場合は今検索されているキーワード上位が優先されやすい。Twitterは更にその傾向が強いだろう。
検索キーワードのトレンドとして候補を表示する分にはタイムリーなものを提供できユーザーにとっても便利だが、翻訳精度には直結しない。翻訳とは国語であり流行ではないから。
例えば第2次世界大戦時代にグーグルがあったとすると、「敬礼」と入れたら「ヒトラー万歳」と翻訳されるだろうということ。
ごく一部の人達にとってそれは等しい意味であったとしても、圧倒的大多数の人にとって敬礼の対象はヒトラーではない。
ということから、統計データとは事実であっても、使い方や使うシーン・場所を間違えると正しい結果には導かれないということを示している。
0コメント