ハルシネーションとは？生成AIでコンテンツを作る際に気をつけたいことをチェック

2024/09/26

生成AIが普及し、Web上のコンテンツ制作にも多く使用されるようになりつつある昨今。サービスやツールによってはキーワードを入れるだけで簡単に文章を生成できたり、チャットのように問いかけるだけで答えが生成されたりするものもありますよね。ですが、生成された内容が正しいかどうかを確認したことはありますか？
生成AIは便利ですが、決して万能なものではありません。利用の際は、適切な内容が生成されているかをチェックすることが大切です。そこで本コラムでは、生成AIコンテンツを作る際に気をつけておきたいポイント「ハルシネーション」について解説いたします。

ハルシネーションとは？

ハルシネーションとは、AIが指示に対して「もっともらしい嘘の情報を生成してしまう」ことです。
生成AIはWeb上の情報や学習した情報をもとに指示に対する答えを生成しますが、必ず正確な答えが出るとは限りません。例えば、下記のような例が挙げられます。

Q：南総里見八犬伝は全何巻ですか？

A：南総里見八犬伝は全106巻です。(実際は全98巻106冊なので誤り)

上記は一般的な誤回答が返ってくる例ですが、このほかにも、年号や人名などが誤って出力されるケースが多くあります。一般常識として明らかなものであればすぐに訂正できますが、ニッチな業界知識や情報の場合は気づくことも難しいかもしれません。

なぜハルシネーションが起こるのか

では、なぜハルシネーションが起こってしまうのでしょうか。これには、生成AIの特性が関わっています。

情報源が間違っているため
生成AIはWeb上の情報や学習させた情報をもとに答えやコンテンツを生成するAIです。当然、情報源が間違っている場合は正確な回答を行うことはできません。また、学習させた情報に矛盾がある場合なども、正確な回答を返すことは難しくなります。
生成AIは正確に物事を回答することを目的としていないため
文章を作成する生成AIの多くは言語モデルを使用しています。言語モデルは正しい情報を生成することより、言語としての文脈が正しい＝会話ができる、文章が成立していることを優先することがあります。そのため、「もっともらしい嘘」の回答が生成されてしまいます。

ハルシネーションを予防するには？

では、ハルシネーションを予防し、正確な文章を生成するにはどうすればよいのでしょう。
生成AIを使用する際の対策としては「学習内容や生成内容をフィルタリングする」ことが挙げられます。また、Web上とのコンテンツとの類似性を確認したりすることで、回答のソースがどこにあるのかが判明する場合もあります。
加えて、自分でもできる対策は「生成された文章をよくチェックすること」です。単純な方法ですが、生成された内容に頼り過ぎず、正しい内容になっているか？矛盾しているところはないか？をよく確認することで、予期せぬトラブルを防げる可能性が上がります。

以上のように、生成AIの活用は大幅な業務効率化につながりますが、一筋縄ではいかない部分も多くあります。ぜひ利用の際は「生成内容をチェックしやすいか？」という点も考えながら検討してみましょう。
また、生成AIを利用したプロダクトの中には、ハルシネーションを防ぐためのチェック機能を備えているものや、プロンプトを自分で編集できるものもあります。利用を検討する際は、このような機能にも注目してみてください。