人工知能(AI)に革命が起きていますが、教員の多くは、この事態を喜んでいません。無理もないでしょう。高校生がプロンプトを入力すれば、宿題のレポートや小論文をAIが数秒で書き上げてくれることを、ChatGPTが証明したのですから。

もちろん、そうして完成した小論文は間違いだらけかもしれませんが、宿題としては一丁上がりです。

そんなわけで、AIを使った不正行為に悩まされている人たちが、新たな対抗策という触れ込みのAI検出ツールを試してみるのは当然のことでしょう。

ただし問題は、そうしたツールも完璧ではなく、誤検出で被害をこうむる人が出ていることです。

AI検出ツールの仕組み

AIがやっていることを単純に説明すると、訓練で学習した知識にもとづいて、ある言葉の次に来る言葉を予測しているだけなのです。

たとえば、「雪は冷たく、火は熱い」と答えたとしても、意味を理解しているわけではなく、「火」の後には「熱い」という言葉が続くことが多いことを学習しているのです(かなり単純な説明ですが)。

対するAI検出ツールも、仕組みはほぼ同じです。テキストデータセットを使って訓練されており、データセットの中には、人間が書いたテキスト、ボットが生成したテキスト、両方が混ざったテキストが含まれています。

AI検出ツールは、LLMが生成したテキストであることを明確に示す特徴がないかチェックします。たとえば、同じ単語の繰り返しや、後に続きがちな単語を選択していること、文章の調子といった特徴です。

AIの訓練では、パターン認識を学習させようとします。それと同じで、AI検出ツールの場合は、ボットが生成したテキストかどうかを認識できるように訓練するのです。

次のページ>>
AI検出ツールを実際に使ってわかった盲点
12