OpenAIが開発した大規模言語モデル「GPT(Generative Pre-trained Transformer)」ファミリー待望の第4版「GPT-4」がリリースされました。
GPT-4では何ができるようになるのかと、さまざまな憶測や意見が飛び交っていましたが、2023年3月14日、ついに登場したわけです。
最新版であるGPT-4には、大いに噂されたいくつかの機能はついていませんでしたが、GPT-3.5や、それ以前のバージョンと比べると、大幅な改善が見られました。
GPT-4はGPT-3.5と、どう違うのでしょうか。GPT-4とGPT-3.5の主な違いについて見ていきましょう。
1.GPT-4 vs GPT-3.5:創造性

GPT-4がGPT-3.5より明らかに優れている点のひとつは、プロンプトに対してこれまでより創造的な応答ができることです。
誤解のないよう言っておきますが、GPT-3.5も、非常に創造的です。GPT-3.5を搭載したChatGPTでは、たくさんの創造的なことができます。創造性という意味では、すでに多くの大規模言語モデルを凌駕しているのです。
ところがGPT-4は、そのレベルをさらに引き上げました。GPT-4の創造性がいかにすごいかは、基本的な問題を解こうとしても見えてこないかもしれません。
しかし、タスクの難易度が上がり、より高度なレベルの創造性が求められるようになると、創造性におけるGPT-3.5との違いが明らかになります。
たとえば、2つのモデルに対して、詩を書くという創造的なタスクを与え、各行を英語とフランス語の両方で書くよう指示します。すると、最新のGPT-4を使ったChatGPTのほうが、優れた結果を出します。
GPT-4は、各行を英語とフランス語のミックスで書きますが、GPT-3.5は、一方の言語で一行書いたら、次の行はもう一方の言語で書くというように、2つの言語を行ったり来たりするのです。
2.GPT-4 vs GPT-3.5:画像入力(ビジュアル入力)

GPT-3.5はテキストプロンプトしか受け付けませんが、GPT-4はマルチモーダルのため、テキストでもビジュアルでも入力が可能です。はっきり言っておきますが、ビジュアル入力は、テキストで入力したプロンプトの画像である必要はありません。
どんな画像でもいいのです。手書きの数学の問題から、Redditのミームまで、GPT-4は、ほぼどんな画像でも理解し、説明できます。
GPT-3と異なり、GPT-4は、言語モデルでもあり画像モデルでもあるのです。
OpenAIの技術者は、GPT-4を発表するライブ配信の中で、コミュニケーションツール「Discord」の「サーバー」(グループのような機能)のスクリーンショットをGPT-4に入力しました。GPT-4は、オンラインになっているユーザーの名前など、画像の細かい部分まで説明することができました。
また、ジョークを扱うウェブサイトの手書きラフスケッチをiPhoneで撮影し、その画像をもとにウェブサイトを作成するよう指示したところ、驚いたことにGPT-4は、画像と一致するウェブサイトを作るためのコードを生成したのです。
3.GPT-4 vs GPT-3.5:より安全な応答

GPT-4も完ぺきではありませんが、より安全な応答をするための対策が取られているのは、GPT-3.5からの嬉しい改善点です。
OpenAIは、GPT-3.5では、安全対策としてモデレーションをベースにした手段を取っていました。言い換えれば、安全対策の一部はあとから付け足していたと言えます。ユーザーの操作や質問を監視し、不具合を見つけ出し、そうする中で不具合の修正を試みていたのです。
GPT-4では、多くの安全対策がすでにシステムに盛り込まれています。わかりやすく言うと、初めから丈夫な材料で家を建てるのと、使えるものを使って家を建て、不具合が出たら修理するのとの違いです。
OpenAIによるGPT-4のテクニカルレポート(PDFファイル)では、GPT-3.5が有害な回答を生成する確率は6.48%であるのに対し、GPT-4はわずか0.73%となっています。
4.GPT-4 vs GPT-3.5:応答の事実性

GPT-3.5の欠点のひとつは、意味のない不正確な情報を、堂々と生成する傾向があることです。AI用語では「AIの幻覚(ハルシネーション)」と呼ばれる現象で、AIが生成する情報が疑われることになりかねません。
GPT-4でも、ハルシネーションの問題はあります。けれども、GPT-4のテクニカルレポートによれば、GPT-3.5と比べて、ハルシネーションの起こりやすさは19~29%低くなっています。
これは、テクニカルレポートの上だけの話ではありません。GPT-4を搭載したChatGPTの回答は、格段に正確さを増しています。
5.GPT-4 vs GPT-3.5:コンテキスト・ウィンドウ

GPT-4とGPT-3.5の違いとして話題になることが少ないものに、「コンテキスト・ウィンドウ」と「コンテキスト・サイズ」があります。
「コンテキスト・ウィンドウ」とは、チャットのセッションの中で、どれだけ多くのデータを、どれだけ長く「メモリー」に保持できるかです。GPT-4は、「コンテキスト・サイズ」と「コンテキスト・ウィンドウ」が、従来のモデルより大幅に改善されています。
わかりやすく言うと、GPT-4は、会話のコンテキストや、会話の中で与えられる指示を、より長い時間にわたって、より明確に、記憶することができるのです。
GPT-3.5の問題は、会話が進むにつれて、話題からそれたり、指示から離れたりする傾向があることです。
たとえば、あなたのことを名前で呼ぶよう指示するとします。GPT-3.5はしばらくは指示に従いますが、途中でその指示から離れてしまうのです。この問題はGPT-4でも見られますが、コンテキスト・ウィンドウが改善されているため、問題は軽減されています。
もうひとつの問題は、プロンプトで一度に使うことができるテキストの量に限界があることです。
GPT-3で長文を要約するときは、たいていテキストを複数の塊に分けて、少しずつ要約することになります。GPT-4では、コンテキストの長さが改善されているため、PDF全体を一度に貼り付けて、それを分割することなく要約させることができるのです。
GPT-4:GPT-3.5からのステップアップ
GPT-4が、従来モデルから大きくステップアップしていることは間違いありません。
GPT-3.5の頃から存在していた限界にまだ苦しめられている部分はありますが、いくつかの領域が大幅に改善され、新しい能力も加わったことで、真にインテリジェントなAI言語モデルを追求する上で、新たな期待の一歩となっています。
Original Article: GPT-4 vs. GPT-3.5: 5 Key Differences Explained by MakeUseOf