OpenAIは、ChatGPTに『Codex』(コーデックス)という、まるでAIのプログラマー(コーディングエージェント)のような新機能を追加しました。
これは、単にコードを生成するだけでなく、自律的にコードを書き、テストし、修正し、タスクを完了することができます。
・従来のChatGPT:
ユーザーの指示に従ってコードを生成。 実行やテストはユーザー自身で行う必要がありました。
・新しい「エージェント」機能:
まるで人間のプログラマーのように、自分でコードを書き、仮想環境で実行し、問題があれば修正まで行います。
ChatGPTのCodexがAIプログラミングを次のレベルへ
OpenAIは「インターネット経由で利用できるソフトウェア開発支援AI」であるCodexの研究プレビューを開始しました。
この機能は、コーディングやソフトウェア開発の作業に特化してつくられた、ChatGPT-o3モデルの頭脳とも言える『codex-1』という特別な仕組みによって動作しています。
Codex-1は「人間が書いたお手本のような、分かりやすくて質の高いプログラム」を学習して、それに近いプログラムを出力できるようにトレーニングされています。
現在はChatGPT Pro、Enterprise、またはTeamプランのユーザー向けに展開中。PlusおよびEduユーザーも間もなく利用できるようになるようです。
モデルを開くと、プロンプトを入力して「Code」ボタンを押すことでコーディング作業を頼んだり、「Ask」ボタンを使えば今扱っているプログラム全体(コードベース)への質問ができます。
プロンプトバーの下には、Codexのタスクリストと進捗状況に関する情報が表示されます。
コードベース全体への対応とリアルタイムな進捗確認
Codexは、新しい機能の追加、バグの修正、質問への回答など、既存のコードベースに対して、さまざまな作業を行うことができます。
各タスクは、コードベースやプログラムの保管場所(リポジトリ)があらかじめ準備された、ほかのプログラムから隔離された環境で実行されます。Codexはファイルの読み取りと編集も可能です。
OpenAIの発表によると、頼まれた作業の複雑さによって、Codexが作業を完了するのに1分から30分かかるとされています。
また、ブラウザとコンピューターを通常通り使用しながら、リアルタイムで進捗状況を監視したり、複数のタスクを同時に実行したりすることもできます。
ChatGPTはコードの生成や、ダウンロードしてテストできるプロジェクト全体の提供に役立ちますが、プログラムの保管・管理場所(ソフトウェアリポジトリ)や既存のコードベースと直接連携して作業することは得意ではありません。
Codexは、実際のソフトウェア開発で使われるような仕組みの中で動作できるため、プログラムの保管場所(リポジトリ)で複数のプロジェクトを管理する企業や個人にとって、通常のChatGPTよりもはるかに役立つと言えるでしょう。
CodexはChatGPTと比較して、より簡潔に整理されたコードを生成し、人間がチェックしたり、実際のワークフローや既存のコードベースに組み込んだりするのに適しています。
また、与えられたすべてのテストケースや条件に合格するまでテストを実行します。
タスクが完了すると、Codexはその環境への変更を記録・保存(コミット)して、「ターミナルログやテスト結果の抜粋といった、AIが行った作業内容を後から確認できる証拠」を提供してくれるはずです。
「Codex」が拓くAIプログラミングの未来
Codexは、あらゆる業界の専門家にとって非常に役立つ可能性を秘めています。
Excelマクロの作成、レポートの自動化、ファイルのバッチ編集など、これまでプログラミングの専門知識がないと難しかった作業の多くを実行できます。
コードの信頼性を高める自動テスト機能
確かに、ChatGPTはコードやスクリプトを生成できますが、私の経験では、生成されたコードが必ずしもそのままで完璧に動作するとは限らず、手直しが必要なことが多々あります。
そのため、作業しているプログラミング言語に関する、ある程度の知識やデバッグのための技術が必要です。
一方、Codexは自動的にコードをチェックし、意図したとおりに動作するかどうかをテストしてくれます。
プログラマーにとってCodexは、GitHubリポジトリと統合して反復的なタスクやテストケースを処理できるため、非常に強力なツールとなるでしょう。
これにより、ソフトウェア開発プロセスで通常行われるメンテナンス、テスト、その他の煩雑な作業に時間を取られることなく、より迅速にアプリを開発およびリリースできるようになるはずです。
Original Article: ChatGPT's New Coding Agent Is Huge, Even if You Aren't a Programmer by MakeUseOf

























