このところ、人工知能(AI)が大変な進歩を遂げています。

それに後れることなくついて行こうとしている人には、「頑張って!」としか言いようがありません。

OpenAIが開発した「ChatGPT」が2022年11月にリリースされて世界を揺るがしてからというもの、AIは刻一刻と進化しているように感じられます。

今最も話題になっているのが「Auto-GPT」。

これは、ChatGPTの基盤技術である「GPT-4」を使って、ChatGPTにはできないことを自律的に行うAIです。

ウェブで試せますが、Auto-GPTのAIエージェントを独自に作成することもできますよ。

Auto-GPTとは?

Auto-GPTでは、AIと、エンドユーザーである人との関係が逆転します。

ChatGPTの場合は、AIと人間が交わすやりとりが頼り。エンドユーザーがAIに対して、依頼したい内容のプロンプトを与えると、AIからそれに対する答えが返ってくるので、通常はそれを踏まえて、新たなプロンプトをまたAIに投げかける、といった具合で進んでいきます。

一方のAuto-GPTは、AIが必要とするプロンプトは1つだけ。あとは、リクエストされた内容を完了するために何が必要かを自律的に考え、自分がなすべきタスクをリストアップします。

エンドユーザーが、情報やプロンプトを追加で与える必要はありません。Auto-GPTの生みの親であるSignificant GravitasことToran Bruce Richards氏に言わせれば、基本的にLLM(大規模言語モデル)の「思考」を、鎖のようにつなぎ合わせているのだそうです。

Auto-GPTは、さまざまな要素から成り立つ複雑なシステムです。インターネットに接続して、特定の情報やデータを取得したり(ChatGPTの無料版はこれができません)、長期記憶と短期記憶を運用したりします。

また、GPT-4を使って高度なテキストを生成し、GPT-3.5を使ってファイルの保存と要約を実行。不確定要素は多々あるものの、最終的には、すべてを1つにまとめて、驚くような成果を導き出します。

見て驚け! Auto-GPTの使用例

初の使用例は、Auto-GPTの生みの親であるRichards氏のGitHubアカウント「Significant Gravitas/Auto-GPT」にあります。

Auto-GPTが完遂しようとしている例題リストのゴールすべてを確認することはできませんが、大まかに言えば、デモンストレーターがAIエージェントに対し、自分自身について詳しく調べて学習するよう求めたようです。

すると、Googleを使って、GitHubに保存されている自分のリポジトリを開き、その中身を分析データを要約してテキストファイルに変換し、デモンストレーターが確認できるようにしています

もっとわかりやすい実用的な例をTwitterで見つけたので、紹介しましょう。

まるで人間? Auto-GPTの驚異的リサーチ力と要約力

TwitterユーザーのRahulさんは、市販されているヘッドホンで一番のおすすめはどれなのかを知りたいと考えました。

そして、自分で検索するよりも、Auto-GPTに調べてもらおうと決め、次の4つのゴールを設定したそうです。

  1. 現在市販されている各種ヘッドフォンについて、市場調査する。
  2. 上位5つを選び、それぞれの長所と短所をリストアップする。
  3. 各ヘッドホンの価格を含めた分析内容を保存する。
  4. タスクを終えたら、インターネットへの接続を切断する。

ゴールを与えられたAIエージェントは、一瞬考えてから作業に着手しました。

まず、ウェブを検索して、ヘッドホンに関する情報とレビューを収集

それから、読みやすく簡潔なテキストファイルを作成して、ヘッドホンをランク付けし、価格を書き加え、長所と短所をリストアップしたのです。

もうこれ以上は、AIに驚くことはないだろうと思っていた矢先に、Auto-GPTとAIエージェントに度肝を抜かれた。

見てのとおり、AIエージェントが製品を検索して、おすすめヘッドホンについてまとめてくれた。信じられない!

いちばん驚いたのは、これをやってのけたのはGPT-4だってことだ。

Auto-GPTは「批判的」に考えられる

別のTwitterユーザーSully Omarさんも、Auto-GPTに同種のゴールを与えました

靴メーカーのふりをして防水シューズを調査し、競合製品トップ5をリストアップするよう、AIエージェントにリクエスト。するとなんと、AIエージェントには、「偏ったレビューや偽のレビュー」が紛れ込んでいることを踏まえて、分析する際にそれを考慮する能力まであったのです

AIエージェントはまずGoogleを開いて、最も人気のある防水シューズ5種類のレビューを探し出した。

リンクを見つけて、自らにこう質問した。

・「各シューズの長所と短所は何か」

・「防水シューズのトップ5それぞれの長所と短所は何か」

・「男性用防水シューズのトップ5」

さらに、Googleを検索したり、クエリを改善したりしながら、結果に満足するまで、さまざまなサイトを分析した。

下の画面は、Auto-GPTが「批判的に」考えられることを示す一例だ。偏ったレビューや偽のレビューが紛れ込んでいて、レビュー投稿者の信頼性を確認する必要があることを理解していた。

まだ実験的段階のAuto-GPT。「革命的」は早合点?

Twitterで、「Auto-GPT」や「AGI(汎用人工知能)」と検索すれば、こうした使用例はいくらでも見つかります。

ただ、感心するのはまだ早いでしょう。Auto-GPTは生まれたばかりの新しい技術であることを忘れてはいけません。

Richards氏がGitHubでこのプロジェクトを公開したのは2023年3月後半。以降、Auto-GPTは大きな話題になっていますが、まだ実験的なプロジェクトにすぎないのです。

半導体メーカーNVIDIAのAI科学者Jim Fan氏も、Auto-GPTは「面白い実験」だし、一般の人が簡単に応用できるとはいえ、「あくまでもプロトタイプであって、革命的だと早合点すべきではない」とツイートしています。

AutoGPTは、GitHubで付けられた星の数で、機械学習ライブラリのPyTorch自体を上回った(AutoGPTは7万4000個、PyTorchは6万5000個)。

AutoGPTは面白い実験だと思うし、つくった本人もそう言っている。単なる実験であって、そのプロトタイプは、リリースするためにつくられたものではない

メディアに騙されないでほしい。「クールなデモ」はたいてい、かなり厳選されたものだ。

開発者本人の見解は?

開発者自身も、Auto-GPTがいまだに初期段階にあることを自覚しており、自身のGitHubサイトでは、Auto-GPTの問題点について、次のように列挙しています。

  1. 完成したアプリケーションではないし、製品でもない。あくまでも実験である。
  2. 実社会の複雑なビジネスシーンではうまく機能しない可能性がある。むしろ、うまく機能した場合はぜひ知らせてほしい。
  3. 運用にはかなりお金がかかるので、OpenAIのAPI利用料金の上限を決め、それを超えないよう注意したほうがいい。

ただ、個人的に言わせてもらうと、Auto-GPT(あるいは、少なくともAuto-GPTが約束していること)のすごさは、どのようなタスクであれ、そのほぼすべてをAIに任せられることです。

AIに何かをリクエストする際に、正しい質問の仕方や、最適なプロンプトがわからなくても構わないのです。

最初に明確なゴールを提示さえすれば、あとはAIが自分で考えて、人間側が思いつけなかったであろうステップを組み立ててくれます

こんな風に言うのは少し気が早いかもしれませんが、こうした類いの技術が進化していくスピードは、私たちの想像を超えるものとなるでしょう。なにしろ、GPT-4がリリースされてから実質2週間で、Auto-GPTが公開されたのですから。

Auto-GPTを試すには?

Auto-GPTで独自のAIエージェントを作成する際に、必ずしもプログラミングの知識が必要なわけではありませんが、役には立つでしょう。

必要なのは、WindowsパソコンOpenAIのAPIキー使用量に応じて課金される従量制プランをぜひともおすすめします)、テキストエディタ(Notepad++など)、Git(あるいは最新のAuto-GPT安定版リリース)、Python

しかし、Auto-GPTの能力を高めたいなら、必要なものはほかにもいろいろあります。言語処理や、「Pinecone」といった代わりのメモリ保管先などです。

GitHubのAuto-GPTページには、設定方法や、それらの機能を追加するやり方についての説明が多数リストアップされています。

テクノロジーメディア「Tom’s Hardware」でも、Auto-GPTを使ったAIエージェントを作成してみたい人向けに、設定方法をわかりやすく解説しているので便利です。

自分でAIエージェントを作成した場合には、トークンの使用量に注意してください。Auto-GPTに夢中になりすぎて、知らないうちにクレジットカードでお金を使い込んでしまったということにならないようにしましょう。米ライフハッカーでも、OpenAIのAPIに利用制限を設ける方法を説明しています

けれども、自分でAIエージェントを作成しなくても、Auto-GPTを試してみることは可能です。

一部の開発者が、Auto-GPTを実行できるインターフェースを構築して、ブラウザから簡単にアクセスできるようにしているからです。こちらなら、プログラミングの経験は不要です。

ウェブベースのAIエージェント「Cognosys」は無料でしたが、あまりにも需要が多く、開発者側はアクセスのためにOpenAIのAPIキーを要求するようになりました。一方、「AgentGPT」は、APIキーが不要なので興味をそそられますが、AIが自分に課すタスクの数には上限があります。

それでも、Auto-GPTの動作を体感することはできますし、APIキーを提供すれば、上限を拡大することも可能です。

Source: Mashable(1, 2, 3), GitHub, Twitter(1, 2, 3, 4), Pinecone, Tom's Hardware, Cognosys, AgentGPT