
エージェントがAGIへの道であるとずっと言われてきました。以前、清华大学のChatDevについて多くの人が話していたことを思い出しました。今日はそれを学んでみます。
ソフトウェア工学は、複雑な意思決定プロセスを特徴とする分野であり、しばしば微妙な直感や相談に依存します。深層学習の最近の進展により、ソフトウェア開発の各段階で精密な設計を実施することで、ソフトウェア工学の慣行が革新されつつあります。本論文では、大規模言語モデル(LLMs)をソフトウェア開発プロセス全体に活用し、自然言語通信を通じて主要なプロセスを簡素化・統一する革新的なパラダイムを提案します。これにより、各段階で専用のモデルが必要になることがなくなります。このパラダイムの中心にあるのはCHATDEVです。これはチャット駆動型の仮想的なソフトウェア開発会社で、開発プロセスをデザイン、コーディング、テスト、ドキュメンテーションという4つの異なるフェーズに細かく分割します。各フェーズにはプログラマーやコードレビュアー、テストエンジニアなどのチームが参加し、協力的な対話を促進してスムーズなワークフローを実現します。チャットチェーンは、各フェーズを原子的なサブタスクに分解する役割を果たします。これにより、文脈に敏感なコミュニケーションを通じてソリューションを提示し検証し、特定のサブタスクを効率的に解決することが可能になります。CHATDEVの重要な分析結果は、ソフトウェア生成におけるその顕著な効率性を示しており、わずか7分以内に1ドル以下のコストでソフトウェア開発プロセス全体を完了させることができます。また、潜在的な脆弱性を識別し軽減し、称賛すべき効率性とコスト効率を維持しながら潜在的な「誤った認識」を修正します。CHATDEVの可能性は、LLMsをソフトウェア開発分野に統合する新しい可能性を明らかにしています。
Collaboration allows us to know more than we are capable of knowing by ourselves. It empowers us to think differently, access information we wouldn’t have otherwise, and combine ideas as we work together towards a shared goal.
— Paul Solarz

異なるエージェントが異なる専門家を演じ、ゲームの開発を共同で完成させる仕組みです。そして、異なる役割間でのコミュニケーションだけでなく、反省の要素も追加されています。

- 「メモリーフロー」は、各ロボットの毎回の対話記録を保存し、いつでも読み戻せるようにすることで、思考の連続性を確保します。
- 「自己反省」メカニズムは、ロボットがそれぞれの作業を完了したが要件を満たしていない場合、問題と関連する対話を「擬似自我」に集約し、それを指導者にフィードバックするものです。

しかし、論文だけが公開されており、コードがオープンソース化されておらず、デモも公開されていないので、再現することができません。
Paper のアドレス:https://arxiv.org/abs/2307.07924