AI エンジニアのデビンが正式に公開

最近、各大メーカーのAI製品が次々と発表され、それぞれ自社の底力を競い合っています。今発表しないなら、本当に年末まで待つのですか?

12月11日に使用可能になると発表されました。

@Devinを呼び出すだけで、フロントエンドのバグ解決、バックログタスクの初稿PR作成、コードのリファクタリングなどを行ってくれます。

🔥 Devinの核心的な特徴:

1️⃣ チームとシームレスに協力し、Slack、GitHub、またはIDE(ベータ版)に直接統合します。

2️⃣ 月額$500から、エンジニアチーム向けに設計されています。

3️⃣ Devinを使用して、Devin APIの新機能構築からClerkからAuth0への移行まであらゆる作業を完了します。DevinのQAテストさえも、Devin自身が行っています!

4️⃣ 複数の人気のあるオープンソースプロジェクトに参加しており、例えばAnthropicのMCP問題を修正し、マージされたPRを提出しました:

🔗 Devinの作業プロセスを確認する:https://app.devin.ai/sessions/266955553baf40cfa7fdd32d42ab219d

🔗 マージ済みのPRを確認:https://github.com/modelcontextprotocol/inspector/pull/105



20億ドルの評価額を持つDevinのネットワークレビューを整理して確認する。

YouTube上の「Devin Review by Steve (Builder.io)」を翻訳し、整理する。

https://www.youtube.com/watch?v=oU3H581uCsA

  1. Devinのコア機能
    Devinは、プロの開発者向けのAIプログラミングエージェントであり、主な特徴には以下が含まれます:
  • Slackを基盤としたワークフロー:

    DevinとのインタラクションはIDEを通じるものではなく、更新の依頼、バグ修正、機能追加など、Slackのタグを使用して操作を行います。また、リモートサーバーのブラウズ、VS Codeでの編集、計画機能などの操作もサポートしています。

  • タスク実行およびフィードバック:

    Devinは操作手順を記録し、要点をnotes.txtに保存して後続の参照に利用します。さらに、「知識エントリー」の作成も可能で、チーム内で共有される「集団知識」を模倣します。

  1. 実際の使用体験
  • 評価者の最初のタスクは、Devinに新しい画像生成モデルを展開させることでした。Devinとのやり取りの中で、コードリポジトリを成功裏にクローンし、猫の画像を生成しました。その後、さらに多くの画像を生成することもできました。

  • Devinはまた、Webインターフェースの作成のような複雑なタスクをサポートし、プロセス中に状態更新を送信することができます。
  1. 利点と欠点
  • 利点:
    • Devinは計画を作成し、コードを記述し、バグを見つけ修正し、さらにはエンドツーエンドテストを実行することさえできます。
    • それはユーザーのフィードバックに基づいてタスクを反復処理し、自動的にプレビューURLを生成して、ユーザーが成果物を直感的に確認できるようにします。
  • 欠点:
    • 作業フローは主に非同期であり、速度が遅く、通常PRが生成されるまで約15分待つ必要があります。
    • Devinの一部のロジック説明に問題があり、時々結果が予想通りになりません。
    • 操作が比較的複雑で、ローカルでのリアルタイムデバッグを希望する開発者には適していません。
  1. カーソルとの比較
  • Devin:
    • 動作方法はより自動化に傾いており、Slackを通じて指示を受け取り、結果をフィードバックしますが、この非同期方式は効率的な開発者にとってやや不便かもしれません。(ただし、元総さんが共有したユセン社長のコメントを見ると、非同期について異なる意見があるようです。ユセン社長は、Devinが初めての本格的なasync製品であり、いつでも中断して調整できると感じています)
    • 価格設定が高く、月額500ドルから開始されるため、敷居が高いです。
  • Cursor:
    • ローカル環境でのリアルタイム操作を重視しており、開発者の習慣に合っています。
    • Cursorはコードベースを迅速にスキャンし、関連ファイルを見つけ、直接修正を行い、即時のフィードバックを提供します。

まとめ:この兄さんはCursorをより好んでいます。

動画の作者がCursorを好む理由は、彼がBuilder.ioという製品に関わっている役割と関係があるかもしれません。以下は彼が推奨するワークフローです。

X上のコメントを見る - Sharq Wyによるコメント / @sharqwy

https://x.com/sharqwy/status/1866871411551375815

Devinは単なるAIツールではなく、まるで疲れ知らずで驚異的な能力を持つクラウド上のインターンのようなものです。

Devinを使って一時間も経たないうちに、私の認識は完全に変わりました。価格は決して安くありません(月額$500)、しかし、これはただのAIアシスタントではありません。監視が必要なツール(例: @cursor_ai Composerや@windsurf_ai Cascade)とは違い、Devinは独立して作業できます。タスクを指示し、離れても、戻った時にはすでに大きな進展があります。まるで自己完結型のジュニア開発者です。

サンプルサイトを複製し、静的なブログをバックエンド管理機能を持つ動的なバージョンにアップグレードしました。

Devinのワークフローは、まるで人間の開発者が引き継いで作業を完了させたかのように見えます:

  1. :即座にFastAPIとPostgreSQLを採用し、ブログのデータ構造を設計してAPIを構築しました。
  2. :API 実現コード、テストケースの作成を行い、curl POST を使用して検証する。
  3. :UI の構築および論理の統合を行う。
  4. :シャドウブラウザにログインし、バックエンドデータを入力し、UIをテストし、フロントエンドとバックエンドの間で切り替えながらすべてが正常に動作することを確認します。

:デevin(Devin)は自分の作業をテストし、結果に対して本当に気遣いがあるかのように検証するのです。この自己検証のプロセスは、まるで「未来」を見ているような錯覚を与えます。

ウィンドサーフ(Windsurf)がアウトソーシングチームのようなものだとしたら、デevinは信頼できるインターンのように感じられます。彼は実際に重要なタスクを独立して処理できます。まだCTOほどの役割ではないため、明確な指針が必要ですが、その実行能力は新たな高みに達しています。

一言でまとめると:

CopilotやCursorはIDEに単純にAIを重ねたようなものであるのに対し、DevinはまるでAI自体がIDEを持ち、それをタスクを達成するための道具として使用しているように感じる。