Browser-useを試してみよう:ローカルブラウザ自動化の新しいアプローチ

今日はオープンソースプロジェクトCUA(Computer-Using Agent)プロジェクトのBrowser-useを実験しました。AIに直接ローカルブラウザを制御させることができます。GitHubでのスター数が急速に増加しています。

https://github.com/browser-use/browser-use

🌐 Browser-useとは何ですか?

最も簡単な方法で、自動化されたウェブページ操作を行うことができます。例えば:

  • (クリック、入力、スクロールなど)
  • (データ分析、自動レポート作成などに適しています)
  • (ChatGPTによる自動フォーム入力、自動検索機能などを実現できます)

が提供されており、これを使えばローカル設定の手間を省いて直接試すことができます。

🛠 コードを試してみる:Browser-useを体験する

により、より安全で柔軟です。

例えば、与えたタスクは「飛行機のチケットを予約してくれ」✈️

最終的に私はユーザ名とパスワードを入力して支払うだけでした。

以下はAIの一部の操作プロセスです。

🤖 公式デモ



求職活動👷🏻‍♂️

Prompt: Read my CV & find ML jobs, save them to a file, and then start applying for them in new tabs, if you need help, ask me.




モデルファイルのダウンロード📃

Prompt: Look up models with a license of cc-by-sa-4.0 and sort by most likes on Hugging face, save top 5 to file.


💡 Windsurfをほめておきます!

人には特にぴったりです。いくつか本当に素晴らしい点があります:

  • :PythonバージョンやNPMインストールなどの煩雑な作業を気にせず、すぐに準備が整います。

  • :Browser-useのコードを調整したいとき、自分でドキュメントを読みながらデバッグする必要がなく、Windsurfに自動修正を依頼できます。

  • :デフォルトのユーザー情報やAPIキーなどを自動で設定できるため、多くの手間が省けます。

Windsurfのおかげで、コードを書く時の挫折感が大幅に減りました。「コード好き派」にとってまさに福音です😂。