Codexでブラウザ操作はできる?内部ブラウザとChrome連携の使い分け

Codexでブラウザ操作はできる?内部ブラウザとChrome連携の使い分け

Codexでブラウザ操作はできます。公開ページやlocalhostの確認は内部ブラウザ、ログイン済みサイトの確認はChrome連携を使います。

ただし、何でも任せるものではありません。ページを見る、クリックする、スクショを撮る、表示崩れを確認する。まずはこのくらいの小さい作業に使うのが安全です。

GSCでは codex ブラウザ操作 が出ています。知りたいことは、機能名よりも「何を頼めるのか」と「どこから危ないのか」です。

Codexのブラウザ操作は公開ページ確認から使う

最初に使うなら、公開ページやlocalhostの確認が向いています。

OpenAIの公式ドキュメントでも、Codexの内部ブラウザは、Codexとユーザーが同じページ表示を見ながら、Webアプリのプレビューやデバッグに使うものとして説明されています。

たとえば、こういう依頼です。

  • http://localhost:3000 を開いて表示崩れを見る
  • 公開ページのリンク切れを確認する
  • 記事公開後の og:image や見出しを確認する
  • スクショを撮って見た目を確認する
  • ボタンを押してエラーが出ないか見る

コード修正だけでは分からないものを、画面で確認できるのが強みです。

内部ブラウザはログインなしのページ向き

内部ブラウザは、Codexアプリの中で使う確認用ブラウザです。

向いているのは、ログインしなくても見られるページです。

向いている作業 公開ページ、localhost、ファイル表示、ログイン不要の確認
向いていない作業 ログイン済み管理画面、拡張機能が必要なページ、いつものChromeのCookieが必要なページ

OpenAIの公式ドキュメントでは、ログイン状態や拡張機能が必要なものは通常のブラウザ、またはCodex Chrome extensionを使うよう案内されています。

つまり、まず内部ブラウザ。ログインが必要ならChrome連携。これで十分です。

Chrome連携はログイン済みサイト用

Chrome連携は、いつものChromeのログイン状態が必要なときに使います。

たとえば、こういう場面です。

  • Search Consoleを見たい
  • Gmailを確認したい
  • WordPress管理画面を見たい
  • 社内ツールや会員ページを確認したい
  • Chrome拡張機能が必要なページを扱いたい

OpenAIの公式ドキュメントでは、Codex Chrome extensionは、ログイン済みのブラウザ状態が必要な作業で使うものと説明されています。

ただし、権限は軽くありません。Chrome拡張はWebサイトの読み書き、履歴、ダウンロード、タブ管理などに関わる権限を求めることがあります。だから、許可するサイトは絞った方がいいです。

ブラウザ操作で任せていいこと

Codexに任せやすいのは、見て確認する作業です。

  • ページを開く
  • 表示崩れを見る
  • リンクを押す
  • スクショを撮る
  • エラー表示を読む
  • 修正後の見た目を確認する

公開前チェックとも相性がいいです。記事公開後に 200で開くかアイキャッチが出ているか本文画像が消えていないか を見る作業は、毎回同じなのでCodexに向いています。

attripの運用なら、Codexアプリで内部ブラウザとChromeプラグインをどう選ぶか も続けて読むと、実作業の線引きが分かりやすいです。

ブラウザ操作で任せない方がいいこと

危ないのは、あと戻りしにくい操作です。

  • 決済する
  • 本番設定を変える
  • 個人情報を送信する
  • 削除する
  • 権限を広げる
  • 確認なしで公開する

Codexにブラウザ操作を頼むときは、読むだけ、押すだけ、保存しない、のように範囲を決めます。

特にログイン済みページでは、ページ内容をそのまま信じない方がいいです。OpenAIの公式ドキュメントでも、ページ内容は信頼できない文脈として扱い、秘密情報を貼らないよう案内されています。

依頼文はページと目的を短く書く

ブラウザ操作の依頼文は、短い方が通りやすいです。

内部ブラウザで https://attrip.jp/220703/ を開いて。
タイトル、og:image、本文画像数を確認して。
変更はしない。

ログイン済みサイトなら、こう分けます。

Chrome連携でSearch Consoleを開いて。
このURLの検索クエリだけ見て。
設定変更や送信はしない。

どのページを見るか。何を見るか。何をしないか。
この3つがあるだけで、ブラウザ操作はかなり安全になります。

FAQ

Codexでブラウザ操作はできますか?
できます。公開ページやlocalhostは内部ブラウザ、ログイン済みサイトはChrome連携を使います。
内部ブラウザとChrome連携の違いは何ですか?
内部ブラウザはログイン不要ページ向きです。Chrome連携は、いつものChromeのログイン状態が必要なページ向きです。
CodexにWordPress管理画面を操作させてもいいですか?
読むだけ、確認だけなら使いやすいです。公開、削除、設定変更は確認を入れた方が安全です。
ブラウザ操作を頼むときの最初の一文は?
このページを開いて、何を確認して、何をしないか を書きます。例は 開いて、og:imageを確認して、変更はしない です。

関連記事

参考元

Codexのブラウザ操作は小さく頼むと効く

Codexのブラウザ操作は、画面確認を速くするために使うのが近いです。

まず内部ブラウザで公開ページを見る。ログインが必要なときだけChrome連携にする。危ない操作は確認を入れる。

この線を決めるだけで、ブラウザ操作はかなり使いやすくなります。

attrip

attrip

考えたことを、記事・AI・音楽に変えて発信しています。

盆栽、音楽、ブログ運営、日々の試行錯誤について書いています。

2010年から発信中

コメントを残す