Codexでブラウザ操作はできます。公開ページやlocalhostの確認は内部ブラウザ、ログイン済みサイトの確認はChrome連携を使います。
ただし、何でも任せるものではありません。ページを見る、クリックする、スクショを撮る、表示崩れを確認する。まずはこのくらいの小さい作業に使うのが安全です。
GSCでは codex ブラウザ操作 が出ています。知りたいことは、機能名よりも「何を頼めるのか」と「どこから危ないのか」です。
Codexのブラウザ操作は公開ページ確認から使う
最初に使うなら、公開ページやlocalhostの確認が向いています。
OpenAIの公式ドキュメントでも、Codexの内部ブラウザは、Codexとユーザーが同じページ表示を見ながら、Webアプリのプレビューやデバッグに使うものとして説明されています。
たとえば、こういう依頼です。
http://localhost:3000を開いて表示崩れを見る- 公開ページのリンク切れを確認する
- 記事公開後の
og:imageや見出しを確認する - スクショを撮って見た目を確認する
- ボタンを押してエラーが出ないか見る
コード修正だけでは分からないものを、画面で確認できるのが強みです。
内部ブラウザはログインなしのページ向き
内部ブラウザは、Codexアプリの中で使う確認用ブラウザです。
向いているのは、ログインしなくても見られるページです。
| 向いている作業 | 公開ページ、localhost、ファイル表示、ログイン不要の確認 |
|---|---|
| 向いていない作業 | ログイン済み管理画面、拡張機能が必要なページ、いつものChromeのCookieが必要なページ |
OpenAIの公式ドキュメントでは、ログイン状態や拡張機能が必要なものは通常のブラウザ、またはCodex Chrome extensionを使うよう案内されています。
つまり、まず内部ブラウザ。ログインが必要ならChrome連携。これで十分です。
Chrome連携はログイン済みサイト用
Chrome連携は、いつものChromeのログイン状態が必要なときに使います。
たとえば、こういう場面です。
- Search Consoleを見たい
- Gmailを確認したい
- WordPress管理画面を見たい
- 社内ツールや会員ページを確認したい
- Chrome拡張機能が必要なページを扱いたい
OpenAIの公式ドキュメントでは、Codex Chrome extensionは、ログイン済みのブラウザ状態が必要な作業で使うものと説明されています。
ただし、権限は軽くありません。Chrome拡張はWebサイトの読み書き、履歴、ダウンロード、タブ管理などに関わる権限を求めることがあります。だから、許可するサイトは絞った方がいいです。
ブラウザ操作で任せていいこと
Codexに任せやすいのは、見て確認する作業です。
- ページを開く
- 表示崩れを見る
- リンクを押す
- スクショを撮る
- エラー表示を読む
- 修正後の見た目を確認する
公開前チェックとも相性がいいです。記事公開後に 200で開くか、アイキャッチが出ているか、本文画像が消えていないか を見る作業は、毎回同じなのでCodexに向いています。
attripの運用なら、Codexアプリで内部ブラウザとChromeプラグインをどう選ぶか も続けて読むと、実作業の線引きが分かりやすいです。
ブラウザ操作で任せない方がいいこと
危ないのは、あと戻りしにくい操作です。
- 決済する
- 本番設定を変える
- 個人情報を送信する
- 削除する
- 権限を広げる
- 確認なしで公開する
Codexにブラウザ操作を頼むときは、読むだけ、押すだけ、保存しない、のように範囲を決めます。
特にログイン済みページでは、ページ内容をそのまま信じない方がいいです。OpenAIの公式ドキュメントでも、ページ内容は信頼できない文脈として扱い、秘密情報を貼らないよう案内されています。
依頼文はページと目的を短く書く
ブラウザ操作の依頼文は、短い方が通りやすいです。
内部ブラウザで https://attrip.jp/220703/ を開いて。
タイトル、og:image、本文画像数を確認して。
変更はしない。
ログイン済みサイトなら、こう分けます。
Chrome連携でSearch Consoleを開いて。
このURLの検索クエリだけ見て。
設定変更や送信はしない。
どのページを見るか。何を見るか。何をしないか。
この3つがあるだけで、ブラウザ操作はかなり安全になります。
FAQ
Codexでブラウザ操作はできますか?
内部ブラウザとChrome連携の違いは何ですか?
CodexにWordPress管理画面を操作させてもいいですか?
ブラウザ操作を頼むときの最初の一文は?
関連記事
- Codexアプリでブラウザ操作を使うなら、内部ブラウザとChromeプラグインをどう選ぶか
- Codex Mac appの使い方を初心者向けに解説
- Codex Usage URLはどこ?最初に開くページとBillingの違い
- Codexで止まりやすい原因まとめ
参考元
- OpenAI Developers: In-app browser
- OpenAI Developers: Codex Chrome extension
- OpenAI Help Center: Using Codex with your ChatGPT plan
Codexのブラウザ操作は小さく頼むと効く
Codexのブラウザ操作は、画面確認を速くするために使うのが近いです。
まず内部ブラウザで公開ページを見る。ログインが必要なときだけChrome連携にする。危ない操作は確認を入れる。
この線を決めるだけで、ブラウザ操作はかなり使いやすくなります。