任せていい(戻せる)
下書き・要約・調査・たたき台のコード・整形。手元で完結し、気に入らなければ捨てられる作業。どんどん任せて時間を稼ぎます。
AIエージェントは、文章を書くだけでなく、実際にファイルを書き換え、コマンドを実行し、外部サービスにアクセスします。 便利さの裏返しで「気づいたら公開されていた」「課金が膨らんでいた」「消してはいけないものを消していた」も起こり得ます。 この資料では、Hiroの目線で、事故が起きやすい4ゾーン(公開・個人情報・課金・削除)と、「下書きまでは任せ、取り消せない一手は人間が握る」運用への落とし込みを整理します。
AIに任せていい作業と、人間が最後を握る作業。これを分ける基準はシンプルです。 「失敗してもやり直せるか」。下書き・調査・整形・コード生成のように元に戻せる作業は積極的に任せます。 公開・送信・課金・削除のように取り消せない、または外部に影響する作業は、AIに準備までさせても、最終実行は人間が行います。
下書き・要約・調査・たたき台のコード・整形。手元で完結し、気に入らなければ捨てられる作業。どんどん任せて時間を稼ぎます。
設定変更・ファイル編集・コミット。影響はあるが、差分を見て戻せる作業。AIに動かさせつつ、結果を必ずレビューします。
公開・送信・課金・削除。外部に出る、お金が動く、元に戻らない作業。AIに準備させても、引き金は人間が引きます。
少し前まで、AIは文章や案を返すだけでした。いまのAIエージェントは、実際にファイルを書き換え、コマンドを走らせ、必要なら外部サービスにアクセスします。 手間が一気に減る反面、「人間が止める前に、取り返しのつかない操作まで進んでしまう」リスクが新しく生まれました。
「投稿しておいて」「いらないファイルを消して」に、AIは素直に従います。確認のひと言がなければ、そのまま実行されます。
送信したメール、公開した投稿、走った決済、消したデータ。Gitと違って「元に戻す」が効かない操作は世の中に多くあります。
一度ネットに出た情報は、削除してもキャッシュや保存、転載で残る前提です。「あとで消す」は通用しません。
漏れた鍵の差し替え、膨らんだ請求の交渉、消えたデータの復旧。防ぐ手間より、起きてからの手間のほうがずっと大きいです。
AIは堂々と「やっておきました」と返すことがあります。本当に実行されたか、結果は正しいかは、人間が実物で確かめる必要があります。
事故の多くは攻撃ではなく、指示の取り違えや勢いで起こります。だからこそ「線引き」という仕組みで防ぐのが現実的です。
作業を頼む前に、頭の中で3つの質問を通すだけで、ほとんどの事故は防げます。1つでも「はい」なら、それは人間が最後を握るゾーンです。
| 立ち止まる質問 | はいなら | 具体例 |
|---|---|---|
| 外部に出る・誰かに届くか? | 公開ゾーン | 投稿・送信・デプロイ・共有リンク発行 |
| 個人情報や秘密情報が混ざるか? | 個人情報ゾーン | 顧客名・連絡先・APIキー・パスワード |
| お金が動く・契約が発生するか? | 課金ゾーン | 決済・サブスク契約・従量課金API |
| 元に戻せない変更か? | 削除ゾーン | ファイル削除・上書き・データの一括削除 |
AIに任せて困るパターンは、突き詰めるとこの4つに集約されます。それぞれ「なぜ危ないか」「どこまで任せていいか」「どこから人間が握るか」を、このあと1つずつ見ていきます。
投稿・メール送信・本番デプロイ。外に出たら取り消せず、消しても痕跡が残ります。
顧客データや鍵・トークン。AIに渡す・出力に混ぜる・コミットするのが漏えいの入口です。
決済・サブスク・従量課金API。気づかないうちに請求や契約が発生します。
ファイル削除・上書き・一括削除。復旧が難しく、バックアップがないと致命傷になります。
一番事故が表に出やすいゾーンです。外部に出た瞬間に取り消せず、削除してもスクリーンショット・キャッシュ・転載で残る前提で扱います。 「下書きはAI、出すのは人間」を徹底するだけで、誤投稿や情報の出し過ぎを防げます。
投稿文(メール文面)は作って。
ただし実際の投稿・送信はしないで。
私が最終確認してから自分で出します。
顧客名・連絡先・APIキー・トークン・パスワード。これらをAIに渡したり、出力に混ぜたり、コードと一緒に保存したりするのが、漏えいの典型的な入口です。 本物を扱う必要があるかを最初に問い、必要ないならダミーやサンプルで進めます。
本物の顧客データや鍵・トークンは使わないで。
名前は「顧客A」、鍵は「sk-xxxx」のようなサンプルに置き換えて進めて。
本物の値は、最後に私が自分の手で差し込みます。
見落としやすいのがこのゾーンです。決済の実行、サブスクの契約、有料プランへの変更、そして従量課金APIの大量呼び出し。 どれも「気づいたら請求が来ていた」になりがちです。お金が動く操作は、金額と上限を人間が確認してから実行します。
課金・契約・有料プランへの変更が発生する操作は、実行前に必ず止めて。
いくらかかるか、月額か従量か、上限はどうなるかを先に教えて。
実行は、私が金額を確認してから自分でやります。
ファイルの削除や上書き、データの一括削除、履歴の書き換え。これらは復旧が難しく、バックアップがないと取り返しがつきません。 「何を消すか」の調査は任せていいですが、「実際に消す」操作の前には必ず一度止めます。
消す・上書きする前に、対象を一覧にして見せて。
実際の削除はまだ実行しないで止めて。
バックアップを取ってから、私が確認して進めます。
危ないゾーンでも、AIを使わないという話ではありません。作業を「準備」と「実行」に分け、準備はAIに任せ、引き金だけ人間が引く。この一手間で、スピードを保ったまま事故を防げます。
文面・コード・整理案・候補リストをAIに作らせます。ここはどんどん任せて、たたき台を量産します。
出てきたものを自分の目で確認します。出し過ぎ・秘密情報・金額・削除対象をチェックします。
公開・送信・課金・削除の引き金は、人間が引きます。AIに「やっておいて」とは言いません。
特別な設定はいりません。最初の依頼文に「実行前に止めて」を添えるだけで、AIは準備までで待つようになります。よく使う型をまとめました。コピーして使ってください。
公開・送信・課金・削除に当たる操作は、実行する前に必ず私に確認して。
案や下書きを出すところまでで一度止めて、私の「OK」を待って。
ファイルを変更・削除する前に、何をどう変えるかを一覧で見せて。
私が中身を確認してから進めたいので、勝手に実行はしないで。
本物の顧客データ・鍵・トークンは使わないで。
サンプル値で進めて、本物は最後に私が差し込みます。
料金が発生する操作の前に、いくらかかるか、上限はどうなるかを先に教えて。
実行は、私が金額を確認してからにして。
公開・送信・課金・削除のボタンを押す直前に、この6つを通します。1つでも引っかかったら、その手は止めます。
迷ったらここ。左の作業は積極的に任せ、右の作業は人間が最後の引き金を引きます。
| ゾーン | AIに任せていい(準備) | 人間が握る(実行) |
|---|---|---|
| 公開・送信 | 投稿文・メールの下書き、公開前チェック | 投稿・送信・本番デプロイの実行 |
| 個人情報・秘密 | ダミーデータでの作業、伏せた相談 | 本物の鍵・顧客データの入力と送信 |
| 課金・契約 | 料金の試算・比較、テストモード検証 | 決済・契約・有料プラン変更の実行 |
| 削除・破壊 | 削除候補の一覧、影響範囲の調査 | ファイル削除・上書き・一括削除の実行 |
| 調査・下書き | 要約・たたき台・コード生成・整形 | (基本そのまま任せてOK) |
各サービスの仕様・料金・対象プランは更新される可能性があります。公開・配布前に公式ページで最終確認してください。本資料は安全運用の考え方を整理したもので、特定の操作の安全性を保証するものではありません。