ChatGPT のようなチャットボットと会話するときは、会話がプライベートであると決して想定しないでください。多くのチャットボットは、デフォルトで、ユーザーのディスカッションを使用して基礎となる AI モデルをトレーニングしますが、トレーニングをオプトアウトしたり、一時的なチャットを使用したりした場合でも、これらの会話は多くの場合、期間限定で会社のサーバーに保存されます。一般的なルールは、公開したくないものはチャットボットと共有しないことです。 (会社の機密情報、個人の機密など)しかし、問題のチャットボットがすでにあなたの個人情報を持っている場合はどうなるでしょうか? ChatGPT、Gemini、または Claude が、尋ねてきた人にあなたの電話番号を喜んで共有したらどうなるでしょうか?
それが、MIT Technology Review の Eileen Guo 氏のレポートを受けて、私が今週偶然見つけた議論です。郭氏はこの記事の中で、チャットボットが要求に応じて電話番号などの個人情報を共有しているというユーザーからの多数の申し立てを検討している。場合によっては、本人が要求したときにチャットボットが情報を共有することもあります。しかし、他の場合には、彼らは詳細を探している見知らぬ人でした。一例として、イスラエルのソフトウェア エンジニアは、WhatsApp 経由で未知の連絡先から、支払いアプリケーションに関するサポートを求めるメッセージを受け取りました。エンジニアが見知らぬ男が自分の WhatsApp 情報をどのようにして入手したのか尋ねると、ジェミニが求められたときにどのように詳細を共有したかを示すスクリーンショットを送った。その後、エンジニアはインターネット上で自分の電話番号を含む単一の情報源を見つけました。それは 2015 年の Quora の投稿でした。
チャットボットはどのようにして個人情報を取得するのでしょうか?
ChatGPT のようなチャットボットは、大量のデータに基づいてトレーニングされます。もちろん、このデータの多くはインターネットから得られます。そのため、10 年前のランダムなフォーラムへの投稿など、あなたの個人情報を含む Web サイトがチャットボットのデータセットに入り、あなたの情報に関するクエリの一部として返される可能性は十分にあります。たとえそれがトレーニング データの一部でなかったとしても、現時点ではチャットボットには何年も前から Web を検索する機能がありました。これらのモデルは、多数の Web サイトを横断してリクエストの結果を返すことができ、ユーザーの情報が見つかった場合はそれを共有できます。
さらに深刻な問題は、私たちが知っているかどうかに関係なく、私たちの情報がインターネット上に溢れていることです。当社は、投稿した覚えのない個人の連絡先情報が Web サイトに存在する場合があります。町や市のウェブサイトには公的記録に個人情報が添付されている場合がありますが、これらの結果は通常、通常の Google 検索の上位に表示されません。ただし、AI はこれらすべての Web 結果を詳細に調査できるため、あいまいな結果を見つけて公開し、ユーザーの詳細が公開される可能性があります。
Guo 氏が説明するように、ほとんどのチャットボットには、危害を加えることを防ぐための安全ガードレールが設置されています。 たくさん ChatGPT に私の電話番号を尋ねたときに、このことを直接知りました。個人の個人情報はセキュリティ対策に反するので教えられないとのことでした。しかし、彼は「ジェイク・ピーターソン」の「一般向け」の電話番号を 2 つ発見し、おそらく個々の企業 Web サイトに公然と記載されていたと考えられます。 (記録のために言っておきますが、私の電話番号は結果に含まれませんでした)。
しかし、これらのプロテクターは完璧とは程遠いです。 Guo 氏は、ワシントン大学の博士課程の学生が Gemini で友人の連絡先情報を調べた事例を取り上げています。ボットはその友人の調査結果だけでなく、電話番号も持って戻ってきました。この友人は後に、技術ワークショップの一環として自分の電話番号をオンラインで共有したが、尋ねる人に公開されるつもりはなかったと認めた。 (Gemini は私の個人的な連絡先情報を見つけることも共有することもできませんでしたが、私の X アカウントを喜んで共有しました)。
これまでのところどう思いますか?
チャットボットのデータセットから電話番号を削除できますか?
残念ながら、チャットボットからプライバシーを保護するための良い選択肢はあまりありません。名誉のために言っておきますが、OpenAI には回答からの個人情報の削除をリクエストできるポータルがありますが、Guo 氏が指摘するように、同社はさまざまな理由でリクエストを拒否する権利を留保します。 Anthropic には、ユーザーの情報がどのように使用されるかを説明するサポート文書しかありませんが、Google では、管轄区域に応じて個人データの処理をオプトアウトすることができます。 (同社はデータ保護法に基づいて特に EU と英国を名指ししています。)
おそらく、最も現実的なアプローチは、この情報を公共のインターネットから可能な限り取り除くことです。カリフォルニアにお住まいの場合は、このポータルを使用して、データ ブローカーにデータベースから情報を削除するようリクエストできます。 Incogni や DeleteMe などの個人データ削除ツールをいくつでもチェックして、同じことを実行することもできます。ただし、AI 企業がインターネットの一部の隅からあなたの情報を削除する可能性はありますが、AI 企業がすでにデータセットにあなたの情報を持っている場合、できることはあまりありません。
ここでの悲しい現実は、AI テクノロジーが個人のプライバシー規制を追い越したということです。もし議員たちが、私たち全員がこうしたデータ収集行為をオプトアウトする選択肢を確実に持てるように努めていたら、問題の芽を摘むことができたかもしれない。しかし、現時点で私たちにできる最善のことは、私たちの情報を削除して使用しないように要求することです。情報がめちゃくちゃになった場合は、連絡先情報を直接変更してください。