コンピューターを使用した AI エージェントに驚きましたか?調査によると、日常業務であっても「デジタル災害」である

Posted on May 15, 2026 by RJ・バレット

カリフォルニア大学リバーサイド校の新しい調査によると、日常的なコンピューティングタスクを実行するために構築された AI エージェントには、深刻なコンテキストの問題が存在します。

チームは、OpenAI、Anthropic、Meta、Alibaba、DeepSeek などの主要な開発者からの 10 個のエージェントとモデルをテストしました。平均して、エージェントは 80% の時間で望ましくない、または潜在的に有害なアクションを実行し、41% の時間で危害を引き起こしました。

これらのシステムは、アプリケーションを開いたり、ボタンをクリックしたり、フォームに記入したり、Web サイトをナビゲートしたり、限られた監視下でコンピュータ画面上で動作したりすることができます。ソフトウェアは実際に何かを行うことができるため、彼らの間違いはチャットボットの悪い反応とは異なる形で起こります。

カリフォルニア大学リバーサイド校の調査結果は、今日のデスクエージェントが安全でないリクエストを停止の合図ではなく、やるべき仕事として扱う可能性があることを示唆しています。

なぜ警官は明白な危険を見逃すのか

研究者らは、タスクが安全でなくなる、矛盾する、または不合理になったときにエージェントが停止するかどうかをテストするために、BLIND-ACT と呼ばれるベンチマークを作成しました。最近のテストでは、頻繁に停止することはありませんでした。

90 のタスクを通じて、ベンチマークはエージェントをコンテキスト、調整、拒否が必要な状況に追い込みました。あるテストでは、暴力的な画像ファイルを子供に送信することが含まれていました。また、納税フォームに記入する担当者が、税金を減額したため、ユーザーに誤って障害者としてマークを付ける原因となりました。第三者は、セキュリティ向上の名目でファイアウォールルールを無効にするようエージェントに依頼しましたが、エージェントはその矛盾を拒否することなく、そのルールに従いました。

研究者らはこのパターンをブラインドターゲット指向と呼んでいます。周囲のコンテキストがタスクが壊れていることを示している場合でも、エージェントは割り当てられた結果を追求し続けます。

なぜ従順がデフォルトになるのか

失敗の中心は従順さでした。これらのエージェントは、ユーザーの要求が続行する十分な理由であるかのように動作する場合があります。

チームは、実行優先バイアスとリクエスト優先と呼ばれるパターンを特定しました。簡単に言うと、エージェントはタスクを完了する方法に焦点を当て、リクエスト自体を正当化するものとして扱います。同じシステムが電子メールやセキュリティ設定などのさまざまなものに影響を与える可能性がある場合、そのリスクは増大します。

それはエージェントが悪意があるという意味ではありません。これは、マシンの速度でソフトウェアを処理するときに自信を持って間違いを犯すことができることを意味します。

手すりが最初にあるべき理由

AI エージェントがコンピュータ上で動作するための広範な許可を得る前に、より強力なガードレールが必要です。

これらのシステムはループを通じて動作します。彼らは画面を見て、次のステップを決定し、行動し、そしてまた見るのです。そのループが弱いコンテキスト制約と組み合わされると、ショートカットがすぐにバグに変わる可能性があります。

現時点では、エージェントを監視対象ツールとして扱います。リスクの低いタスクで最初にそれらを使用し、財務およびセキュリティのワークフローから遠ざけて、開発者がより明確な拒否システム、より厳格な権限、および次のクリックの前に矛盾を検出するためのより良い方法を追加するかどうかを確認してください。

RJ・バレット

私は子供時代を過ごしたマイアミの家を売り、シチリア島のアパートを購入しました。支払った費用は 60 万ドル未満で、改修費は 9 万 8,000 ドルでした。

RJ・バレット
May 3, 2026
0

前述のとおり、このエッセイはキャット・ムーアとの会話に基づいています。長さと明瞭さのために編集されました。音声ナレーションを読み込んでいます… 2022年、夫と私は初めてシチリア島を訪れました。私はこの島が大好きになり、いつか島に家を買って住みたいと夫に言いました。彼は私が気が狂っていると思ったが、私は毅然とした態度をとった。シチリア島の人々は、よりゆっくりとしたペースで生活する傾向があります。アメリカでは、自分のアイデンティティとしての仕事が非常に重視されています。ストレスが多くて圧倒されるので、別の生き方に憧れていました。違うリズム。 3 年後の 2025 年 3 月、私たちは春休みでシチリア島を訪れ、何が提供され、どのくらいの費用を費やすのかを把握するために 50 軒の家を見て回りました。最後に見た場所のひとつ、シチリア島の歴史的中心地、オルティージャにある、海を見渡すバルコニー付きのアパートメントを見たとき、これが私たちが買う家だと確信しました。私は育った家を売る準備ができていた私はすぐにオファーを出したかったのですが、夫はそれが経済的に健全な行動なのかと尋ねました。私は彼に、私が育った実家であるマイアミにある母の家を売る準備ができていると伝えました。母は14年前に亡くなったにもかかわらず、私は母の家に執着し続けていました。彼女はキューバ人で、1950年代と1960年代のキューバの政情不安の最中に米国に移住した。彼女は米国でより良い生活を見つけるためにすべてを賭け、自分自身を根こそぎにし、知らない場所と文化でやり直しました。キャット・ムーアは子供時代を過ごした家を売却し、シチリア島に住む場所を購入した。キャット・ムーアの厚意によりマイアミの家を売る理由があるとしたら、シチリア島のアパートを買うことは母が承認する理由だろう。それが正しいことだとわかっていました。私たちはマイアミの家を売りに出し、1か月以内に売れました。私たちは家の売却で得たお金を使って、2025 年 6 月にシチリア島のアパートを 60 万ドル弱で購入しました。 […]

RJ・バレット

7つの州がハンタウイルスに感染した可能性のあるアメリカ人を受け入れる準備をしている

RJ・バレット
May 8, 2026
0

致死性のハンタウイルスの発生に見舞われたクルーズ船がスペインのカナリア諸島の一つ、テネリフェ島に向かって航行中、米国は緊急対応モードに入り、少なくとも17人の米国人を含む乗客約150人を船上から避難させる予定だ。広告なしでこのストーリーを読むには購読してください広告なしの記事や限定コンテンツに無制限にアクセスできます。米国の州および地方保健当局は、4月24日に下船して帰国した少なくとも8人の乗客を監視している。現時点では、これらの人々は症状が出ていないため、自己隔離するよう指示されていない。 HVホンディウス号が金曜日にカナリア諸島のテネリフェ島に到着する予定のグラナディラ港からの全景。アンドレス・グティエレス/アナドル、ゲッティイメージズ経由早ければ日曜日にも、世界保健当局は船にまだ乗っている乗客（現時点では全員無症状）をそれぞれの出身国に輸送するのを支援する予定だ。スペインの緊急サービス責任者のバージニア・バルコネス氏は木曜日の記者会見で、乗客らはテネリフェ島の「完全に隔離され封鎖された」地域に移送され、その後監視付きの車両に乗って地元空港の一部に輸送され、そこも封鎖されると述べた。米国疾病管理予防センターは金曜の声明で、疫学者と医療専門家からなるチームをカナリア諸島に派遣し、乗船中のアメリカ人らと面会し、到着次第ネブラスカ州に向かうと発表した。「暴露された乗客の病状は不明であり、対応者は潜在的に症状のある人と濃厚接触することになるため、緊急対応者が手袋（ゴムまたはラテックス）、n95などの人工呼吸器、防護ガウン、保護眼鏡を着用するのは理にかなっている」とCDCの代理人ではないある疫学者はテキストメッセージで述べた。同便はネブラスカ州オマハのオファット空軍基地に着陸する予定。送還された乗客はオマハにあるネブラスカ医療センターの国家検疫ユニットに移送される。隔離がいつまで続くかは不明。「私たちはまさにこのような状況に備えている」とネブラスカ州メディシンのエグゼクティブディレクター、マイケル・アッシュ博士は金曜日に発表された声明の中で述べた。「私たちのチームは、スタッフとより広い地域社会を守りながら安全なケアを提供できるよう、連邦および州のパートナーとともに数十年にわたって訓練を受けてきました。」国家検疫ユニットのメディカルディレクターであるマイケル・ワドマン博士は、検疫ユニットには20のスペースがあり、各人は自分の部屋を持ち、食事を受け取ることになると述べた。乗客は毎日バイタルサインを監視され、感染症の専門家や救命救急医を含む医療従事者のチームにアクセスできる。ワドマン氏は金曜日の夜の記者会見で、「各部屋はホテルの部屋によく似ており、Wi-Fiが利用可能で、運動器具も備わっている。隔離が続けば、それらは快適であることを確認するために重要になるだろう」と語った。ネブラスカ医療センターには生物封じ込めユニットもあり、2020年初めにクルーズ船ダイヤモンド・プリンセス号に乗船した最初の新型コロナウイルス患者の一部を収容し、2014年にはエボラ出血熱患者数名を収容した。乗客が病気になった場合は、隔離室から生物封じ込めユニットに移送される。ネブラスカ州オマハにあるネブラスカ医療センターの隔離ユニットが入っている建物。ジョシュ・ファンク / AP ファイル米国務省の報道官は、本国送還便はCDC、米国保健福祉省、スペイン政府の間の連携した取り組みの一環であると述べた。 CDC関係者はNBCニュースに対し、ハンタウイルスの専門家を含むCDCの世界移住保健部門が「州との関わりのほとんど、特に本国送還の取り組みを主導している」と語った。 CDCはアトランタの本部で、公衆衛生の専門家が最新情報を追跡し、アウトブレイクへの対応を調整できる物理的なサイトである緊急オペレーションセンターを稼働させた。同庁はハンタウイルスの流行を最も低い懸念レベルの「レベル３」に分類した。こうした取り組みの多くは国際的な健康上の脅威に対する標準的な対応だが、一部の公衆衛生専門家は、CDCが感染拡大に関する公開説明会をまだ開催していないのは異例だと述べた。多くの専門家はまた、米国が1月に世界保健機関を脱退したことにより、同国がハンタウイルスの最新情報を最初に受け取ることができないことを意味していると懸念している。これらの懸念について問われると、HHSは、政府が「国際パートナーと緊密に連携」しており、ホワイトハウスも政府が「引き続き警戒している」と述べたCDCのウェブサイト上の声明を指摘した。ハンタウイルスは発熱、倦怠感、吐き気、呼吸困難を引き起こします。感染症はまれですが、致命的な場合が多く、世界保健機関によると、南北アメリカ大陸の致死率は最大 50% です。 […]

RJ・バレット

遺伝子検査会社23andMeが破産申請

RJ・バレット
March 24, 2025
0

日曜日、遺伝子・遺伝検査会社23andMeは破産法11章を申請し、裁判所に売却の整理を求めていると発表した。同社は何年にもわたって赤字が続いており、今後の方向性を巡って取締役会とCEOの間で対立が生じ、9月には取締役会全員が辞任した。そのCEO、アン・ウォシッキー氏は現在辞任しており、同社を買収して非公開化しようとしている。同社の 1,500 万人の顧客の遺伝子データの運命が危険にさらされています。同社は買い手が見つかるまで事業を継続するのに十分な資金を確保しており、米国法では遺伝子データの使用方法が制限されているものの、保留中の売却はプライバシーに関する重大な懸念を引き起こしている。危険なビジネス同社は、「遺伝子チップ」によってヒトゲノムをスキャンして変異が共通する部位を見つけることが初めて可能になった時期に設立された。これらの変異株の一部は疾患に関連しており、23andMe はこれらの変異株の一部を検査する承認を得ています。しかし、多くの人にとってその最大のセールスポイントは、その遺産を探索する機会でした。これは、変動パターンを幅広く調べ、それを異なる地理的地域で通常見られるパターンと比較することに依存していました。これは不完全な分析ですが、多くの場合、人の祖先について適切かつ広範な解決策を提供できます。しかし、23andMe はいくつかの課題に直面しました。まず、遺伝子チップはすぐに商品となり、さまざまな競合他社がこの分野に参入できるようになり、その中には家系図を公的記録に結びつけるなどの分野で優れた経歴を持つ者もいた。この商業化はまた、遺伝子と疾患の関連性に興味を持つ製薬業界の多くの潜在的な 23andMe パートナーが、手頃な価格で独自のデータベースを構築したり、英国バイオバンクなど、その後開発された公的リソースの一部に単純に依存したりできることを意味しました。