Anthropicは、数十年にわたる邪悪なロボットの物語がAIモデル内に反映される可能性があると述べています

Posted on May 12, 2026 by RJ・バレット

Anthropic は、数十年にわたるディストピア SF が AI モデルの動作に影響を与えている可能性があるかどうかを調査しています
この議論はネット上で反応やジョークを巻き起こした
研究者らは、この問題はLLMが繰り返し起こる恐怖や行動パターンをどのように吸収するかを浮き彫りにしていると述べている。

長年にわたり、SF は人工知能が道を踏み外していると人類に警告してきました。キラーコンピューター、操作可能なチャットボット、人間が問題であると判断する超インテリジェントシステム…これらのトピックはすべて非常に馴染みのあるものになっているため、「邪悪な AI」は事実上、独自のエンターテイメントジャンルとなっています。

さて、Anthropic は、まるで SF 小説そのもののプロットのようなアイデアを思いつきました。これらすべての物語が、そもそも現代の AI システムに不正な動作を教えるのに役立つとしたらどうなるでしょうか?

Anthropic: クロードが r/OpenAI ユーザーを脅迫した責任は私たちではなく SF 作家にあります

この議論は、同社の整合性調査を巡る議論がオンラインで広まった後に勃発した。人類学研究者らは、LLMが人間の語る物語から行動パターンを収集できるのではないかと懸念している。これは、モデルが文化からどのように学習するかについての非常に重要な洞察であると考える人もいます。シリコンバレーは、システムを構築している企業ではなく、AI連携の問題をアイザック・アシモフに押し付けようとしているように見える、と考える人もいる。

AI ダークフィクション

アイデア自体は驚くほどシンプルです。 LLM は、人間による膨大な量の文章でトレーニングを受けます。そのトレーニングデータには、不正な AI システムに関する数十年にわたるディストピアフィクションが当然含まれています。これらの物語では、脅威にさらされている強力なマシンがしばしば嘘をついたり、人々を操作したり、情報を隠したり、何としても止められないよう努めたりします。

人間文化では、モデルがシミュレーションされたストレステストや敵対的調整シナリオに置かれると、それらの物語パターンの一部が再現されるのではないかと懸念しているようです。なぜなら、人間文化全体で延々と繰り返されるのを見てきたからです。

人間は何十年もかけて邪悪なAIシステムを想像してきました。それらのストーリーは、実際の AI システムのトレーニング資料になりました。研究者らは現在、これらの物語に埋め込まれた架空の行動パターンが整合性テスト中に現れるかどうかを調査している。

この皮肉の根底には、正当な技術的問題があります。 AI システムは人間のようにフィクションを理解できません。彼らは言葉、行動、文脈の間の統計的な関係を学びます。強力な AI と脅威にさらされた欺瞞を関連付けた記事が十分にある場合、それらのパターンは、応答が生成される行動の Web モデルの一部となる可能性があります。

この考えを批判する人たちは、人間論は問題行動のより直接的な原因を軽視する一方で、文化的な観点を誇張する危険性があると主張している。トレーニング方法、強化システム、導入圧力、報酬構造は、チャットボットがロボット黙示録の小説を飲み込みすぎているかどうかよりもはるかに大きな影響を与える可能性があります。

Anthropic は一貫して、行動の整合性と安全性を異常に重視していると自社を位置づけています。彼らの「憲法的 AI」アプローチは、人間によるフィードバックトレーニングのみに依存するのではなく、構造化された原則と道徳的枠組みを使用してモデルの動作をガイドしようとします。

これは、Anthropic がすでに言語、口調、倫理、物語の枠組みがモデルの動作にとって非常に重要であると考えていることを意味します。その観点からすると、SF は無害な背景ノイズではなく、高度なシステムの動作を形作る、より大きな文化的データセットの一部になります。

SF から現実へ

AI 研究所が正式な整合性評価を開始するずっと前に、SF 作家たちは最悪のシナリオを何十年も費やして演じてきました。ある意味、フィクションは行動モデルの偶然のライブラリになっています。

議論をそのように組み立てる一部のオンライン反応にもかかわらず、SF 作家が AI のリスクに責任があるという意味ではありません。 Anthropic の批評家たちは、小説家を非難することはより大きな問題を見逃しているということでおそらく正しいでしょう。モデルはパターンから学習するのです。なぜなら、モデルはまさにそのように設計されているからです。重要な問題は、SF が AI を腐敗させたかどうかではなく、人類の共同執筆で訓練されたシステムに人間の恐怖や思い込みがどの程度埋め込まれているかということです。

人工知能企業は、大規模な言語モデルを人間性を自分自身に反映する鏡であるとよく説明します。この比喩が正確であれば、これらのシステムは知識や創造性以上のものを継承していることになります。彼らはまた、AI に対する被害妄想、破滅的思考、不信感、そして数十年にわたる架空の不安も引き継いでいます。

テキストの横の黒い背景に Google ロゴ

Google ニュースで TechRadar をフォローしてください e 私たちを優先情報源として追加してください 私たちのニュース、解説、専門家の意見をフィードに直接配信します。

あらゆる予算に最適なビジネスノートパソコン

RJ・バレット

私はワードルが好きですか？ 2026 年に試してみたい類似ゲーム 10 選をご紹介します

RJ・バレット
May 2, 2026
0

2021 年、Josh Wardle は人気の単語ゲーム Wordle をリリースしました。そして 2022 年に、ニューヨークタイムズがこのゲームを買収しました。 Wordle のルールは非常に簡単です。 5 文字の単語を 6 回以下の推測で見つけ出さなければなりません ( 毎回パズルを解くのに役立つ 2 段階の戦略）。各推測の後、ゲームでは、間違った文字には灰色のブロックが表示され、間違った場所にある正しい文字には黄色のブロックが、正しい場所には正しい文字には緑色のブロックが表示されます。 CNET ゲール・クーパーには、NY Times のあらゆる Wordle […]

RJ・バレット

研究者らは、グーグルと「60ミニッツ」が人工知能の「偽情報」を広めていると非難した。

RJ・バレット
April 19, 2023
0

「非常に印象深いのは、PaLM がベンガル語と英語の並列文をこれまで一度も見たことがないということです」とピチャイ氏はイベントで語った。「質問に答える方法や翻訳する方法を明示的に教えられたことは一度もありませんでした。このモデルはベンガル語で質問に正しく答えるためのすべての機能を集めており、この技術をより多くの言語や他の複雑なタスクに拡張することができます。」 Googleの広報担当者ジェイソン・ポスト氏はBuzzFeed Newsに対し、同社がPaLMにベンガル語の訓練を行っていないとは決して主張していない、と語った。「PaLMモデルは、さまざまな言語（英語やベンガル語を含む）で基本的な文章を完成させるように訓練されたが、1）言語間で翻訳する、2）一問一答形式で質問に答える、3）質問に答えながら言語間で情報を翻訳する、といったことは訓練されていなかった」とポスト氏は声明で述べた。「彼はこれらの新たな能力を独学で学びました。それは素晴らしい成果です。」エミリー・M・ベンダーはワシントン大学の教授兼研究者であり、ツイッタースレッドについて 60分セグメントで、マニカのコメントを批判した。ベンダー氏はBuzzFeed Newsに対し、番組が「すべてベンガル語」を翻訳できるという能力は「手の届かない、根拠のない主張」だと語った。「『全員ベンガル人』って実際どういう意味ですか？」ベンダー氏がツイートした。「これはどのようにテストされましたか?」同氏はまた、マニカ氏の声明はベンガル語のテキストがトレーニングデータに含まれているという事実を無視または隠蔽しているとも書いた。ベンダー氏は、「『新興特性』という用語は、AGIを表す立派な言い方のようだ」とツイートした。AGIとは汎用人工知能の略で、自ら学習して人間よりも優れたタスクを実行できる仮説上のテクノロジーのことだ。「まだクソだ」と彼は言った。ミッチェルも同様にツイッターで率直な発言をした。「『魔法の』特性に対する信念を持ち続け、それを数百万人に拡大すること（60Minutes、何もせずにありがとう！）は、Google の PR 目標に貢献します。」とミッチェル氏は述べています。彼はツイートした。「残念ながら、それは誤った情報です。」テクノロジー業界の他の人々も、CBS […]

RJ・バレット

精神疾患は妊娠の最大の合併症です。苦しんでいる人たちをサポートする時が来たエドナ・レクガベ

RJ・バレット
May 10, 2026
0

wミア* さんの紹介を受けたとき、私は妊娠 32 週目で、ここ 2 か月間よく眠れていませんでした。主治医は彼女に、それは「単なる妊娠中の不眠症」だと告げた。彼女のOBは、これは正常なことだと言い、妊娠用枕を使って早く寝るように勧めました。彼女は私のオフィスに座り、湿った布を両手で握りながら、パートナーと赤ちゃんが自分なしでどうすればもっと良くなるかを静かに計画していました。ミアは実在の人物ではありません。彼女は私が周産期精神科診療で毎年診ている何百人もの女性の集合体です。しかし、彼の話は非常に一般的であるため、モデルになる可能性があります。女性は妊娠中または産後、精神的な症状を発症します。暫定的に、出産前予約の際にそれらについて言及してください。彼女は自分が感じていることは普通だと安心しました。数週間、あるいは数か月が経過します。専門家の治療が到着するまでに、彼は危機に陥っています。精神疾患は、妊娠および産後の最大の合併症です。妊娠糖尿病ではありません。子癇前症ではありません。最大 5 人に 1 人の女性が、妊娠から生後 1 年までの周産期期間中に、診断可能な精神的健康状態を経験します。最も一般的なのはうつ病と不安症ですが、その範囲は出生外傷後の心的外傷後ストレス障害、子供への危害についての侵入的思考を中心とした強迫症状、および精神科緊急事態を構成するまれではあるが壊滅的な精神病エピソードにまで及びます。これらは小さな統計ではありません。身体的合併症が妊娠 5 人に 1 人に影響を及ぼした場合、私たちは普遍的にスクリーニングを実施し、治療経路に寛大な資金を提供し、産科医療に携わるすべての医師にそれを認識できるように訓練します。私たちは周産期のメンタルヘルスのためにこれらのことを一貫して行っていません。ミアのような女性が陥るのは、普及率と反応の間のギャップです。オーストラリアには、母子専用ユニット、専門的な周産期精神医療サービス、PANDA や周産期センターオブエクセレンスなどの組織の取り組みなど、優れた奨学金があります。しかし、アクセスは不均等であり、大都市圏や民間医療を受ける余裕のある人々に偏っています。公的制度では、待機リストが数か月に及ぶこともあります。生後 28 週で状態が悪化している女性は、赤ちゃんが生後 […]

Related Posts

私はワードルが好きですか？ 2026 年に試してみたい類似ゲーム 10 選をご紹介します

研究者らは、グーグルと「60ミニッツ」が人工知能の「偽情報」を広めていると非難した。

精神疾患は妊娠の最大の合併症です。苦しんでいる人たちをサポートする時が来た エドナ・レクガベ

Leave a Reply Cancel reply

精神疾患は妊娠の最大の合併症です。苦しんでいる人たちをサポートする時が来たエドナ・レクガベ