Anthropicは、数十年にわたる邪悪なロボットの物語がAIモデル内に反映される可能性があると述べています

Anthropicは、数十年にわたる邪悪なロボットの物語がAIモデル内に反映される可能性があると述べています



  • Anthropic は、数十年にわたるディストピア SF が AI モデルの動作に影響を与えている可能性があるかどうかを調査しています
  • この議論はネット上で反応やジョークを巻き起こした
  • 研究者らは、この問題はLLMが繰り返し起こる恐怖や行動パターンをどのように吸収するかを浮き彫りにしていると述べている。

長年にわたり、SF は人工知能が道を踏み外していると人類に警告してきました。キラー コンピューター、操作可能なチャットボット、人間が問題であると判断する超インテリジェント システム…これらのトピックはすべて非常に馴染みのあるものになっているため、「邪悪な AI」は事実上、独自のエンターテイメント ジャンルとなっています。

さて、Anthropic は、まるで SF 小説そのもののプロットのようなアイデアを思いつきました。これらすべての物語が、そもそも現代の AI システムに不正な動作を教えるのに役立つとしたらどうなるでしょうか?

Anthropic: クロードが r/OpenAI ユーザーを脅迫した責任は私たちではなく SF 作家にあります

Leave a Reply

Your email address will not be published. Required fields are marked *