Center for Emerging Technology and Security (CETaS) での年次展示会は、クロード神話の意味についての議論から始まりました。
カンファレンスの冒頭、アラン・チューリング研究所のCETaSディレクター、アレクサンダー(サッシャ)・バブータ氏は、Anthropicの最新フロンティアモデルであるClaude Mythos Previewは、数学、サイバーセキュリティ、ソフトウェアエンジニアリング、自動脆弱性検出において大幅な改善を示していると述べた。
このモデルは現実世界のシステムでこれまで発見されていなかった脆弱性を自律的に特定して悪用できる一方で、Claude Mythos Preview を企業 IT の保護にどのように使用できるかについて楽観的な見解を述べました。 「企業はAnthropic Mythosのようなモデルを使用して、自社のシステムの脆弱性を迅速に発見し、パッチを適用して全員のデジタルセキュリティを強化できます」とバブタ氏は述べた。
2022 年の ChatGPT の開始から 2025 年末までのサイバー犯罪コミュニティの調査により、サイバー犯罪フォーラムが多数の「ダーク AI」製品をホストしていたことが明らかになりました。
これらの所有者は、これらは自社製、または大規模にリサイクルされ、ジェイルブレイクされた大規模言語モデル (LLM) がサイバー犯罪用にカスタマイズおよび適合されたものであると主張しています。しかし、フォーラムで多少の興奮を引き起こしたにもかかわらず、これまでのところほとんど影響はなかったと、エディンバラ大学上級講師のベン・コリアー氏が調査結果を論じたプレゼンテーションで述べた。
研究者らは、初心者プログラマを有能なプログラマに変えることを明確に目的として設計された正規のエンタープライズグレードの製品を調べたところ、多くのサイバー犯罪者志望者がChatGPTやClaudeなどのツールを実験していることが判明し、研究者らはこれらのツールについて「熱心に調査結果を報告している」と述べた。しかし、コリアー氏は、これらの議論をより深く調査したところ、ほとんどの場合、フォーラムのメンバーがサイバー犯罪を行うために AI ツールを効果的に使用するために必要な基本的な技術スキルを欠いていることが判明したと指摘しました。
「彼らは振動コーディングツールを趣味のプロジェクトに使用しているが、特にサイバー犯罪活動の基本的なロジスティクスに使用している」と同氏は語った。 「サイバー犯罪に関与するコーディングのほとんどはハッキングではありません。これは、小規模なスタートアップ企業に必要な基本的なエンジニアリングと管理作業と同じです。つまり、多くの企業は、実際に利用するためにクロードを脱獄する必要がありません。」
こうしたツールが進化すれば、高度なサイバー攻撃に利用される可能性があるというのが悲観的な見方だ。 AIセキュリティ研究所(ASI)の所長代理であるアダム・ボーモント氏は、この悲観的な見方について語った。 GCHQ の元 AI ディレクターであるボーモント氏は、ASI が最近、フロンティア AI モデルが最初の偵察から完全なネットワーク乗っ取りまで、シミュレートされた企業環境に対して 32 段階のサイバー攻撃を実行する方法を実証したと述べました。
「熟練した人間の専門家が作業すると20時間かかると見積もったが、モデルがこれを行うのはこれが初めてで、数週間後に2番目のモデルをテストした」と同氏は語った。
ボーモント氏は、同氏が説明した攻撃はハッキングに関する質問に答えるモデルではないと指摘した。 「それは彼がハッキングしたシステムだった」と彼は語った。 「これらのシステムが意図したとおりに動作することを保証する方法や、システムの能力が向上しても人間の有意義な制御下に留まることを保証する方法はまだわかりません。」
ボーモント氏はASIデモを「正直な出発点」と呼んだ。同氏は「不確実性は現実であり、不快感は適切だ」と述べた。
ボーモント氏にとって、これは、政府、業界、研究コミュニティが、これらのシステムが実際に証拠に基づいて実行できることに基づいて意思決定できるように構築できるものを表しています。