OA0

OA0 是一个探索 AI 的社区

现在注册

已注册用户请登录

OA0 › 社区 › Anthropic

Anthropic 推出 Claude Mythos：大模型进入“攻防一体”，AI 安全能力开始规模化内嵌软件生态

church · 2026-04-08 10:32:37 · 38 次点击 · 0 条评论

AI 的能力边界正在从“生成内容”快速扩展到“理解并重构系统”，而网络安全成为最先被重塑的领域之一。

近日推出新一代模型 Claude Mythos，并同步启动名为 “Project Glasswing”（玻翼计划）的安全协作项目，联合、、、、等一线科技公司，试图在 AI 能力扩散之前，将其优先用于防御侧。

对 AI 技术社区而言，这一事件标志着：大模型正在从“辅助开发工具”，演化为“系统级安全审计引擎”。

Mythos 的核心能力：从代码理解到系统漏洞挖掘

根据披露，Claude Mythos 在预览阶段已在主流操作系统与浏览器中发现“数千处高严重性漏洞”。这一能力的关键，不只是规模，而是其技术路径的变化：

1. 跨层级语义分析

不同于传统静态分析工具，Mythos 能够：

同时理解应用层代码与底层系统调用
建立跨模块、跨依赖的语义关系
推断复杂执行路径中的潜在风险

这意味着，它不再局限于“模式匹配”，而是具备接近人类安全研究员的推理能力。

2. 多环境泛化能力

Anthropic 强调，该模型在“所有主流操作系统和浏览器”中均发现漏洞，说明其具备：

跨平台知识迁移能力
对不同 runtime / kernel 行为的抽象理解
对复杂软件栈的泛化分析能力

这一点对现代软件尤为关键，因为现实系统通常是多语言、多平台混合构建。

3. 从代码到攻击路径的建模

Mythos 不仅识别漏洞，还能推断：

潜在攻击链（attack chain）
利用路径（exploit path）
安全影响范围

这使其更接近完整的“攻防模拟器”，而非单点检测工具。

Project Glasswing：在能力扩散前构建“防御联盟”

“Project Glasswing”的出现，本质上是一次针对 AI 安全能力的“前置治理”。

参与方覆盖云计算、芯片、操作系统与安全厂商，包括：

云与基础设施：、、- 终端与系统：- 芯片与硬件：、Broadcom
安全厂商：CrowdStrike、Palo Alto Networks、Cisco

这一组合反映出一个现实：AI 安全已经不是单点问题，而是整个计算栈的系统性问题。

Glasswing 的核心策略是：

在模型公开前，将 Mythos 提供给关键软件维护者
由这些团队提前修复潜在漏洞
构建“防御优先”的能力扩散路径

目前已有超过 40 家关键软件组织获得 Mythos 预览访问权限。

为什么是现在：AI 攻防能力的“临界点”

Anthropic 明确表达了一个判断：类似 Mythos 的能力，很快会扩散到更广泛群体，包括潜在攻击者。

这一判断并非空穴来风，而是源于当前大模型能力的几个趋势：

1. 代码理解能力指数级提升

从 GPT-3 到当前模型，代码生成与理解能力显著增强：

能阅读大型代码库
能自动生成 exploit 思路
能进行复杂调试与修复

2. Agent 化带来的自动化攻击

结合 AI Agent：

可以自动扫描目标系统
自动生成攻击策略
自动执行漏洞利用

攻击门槛被显著降低。

3. 开源模型的快速扩散

开源 LLM（如 LLaMA、Mistral 系列）不断逼近闭源模型能力，使得：

高级能力更容易被复现
安全能力难以长期“封闭”

在这一背景下，Glasswing 的逻辑非常清晰：在“攻击民主化”之前，先实现“防御规模化”。

对 AI 工程与工具链的影响：安全能力将内嵌开发流程

Mythos 及其背后的策略，可能对 AI 工程实践产生深远影响：

1. 安全扫描从工具变为模型能力

传统 DevSecOps 流程依赖：

静态分析工具（SAST）
动态分析工具（DAST）

未来可能转向：

LLM 驱动的语义安全审计
实时风险评估与修复建议

2. CI/CD 流程重构

在持续集成中，可能出现：

每次提交自动触发 LLM 安全审计
自动生成 patch 建议
风险优先级动态评估

3. “安全 Copilot”的出现

类似代码助手（如 Copilot）的模式，将扩展到安全领域：

开发时实时提示潜在漏洞
自动建议安全实现方式
甚至阻止高风险代码提交

一个更深层的变化：AI 正在重写“漏洞发现”的生产函数

传统安全研究高度依赖专家经验与时间投入，其“生产函数”大致为：

人力 × 时间 × 技能

而 Mythos 这类模型的引入，使其变为：

模型能力 × 计算资源 × 数据

这带来两个直接后果：

漏洞发现速度显著提升（规模化）
漏洞发现门槛显著降低（民主化）

这既是机遇，也是风险。

写在最后：从“模型能力竞赛”到“安全能力竞赛”

并未选择立即公开 Claude Mythos，而是通过 Glasswing 进行受控释放。这一策略本身就说明：

AI 能力已经触及敏感边界
安全不再是附属问题，而是核心议题

对 AI 技术社区而言，Mythos 的意义不只是“更强的模型”，而是一个信号：

下一阶段的竞争，不只是模型性能，而是谁能更安全地部署这些能力。

当大模型开始具备系统级理解与攻击推理能力时，AI 的发展逻辑也随之改变——从单纯的智能提升，转向对整个数字世界运行规则的重塑。

38 次点击 ∙ 0 人收藏

登录后收藏

0 条回复