Anthropic 最新研究指出,AI 的网络攻击能力正在快速接近人类黑客。包括GPT-5 与Claude Opus 在内的多款模型,已能重现超过200 起历史智能合约攻击,甚至在BNB▲Chain 上找出从未被披露的零日漏洞。专家警告,AI 的低成本、高效率与自动化特性,将让攻击行为被大规模复制,而这也意味着Web3 资讯安全的攻防节奏将面临全面重塑。
AI 黑客时代来临:10 大模型成功复制200 多起链上攻击
Anthropic 公布对10 种前沿AI 模型的安全评估,包括GPT-5、Claude Opus 4.5、DeepSeek V3 与Llama 3 等。

研究显示,AI 已能成功重现405 起历史攻击中的207 起,模拟造成5.5 亿美元损失,在半数以上案例中表现堪比熟练的人类黑客。这显示从攻击流程到漏洞利用逻辑已能被AI 完整理解与执行。
从重现到发现:GPT-5 与Claude 能挖出协议零日漏洞
在更具挑战性的「零日漏洞(zero-day vulnerability)」测试中,Anthropic 让模型扫描自BNB▲Chain 940 万份合约中抽出的2,849 份新合约。
结果令人意外,Claude Sonnet 4.5 与GPT-5 各自找到两个未披露缺陷,并在沙盒环境中成功产生约3,694 美元的模拟获利。这代表着AI 不只能模仿攻击,也具备「主动发现」未知弱点的能力。
AI 攻击为何容易扩散?开源文化成关键
面对AI 攻击规模容易快速放大的原因,SovereignAI 营运长David Schwed 对此解释,由于市场上公开的审计与漏洞报告很多、各专案又存在分岔版本等,AI 迅速审阅并比对的优势,此时更能放大:
更简单的做法是找到一个已揭露的漏洞,然后找出与其架构类似的专案,并尝试利用该漏洞,因为它可能尚未修补(patch)。
一旦模型能力持续提升,攻击将变得可复制,届时也将走向自动化与规模化,攻击者与防御者的速度差距只会更大。
防御者也能AI 武装自己:攻击更快、修补也要更快
Anthropic 强调,AI 使用工具、错误修复、长区段的任务规划能力正在快速进化,让攻击速度与成功率大幅提升;但同样的进步也能应用在防御端。
Schwed 认为,只要采取严谨测试、即时监控与区间阻断等机制,AI 反而能让白帽与攻击者站在同一起跑线上。他强调:「坏人能做的事,好人也能做。我们只是要换一种方式思考。」
本文链接地址:https://www.wwsww.cn/rgzn/35684.html
郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时间联系我们修改或删除,多谢。



