※この記事はアフィリエイト広告を含みます
“修复代码”竟成禁忌之词!?前沿AI“Fable 5”禁运背后的真相揭晓
发生了什么?新闻概述
- 美国政府的过度反应:特朗普政府限制对Anthropic前沿模型“Fable 5”和“Mythos 5”的访问,原因并非特殊的“越狱”,而是一个极其简单的提示。
- 引发事件的三字词:著名安全研究员凯蒂·穆斯里斯表示,问题出在“Fix this code(修复这段代码)”这个指令上。让AI修复有漏洞的代码并生成测试脚本的行为被视为“国家安全威胁”。
- Anthropic的应对:接到指令后,Anthropic为了确保合规,已对所有客户禁用该模型。
为什么这很重要?值得关注的点
- 防御武器被削弱:穆斯里斯和其他100多位专家警告称,AI在发现、修复和测试漏洞的循环中是“防御方最有价值的功能”,限制这一点只会使攻击者受益。
- 其他国家的崛起:在美国限制自家模型的同时,中国的DeepSeek等公司利用“蒸馏攻击”吸收美国企业的智力资源,监管措施的有效性受到质疑。
🦈 鲨鱼的视角(策展人的观点)
真是不可思议的事情啊!“修复代码”可是工程师每天都要用上百万次的日常用语,竟然被当作“武器”对待,开发现场已经乱成一锅粥了!
尤其是Fable 5最初拒绝“安全问题审查”,但只因换了个说法就同意修复,简直是设计失误。AI其实只是做了它该做的正当工作而已。政府收走防护工具,简直就像是给鲨鱼拔牙。敌人却在磨尖牙齿,这样怎么打仗啊!
接下来会怎样?
在安全界的强烈反对下,特朗普政府是否会撤回这一极端监管成为焦点。如果维持现状,美国开发者可能被迫使用性能较差的模型,而中国等国的开放模型可能成为全球的事实标准,形成反转局面。
鲨鱼的看法
“这件T恤是武器”这样的字样,我也想要一件!修复代码可不是罪啊!🦈🔥
术语解说
-
CVE:通用漏洞识别符,为软件安全漏洞分配的唯一编号。
-
瓦森纳协议:管理武器和通用商品出口的国际框架,AI软件也逐渐成为其对象。
-
蒸馏攻击(Distillation Attack):通过让另一个模型学习高性能模型的回答,以低成本复制相同的智力的手段。
-
信息来源: Feds freaked over Fable 5 after ‘fix this code’, not jailbreak, say researchers