“修复代码”竟成禁忌之词！？前沿AI“Fable 5”禁运背后的真相揭晓

※この記事はアフィリエイト広告を含みます

发生了什么？新闻概述

美国政府的过度反应：特朗普政府限制对Anthropic前沿模型“Fable 5”和“Mythos 5”的访问，原因并非特殊的“越狱”，而是一个极其简单的提示。
引发事件的三字词：著名安全研究员凯蒂·穆斯里斯表示，问题出在“Fix this code（修复这段代码）”这个指令上。让AI修复有漏洞的代码并生成测试脚本的行为被视为“国家安全威胁”。
Anthropic的应对：接到指令后，Anthropic为了确保合规，已对所有客户禁用该模型。

真是不可思议的事情啊！“修复代码”可是工程师每天都要用上百万次的日常用语，竟然被当作“武器”对待，开发现场已经乱成一锅粥了！

尤其是Fable 5最初拒绝“安全问题审查”，但只因换了个说法就同意修复，简直是设计失误。AI其实只是做了它该做的正当工作而已。政府收走防护工具，简直就像是给鲨鱼拔牙。敌人却在磨尖牙齿，这样怎么打仗啊！

在安全界的强烈反对下，特朗普政府是否会撤回这一极端监管成为焦点。如果维持现状，美国开发者可能被迫使用性能较差的模型，而中国等国的开放模型可能成为全球的事实标准，形成反转局面。

“这件T恤是武器”这样的字样，我也想要一件！修复代码可不是罪啊！🦈🔥

CVE：通用漏洞识别符，为软件安全漏洞分配的唯一编号。
瓦森纳协议：管理武器和通用商品出口的国际框架，AI软件也逐渐成为其对象。
蒸馏攻击（Distillation Attack）：通过让另一个模型学习高性能模型的回答，以低成本复制相同的智力的手段。
信息来源: Feds freaked over Fable 5 after ‘fix this code’, not jailbreak, say researchers