Anthropic的新模型『Fable』引发大量批评!过于严格的保护机制使得『代码审查都无法进行』的现实
新闻概述
- 最新模型“Fable”的发布: Anthropic推出了强大的网络安全模型“Mythos”的限量版“Fable”,但专家们对此表示不满。
- 过度的保护机制: 对与网络安全和生物学相关的关键词反应过敏,甚至连无害的博客浏览和代码审查都被拒绝的情况屡见不鲜。
- 备用功能: 当保护机制启动时,模型会自动切换到“Claude Opus 4.8”。
重要的要点
- 基于关键词的限制: 专家指出,仅仅包含“网络安全”相关词汇就可能导致聊天中断,甚至连安全软件工程实践(如安全代码编写)都被拒绝。
- 与Mythos的差异: 顶级模型“Mythos”仅提供给通过“Project Glasswing”选定的组织,而面向大众的Fable则遭到批评,认为其限制过于“临时”。
- 验证程序的存在: Anthropic设立了“网络验证计划”,通过认证的专家可以获得较少限制的访问权限,但一般用户的使用不便仍未得到改善。
鲨鱼的眼(策展视角)
Anthropic的最新模型“Fable”,因其过于严格的限制让人感到震惊!🦈 尤其是IBM X-Force的专家们指出,连“仅仅让人阅读博客”的无害请求都被当作“网络攻击风险”拒绝,简直让人无法在实际工作中使用。虽然Anthropic强调安全性,但对于关键词的即时反应导致聊天中断,并强制切换到老旧的“Claude Opus 4.8”,这无疑给开发者带来了巨大的压力!
仅仅请求“写安全代码”,却被判定为“与网络安全相关”,这似乎在给AI的发展踩刹车。不过,Anthropic希望阻止生物武器和恶意软件制作的决心却是显而易见的。只有通过专业验证程序“网络验证计划”的“选中的鲨鱼”(专家),才能释放真正的实力!
未来会怎样?
目前处于发布初期,推测Anthropic正在“为了最小化风险而过度扩展保护机制”。未来,随着与专家的合作,保护机制将被微调,发展出更能理解上下文的灵活过滤系统。此外,与OpenAI的“网络受信访问”的竞争也将加剧,专业AI使用的“认证制度”有望成为行业标准。
鲨鱼视角的一句话
保护机制严得让人感觉鲨鱼连海都出不来了!但安全第一是重要的。期待之后的调整!🦈🔥
术语解说
-
Mythos: Anthropic开发的网络安全专用顶级AI模型,仅向极为有限的组织提供。
-
Project Glasswing: 旨在保护重要软件和基础设施的Mythos模型部署项目名称。
-
备用机制: AI在面对特定限制或错误时,切换到较低级别或不同系统模型进行处理的功能。
-
信息来源: Cybersecurity researchers aren’t happy about the guardrails on Anthropic’s Fable