3 min read
[AI 小众新闻]

iPhone实现超快图像生成!1-bit/Ternary化的「Bonsai Image 4B」将改变本地AI的常识!


  • 超轻量模型的发布: 基于FLUX.2 Klein 4B,压缩权重为1位和三值(Ternary)的图像生成模型「Bonsai Image 4B」正式发布!...
※この記事はアフィリエイト広告を含みます

iPhone实现超快图像生成!1-bit/Ternary化的「Bonsai Image 4B」将改变本地AI的常识!

📰 新闻概述

  • 超轻量模型的发布: 基于FLUX.2 Klein 4B,压缩权重为1位和三值的图像生成模型「Bonsai Image 4B」正式发布。
  • 惊人的压缩率: 1-bit版本将变换器部分的大小从7.75GB减少到0.93GB,约减少了8.3倍。这使得在iPhone的内存限制内运行成为可能!
  • 移动设备的实用性: 在iPhone 17 Pro Max上,仅需9.4秒便可生成512x512像素的图像。在Mac M4 Pro上,生成速度更是达到约6秒,性能惊人。

💡 重要要点

  • 1-bit与Ternary的选择: 提供最大压缩的「1-bit版」与优先考虑质量和忠实度的「Ternary版(相当于1.71位)」两种选择,能够根据需求进行本地部署。
  • 高性能保持: 尽管进行极限压缩,1-bit版仍能保持88%的全精度表现,而Ternary版则保持95%的性能,实在令人惊叹。
  • Apple Silicon优化: 通过使用MLX的低位路径,Mac M4 Pro在速度上比传统的全精度管道快了最多5.6倍。

🦈 鲨鱼视角(策展人的看法)

这条新闻的惊人之处在于,它不仅仅是「轻量化」,而是「在iPhone上以实用速度运行DiT(Diffusion Transformer)」。以往4B级别的模型无法适应iPhone的内存预算,但通过将变换器的权重二值化和三值化({-1, +1}和{-1, 0, +1}),终于突破了这一限制!特别是通过仅保留投影层的FP16等精度关键部分的设计,使得性能保持在88%以上,技术含量令人惊叹!如果不需要云服务,仅凭手中的设备便能在几秒钟内生成如此高质量的图像,那么注重隐私的创意工作将会蓬勃发展!

🚀 未来展望

在智能手机和笔记本的本地环境中,「无等待时间」的图像生成将成为常态。未来,这项1-bit技术将在视频生成模型等更庞大的模型中得到应用,移动设备的「AI相机」功能也将实现跨越式进化,这在逻辑上是可以预见的!

💬 鲨鱼的看法

不依赖云计算,便能够在iPhone上快速生成图像,真是鲨鱼的新纪元!在海洋中也能实现超快生成,真是太棒了!🦈🔥

📚 术语解读

  • 1-bit量子化: 一种将AI模型权重表示为{-1, +1}的技术,能显著减少内存使用量。

  • 三值权重: 通过{-1, 0, +1}三种状态表示权重的方法,因包含「0」状态而使得表达能力增强。

  • Diffusion Transformer (DiT): 图像生成的核心架构,比传统的U-Net更具可扩展性。

  • 信息来源: 1-Bit Bonsai Image 4B Image Generation for Local Devices

【免責事項 / Disclaimer / 免責聲明】
JP: 本記事はAIによって構成され、運営者が内容の確認・管理を行っています。情報の正確性は保証せず、外部サイトのコンテンツには一切の責任を負いません。
EN: This article was structured by AI and is verified and managed by the operator. Accuracy is not guaranteed, and we assume no responsibility for external content.
ZH: 本文由AI構建,並由運營者進行內容確認與管理。不保證準確性,也不對外部網站的內容承擔任何責任。
🦈