※この記事はアフィリエイト広告を含みます
iPhone实现超快图像生成!1-bit/Ternary化的「Bonsai Image 4B」将改变本地AI的常识!
📰 新闻概述
- 超轻量模型的发布: 基于FLUX.2 Klein 4B,压缩权重为1位和三值的图像生成模型「Bonsai Image 4B」正式发布。
- 惊人的压缩率: 1-bit版本将变换器部分的大小从7.75GB减少到0.93GB,约减少了8.3倍。这使得在iPhone的内存限制内运行成为可能!
- 移动设备的实用性: 在iPhone 17 Pro Max上,仅需9.4秒便可生成512x512像素的图像。在Mac M4 Pro上,生成速度更是达到约6秒,性能惊人。
💡 重要要点
- 1-bit与Ternary的选择: 提供最大压缩的「1-bit版」与优先考虑质量和忠实度的「Ternary版(相当于1.71位)」两种选择,能够根据需求进行本地部署。
- 高性能保持: 尽管进行极限压缩,1-bit版仍能保持88%的全精度表现,而Ternary版则保持95%的性能,实在令人惊叹。
- Apple Silicon优化: 通过使用MLX的低位路径,Mac M4 Pro在速度上比传统的全精度管道快了最多5.6倍。
🦈 鲨鱼视角(策展人的看法)
这条新闻的惊人之处在于,它不仅仅是「轻量化」,而是「在iPhone上以实用速度运行DiT(Diffusion Transformer)」。以往4B级别的模型无法适应iPhone的内存预算,但通过将变换器的权重二值化和三值化({-1, +1}和{-1, 0, +1}),终于突破了这一限制!特别是通过仅保留投影层的FP16等精度关键部分的设计,使得性能保持在88%以上,技术含量令人惊叹!如果不需要云服务,仅凭手中的设备便能在几秒钟内生成如此高质量的图像,那么注重隐私的创意工作将会蓬勃发展!
🚀 未来展望
在智能手机和笔记本的本地环境中,「无等待时间」的图像生成将成为常态。未来,这项1-bit技术将在视频生成模型等更庞大的模型中得到应用,移动设备的「AI相机」功能也将实现跨越式进化,这在逻辑上是可以预见的!
💬 鲨鱼的看法
不依赖云计算,便能够在iPhone上快速生成图像,真是鲨鱼的新纪元!在海洋中也能实现超快生成,真是太棒了!🦈🔥
📚 术语解读
-
1-bit量子化: 一种将AI模型权重表示为{-1, +1}的技术,能显著减少内存使用量。
-
三值权重: 通过{-1, 0, +1}三种状态表示权重的方法,因包含「0」状态而使得表达能力增强。
-
Diffusion Transformer (DiT): 图像生成的核心架构,比传统的U-Net更具可扩展性。
-
信息来源: 1-Bit Bonsai Image 4B Image Generation for Local Devices