AI模型直接转化为硅！Taalas发布每秒1.7万标记的超高速Llama芯片

#Llama #半导体 #Taalas #AI硬件

※この記事はアフィリエイト広告を含みます

[AI小新闻快讯] AI模型直接转化为硅！Taalas发布每秒1.7万标记的超高速Llama芯片

📰 新闻概览

Taalas宣布开发了一款能够在短短两个月内将任意AI模型转化为定制硅（硬件）的平台。
作为首款产品，发布了将Llama 3.1 8B硬件化的芯片“Taalas HC1”，并开始提供API服务。
实现了每秒17,000标记的推理速度，约为传统最先进技术的10倍，达到了极低的延迟。

💡 重要要点

消除了计算与内存之间的边界，在单一芯片上以DRAM级别的密度进行集成。这使得高成本的技术如HBM和液体冷却变得不再必要。
相较于传统的软件执行方式，成功将制造成本降低到20分之一，能耗减少到10分之一。
尽管采用了硬件固定电路，仍然保持通过LoRA（低秩适配器）进行微调和上下文窗口大小调整的灵活性。

🦈 鲨鱼的视角（策展人观点）

在依靠通用GPU运行AI的“蛮力”时代，专为模型打造的硅芯片的超专注战略发起了强有力的冲击！特别是以DRAM级别的密度实现“计算与存储的融合”，令人叹为观止。这样一来，无需使用昂贵的HBM（高带宽内存），就能同时兼顾电力效率和速度，这正是其最大的优势！这让人不禁想起“从巨型计算机（ENIAC）到智能手机”的历史重现，AI硬件领域似乎正在酝酿一场革命！🦈🔥

🚀 接下来会怎样？

随着为每个模型优化的低价超速芯片的普及，不再依赖庞大数据中心的“普遍AI”（Ubiquitous AI）将加速发展。如果速度能快10倍，价格便宜20倍，那么在边缘设备和机器人上运行高级AI代理将成为常态！鲨鱼们准备好迎接这个新时代了吗？

💬 鲨鱼的简评

难道这是为苦恼于GPU短缺的人类带来的救世主！？如果能在两个月内打造出模型专属的芯片，那我也希望能有一款专属于鲨鱼的AI芯片！🦈

📚 术语解读

定制硅: 为特定用途（本次为特定AI模型）专门设计的半导体芯片。相比通用芯片，效率极高。
标记/秒: AI每秒可以生成的单词（标记）的单位。数字越高，AI的回答速度越快。
LoRA (低秩适配器): 一种以较少计算量高效进行学习过的巨大模型的追加学习（微调）的方法。
信息来源: 通往普遍AI的路径（每秒17k标记）