欧洲知名 AI 初创公司 MultiverseComputing 近日发布了两款超小型 AI 模型,并以动物大脑尺寸命名——分别为"苍蝇脑"SuperFly 和"鸡脑"ChickBrain。这家声称拥有全球最小高性能 AI 模型的公司,正试图将人工智能带入每一台物联网设备。
MultiverseComputing 总部位于西班牙圣塞巴斯蒂安,拥有约 100 名员工,由欧洲
公司的核心技术是名为"CompactifAI"的模型压缩技术。Orús 表示,这是一种基于量子物理原理的压缩算法,能够在不牺牲性能的前提下大幅缩减 AI 模型的尺寸。"我们拥有的压缩技术不同于传统的计算机科学或机器学习压缩方法,因为我们来自量子物理学领域,"他解释道,"这是一种更加精巧和细致的压缩算法。"
SuperFly 模型是该公司"模型动物园"系列中最小的一款,基于 HuggingFace 开源模型 SmolLM2-135 压缩而成。原始模型拥有 1.35 亿个参数,而 SuperFly 压缩至 9400 万参数,Orús 形象地将其比作苍蝇大脑的尺寸。
SuperFly 专门针对资源受限的设备设计,能够在极小的处理能力下运行。该模型可以嵌入家用电器中,用户可以通过语音命令操作设备,比如对洗衣机说"开始快洗",或者询问故障排除问题。在现场演示中,该模型配合简单的 Arduino 处理器就能够处理语音交互界面。
更强大的 ChickBrain 模型拥有 32 亿参数,基于 Meta 的 Llama3.18B 模型压缩而成,具备推理能力。尽管参数量更大,但该模型仍然足够小巧,可以在 MacBook 上离线运行。
令人惊讶的是,ChickBrain 在多个标准基准测试中的表现实际上略优于原始模型,包括语言技能基准 MMLU-Pro、数学技能基准 Math500 和 GSM8K,以及通用知识基准 GPQADiamond。这证明了该公司压缩技术的有效性——不仅缩小了模型尺寸,还能保持甚至提升性能。
Multiverse 已经开始与各大设备制造商进行洽谈。Orús 透露:"我们正在与苹果、三星、索尼和惠普等公司进行对话。惠普还参与了上一轮投资。"该轮融资由知名欧洲风投公司 BullhoundCapital 领投,惠普科技风险投资和东芝等多家机构参投。
除了直接向设备制造商销售模型外,Multiverse 还通过托管在 AWS 上的 API 为开发者提供压缩模型服务,通常 token 费用比竞争对手更低。该公司已经为 BASF、Ally、穆迪、博世等客户提供了包括图像识别在内的各种机器学习压缩技术服务。
这些超小型 AI 模型的推出标志着人工智能应用的一个重要趋势——从云端大模型向边缘设备小模型的转变。通过将 AI 能力直接嵌入到物联网设备中,用户可以享受更快的响应速度、更好的隐私保护以及无需网络连接的离线智能体验。
随着物联网设备的普及和边缘计算需求的增长,像 Multiverse 这样专注于模型压缩技术的公司可能会迎来巨大的市场机遇。其基于量子物理原理的独特压缩算法不仅展现了技术创新的可能性,也为 AI 技术的普及化应用开辟了新的道路。