谷歌DeepMind资深研究员与苹果科学家离职创业,目标构建原生多模态模型
三言科技,2026-01-13 10:36:24
曾在谷歌DeepMind效力14年的资深研究员Andrew Dai,正在筹建名为Elorian的AI初创公司,目标构建能够同时理解和处理文本、图像、视频和音频的原生多模态模型,专注于视觉推理领域。与他联手的是刚于去年12月离职的苹果研究科学家Yinfei Yang,其在多模态表示学习领域有深厚积累。
Elorian的种子轮融资目标高达5000万美元,领投方极有可能是Striker Venture Partners,其创始人Max Gazor曾是老牌风投CRV的合伙人。此次融资若达成,将是硅谷近期最受瞩目的早期融资之一,也反映了资本市场对谷歌和苹果背景人才的高度追捧。
Andrew Dai在谷歌期间,作为Gemini模型预训练数据工作的联合负责人,参与了多项关键研究,其在预训练领域的贡献对大模型发展有深远影响。Yinfei Yang则带来了苹果系的多模态视角,其专长可填补单纯语言模型的感知短板。
Elorian的愿景是构建一个天生的“通感者”,让模型像人类一样通过视觉直接感知物理世界的逻辑,而非仅将图片转化为文字标签。这种视觉推理能力被认为是通向AGI的必经之路,其潜在应用场景包括机器人和AI智能体市场,后者能像人类一样操作软件、处理文件并实时决策。
在大模型战场从文本生成转向多模态理解和物理世界交互的背景下,Elorian试图通过技术代差或垂直场景的极致应用,在巨头夹缝中生存。