AI视觉领域明星「Luma AI」完成千万美元融资:亚马逊、AMD投了
据媒体消息,美国硅谷AI视觉公司Luma AI近期完成千万美元级别的新一轮融资,资金将重点投入视觉AI基础模型与应用开发。
本轮投资方涵盖亚马逊、AMD、Factorial Funds、LDV Capital四家欧美机构,老股东A16Z、Amplify Partners和经纬(Matrix Partners)也持续跟投。
该笔融资主要目的在于加速视觉人工智能基础模型及产品的研发进程。
Luma AI成立于2021年,专注于计算机视觉内容技术,自研模型覆盖视频生成、3D生成和图片生成。2024年1月曾有报道披露其完成4300万美元B轮融资,投资方为A16Z。
全球AI赛道的资源分配已进入“中场”阶段。据Techcrunch统计,2024年下半年月均过亿融资笔数较上半年减少10%。同时热钱正集中涌向AI应用层,例如AI搜索、AI销售、机器人、AI编程等领域。
模型层作为基础设施,不能单独成为产品,最终流量必须由AI应用承接——这一共识已在投资者和从业者中形成。
2024年11月26日,主要发力模型层的Luma AI发布了视频生成模型Dream Machine后的首款应用——Dream Machine AI创意平台。
“与ChatGPT等语言模型相比,视频模型目前仍属小众领域。”Luma AI产品设计师Jiacheng Yang指出,Dream Machine用户多为具备AI或影视制作经验的专业人群。他对媒体解释了推出图像设计AI平台的原因:
“图像领域用户基础更大,有助于扩大受众。我们的目标正是打造一款让AI新手和设计新手都能轻松上手的视觉工具。”
Dream Machine AI创意平台可视为一个聚合了文生图像设计、AI头脑风暴、主体/风格参考、设计图转视频等功能的设计平台。

Dream Machine AI创意平台的主体/风格参考功能。图源:Luma AI
与Midjourney、Stable Diffusion等文生图产品相比,Dream Machine AI创意平台对自然语言Prompt的理解能力更强,还能生成更清晰且富有设计感的配文。

Dream Machine AI创意平台生成的高清配文。图源:Luma AI
Dream Machine AI创意平台易上手且性能强劲,根本原因在于底层模型能力。其语言理解来自Luma AI基于第三方语言模型构建的Agent;图片生成能力源于自研的Luma Photon模型;图生视频能力则来自2024年6月16日发布的自研视频生成模型Dream Machine。
彼时,Sora、生数科技Vidu等视频生成模型仅停留在demo阶段,未开放公测。Dream Machine凭借率先“免费”“公测”、良好性能及“梗图”玩法,在社交平台上迅速走红。
上线4天,Dream Machine用户数突破100万。Luma AI数据产品负责人Barkley Dai透露,其推广费用为零。
目前Luma AI团队约50人。据Barkley介绍,2023年12月决定启动视频生成项目后,团队从10人扩至50人,主要引入了视频生成领域的顶尖人才。
高人才密度作战的效果体现在Dream Machine的性能上:它能在约20秒内生成5秒视频,并具备逼真的摄像机运动轨迹、自然光影变化以及丰富的机位。2024年9月发布的1.6版本中,用户仅需输入文字Prompt即可调整相机移动方向。
以3D生成技术起家的Luma AI旗下还有Text to 3D工具Genie,曾是市面上唯一能在10秒内生成3D模型的工具。
商业化方面,Luma AI旗下的视频、图像、3D模型产品对外提供API,而Dream Machine AI创意平台等应用层产品将采用限免加付费订阅模式。
如今,Luma AI已成为少数在视频、图像、3D多模态领域全面布局的AI初创企业。其首席科学家Jiaming Song在公开访谈中提到,多模态模型训练所需的Token量远大于语言,多模态Scaling Law有助于模型更深入地理解世界——这也正是该公司持续投入多模态研发的核心逻辑。