在人工智能领域,多模态模型的发展正成为行业焦点。智象未来CEO梅涛近日在接受采访时透露,该公司正在研发全球仅有的三家具备千亿规模参数的多模态模型之一。他强调,缺乏强大的基础模型支撑,具身智能技术难以实现跨场景的泛化应用,即便在特定领域通过数据采集取得进展,也难以复制到其他场景。
针对视频生成技术的商业化前景,梅涛表现出强烈信心。他指出,随着英伟达等芯片厂商持续迭代产品,算力成本正以每年5-10倍的性能提升速度下降,而价格涨幅有限,这为AI视频技术落地创造了基础条件。今年以来,AI生成的短视频、电商素材和短剧内容质量已达到商业可用标准,预计在影视制作、广告营销等领域将逐步取代大部分人工创作。
在商业模式方面,梅涛特别提到企业级服务的盈利能力。他透露,面向B端的多模态模型服务毛利率显著高于消费级市场,且模型Token的利润率远超传统大语言模型。这种成本优势源于多模态数据处理的复杂性和技术壁垒,使得具备核心算法能力的企业能够建立竞争护城河。
据技术资料显示,智象未来近期推出的HiDream-O1-Image-Pro图像大模型已展现技术实力。该模型采用原生全模态架构,参数量突破2000亿级,在图像生成质量、语义理解等核心指标上刷新多项行业纪录。这款产品的发布,标志着多模态技术从实验室研究向规模化应用迈出关键一步。





















