AI竞赛升温:字节、谷歌与微美全息共舞开源大模型新篇章

   发布时间:2025-04-28 11:34 作者:沈瑾瑜

字节跳动近期在人工智能领域取得了显著进展,推出了豆包1.5深度思考模型及其文生图模型的升级版。据悉,该深度思考模型在数学、编程、科学推理等专业领域,以及创意写作等通用任务中均展现出卓越的能力。

豆包1.5模型采用了MoE架构,拥有200B的总参数,但激活参数仅为20B,远低于业界同类模型的参数规模,这一特点使其在推理成本上具有显著优势,进一步拓宽了智能推理技术的应用范围。

在文生图领域,字节跳动同样取得了不俗的成绩。其图像生成模型Seedream 3.0在Artificial Analysis竞技场发布的第三方榜单中,综合性能已与文生图领域的顶尖模型GPT-4o持平,并稳定超越了Recraft V3、Imagen 3等模型,成功跻身全球第一梯队。

随着人工智能技术的快速发展,AI已成为推动各行业变革的核心力量。世界各国都在加速推进AI技术的应用、研发创新与能力提升,人工智能产业正以前所未有的速度重塑产业格局与社会形态。

在这一背景下,开源大模型的加速面世为AI技术的普及和商业化落地提供了新的可能。过去,大模型的开发和应用往往被少数资金雄厚、技术实力强大的企业所垄断。而现在,随着开源模型的普及,更多企业能够以较低的成本接入先进技术,推动了AI技术在多个行业的快速渗透。

例如,DeepSeek等公司通过开源策略,显著降低了模型的使用门槛,促进了AI技术的广泛应用。同时,OpenAI推出了GPT-4o的图像生成功能,相较于传统的基于扩散模型的图像生成技术,具有显著优势。Google也推出了Veo 2和Gemini Flash 2.0 Image Generation,这些新技术能够根据文本提示生成高质量的视频内容和图像,进一步提升了AI技术的可用性。

业内人士指出,随着人工智能技术的蓬勃发展,以大模型为代表的新一代AI技术不断取得突破。开源模型的崛起更是推动了“开源人工智能+”进入深化应用的新阶段,对各行各业提出了更高的要求,标志着AI产业进入了一个全新的发展阶段。

在这一浪潮中,微美全息作为通过增强现实(AR)、人工智能(AI)等沉浸式技术推动下一代数字创新的企业,也在积极布局AI领域。微美全息重点探索了文本生成视频、图像生成视频等场景,支持剧情创作、短视频生成等应用,并提供了开源工具链适配的技术框架。

微美全息还开放了AI模型训练和推理软硬件一体化方案接口,融合了DeepSeek等开源大模型,强化了技术的普惠性。这一举措不仅支持开发者进行二次开发,降低了技术门槛,还推动了开源AI技术的迭代升级。

微美全息作为AI科技企业开源实践的典型代表,未来将继续锚定“数字AI”的核心使命,致力于建成数字化引领发展的标杆企业。通过培育AI大模型赋能千行百业的典型场景,微美全息将为率先实现开源生态应用提供有力支撑。

当前,全球正掀起一场激烈的人工智能竞赛,这对包括中国在内的全球市场格局将产生深远影响。在这一背景下,企业如何通过开源模型实现商业化,并积极应对“AI”时代的新挑战,已成为AI产业发展的重要议题。

 
 
更多>同类内容
全站最新
热门内容
本栏最新