谷歌DeepMind发布Gemini 2.0 Ultra,多模态能力实现跨越式升级
当地时间本周末,谷歌旗下顶尖AI实验室DeepMind正式发布新一代旗舰多模态大模型Gemini 2.0 Ultra,从单一模态处理升级为全模态深度融合,实现多模态能力跨越式跃升,成为当前全球顶尖的通用多模态AI模型。
这款模型彻底打破文本、图像、音频、视频、3D建模之间的交互壁垒,可实现跨模态无缝理解与逻辑推理,不仅能完成实时高精度语音对话、复杂数学推演、医学影像辅助诊断,还能直接根据自然语言指令生成代码、编辑3D模型与视频素材,内置的强化推理模块,让其在高难度专业任务中的表现全面超越前代产品,部分领域能力甚至优于人类专业从业者。
从美国科技行业视角来看,Gemini 2.0 Ultra的发布,进一步巩固了谷歌在全球通用人工智能赛道的核心地位,补齐了多模态复杂任务处理的短板,直接对标行业顶尖AI产品,同时也为美国本土企业、开发者提供了更强的多模态AI工具,推动AI从基础交互向专业实用场景加速落地,助力医疗、科研、软件开发、工业设计等领域智能化升级。
扫描二维码,在手机上阅读
