谷歌发布Gemini Embedding 2模型：支持多模态数据，简化流程提升检索精度-产业-智快网

谷歌近日宣布推出其首个原生多模态嵌入模型——Gemini Embedding 2，标志着人工智能在跨模态数据处理领域迈出重要一步。该模型突破了传统嵌入模型仅支持文本的局限，能够同时处理文本、图像、视频、音频和文档五种数据类型，并将它们映射到统一的向量空间中，为机器理解复杂信息提供了全新工具。

与生成式AI模型如Gemini 3不同，嵌入模型的核心功能在于数据理解而非内容创作。Gemini Embedding 2通过将非结构化数据转换为数学向量形式，使计算机能够精准捕捉语义关系。例如，在法律诉讼场景中，该模型可同时分析合同文本、监控视频和音频证据，快速定位关键信息。测试数据显示，在处理数百万条记录时，多模态嵌入技术使检索精度提升显著，尤其在图像和视频搜索方面表现突出。

该模型支持100种语言的语义意图识别，并设定了明确的数据处理规范：文本输入上限为8192个token，图像支持PNG/JPEG格式且单次最多处理6张，视频输入时长限制在120秒内（支持MP4/MOV格式），音频可直接处理无需转录，文档则支持最多6页的PDF文件。这种设计既保证了处理效率，又覆盖了主流应用场景的需求。

谷歌工程师透露，Gemini Embedding 2已通过Gemini API和Vertex AI平台开放预览服务。现有用户可在保持gemini-embedding-001文本模型使用的同时，体验新模型的多模态能力。技术文档显示，该模型特别优化了"图像+文本"混合输入场景，能够自动分析不同媒体间的关联性，为智能客服、内容推荐等应用开辟新可能。

行业分析师指出，多模态嵌入技术的成熟将重塑信息检索范式。传统关键词搜索依赖精确匹配，而向量搜索通过语义理解可返回更符合上下文的结果。例如，当用户搜索"蓝色连衣裙"时，新模型不仅能识别商品图片，还能理解描述文字中的材质、款式等细节，甚至关联到穿搭建议视频。这种能力在电商、医疗、教育等领域具有广泛应用前景。

苹果50年历程：从初心出发，以“领先一步”创新书写科技传奇

【环球网科技综合报道】3月11日消息，据appleinsider报道称，在苹果公司迎来成立50周年之际，联合创始人史蒂夫·沃兹尼亚克（Steve Wozniak）在接受采访时强调，苹果的成功并非源于对未来的…

2026-03-11

华为鸿蒙智家智能主机X2 Pro发布：连接与计算能力大幅跃升

IT之家 3 月 11 日消息，华为今日举行鸿蒙智家技术沟通会，IT之家从现场获悉，华为发布首款搭载华为旗舰手机级芯片的智能主机——华为鸿蒙智家智能主机 X2 Pro。华为终端 BG 首席执行官何刚介绍，…

2026-03-11

三星Galaxy S26系列美国预售成绩亮眼：多渠道增长，高端机型占比突出

最新统计显示截至 2026 年 3 月 9 日，在包括 Samsung.com、主要运营商和全国零售商在内的多个渠道上，Galaxy S26系列预购量相比上一代 S25 系列增长近 25%，而且在预订订单…

2026-03-11

比亚迪或进军F1等顶级赛事，成本虽高但品牌影响力提升前景可期

2026-03-11

三星电子去年豪掷超600亿美元聚焦半导体研发与设施建设谋领先

2026-03-11

从MWC展到Magic V6发布，荣耀凭技术实力与创新营销，赢得老粉真心点赞

有人不看好荣耀，但我作为荣耀老粉，从这次巴塞罗那MWC展和荣耀Magic V6发布会后看，真的觉得荣耀有了非常积极的进步。昨天的荣耀Magic V6发布会上，让折叠屏玩水和冰冻，别家也可以。现场直播用机器…

2026-03-11

三星Galaxy S26系列3月11日开售主动AI体验让手机“更懂你”

无论你是此前已抢先预订的“先行者”，还是一直在等待这一刻的“观望者”，从今天开始，都可以通过三星商城、各大电商平台官方旗舰店以及线下授权三星门店直接购得这部“更懂你的AI手机”。S26 Ultra是首款支持A…

2026-03-11