智快网
快讯 行业 产业 汽车 科技 AI+ 热点

谷歌苹果顶尖华人科学家携手创业,聚焦视觉推理,开启AGI新征程

2026-01-12来源:快讯编辑:瑞雪

在硅谷人工智能创业浪潮中,一家名为Elorian的初创公司正引发资本市场的强烈关注。这家由谷歌前资深研究员Andrew Dai与苹果前首席研究科学家Yinfei Yang联合创立的企业,计划通过首轮5000万美元融资切入"视觉推理"这一前沿领域,试图在多模态大模型竞争中开辟新赛道。

Andrew Dai的履历堪称AI领域的"活化石"。自2012年加入谷歌以来,他深度参与了从BERT到Gemini的预训练体系构建,特别是在数据工程领域积累了独特经验。其团队开发的预训练策略直接影响着模型对海量数据的处理效率,这种能力在当下大模型竞争中显得尤为珍贵。更早时期,他关于半监督序列学习的研究被业界认为启发了GPT系列模型的架构设计。

与Andrew Dai形成技术互补的是Yinfei Yang,这位苹果前首席科学家在多模态表示学习领域造诣深厚。他主导的图像-文本共嵌入技术突破,为解决AI模型的感知短板提供了关键方案。在苹果工作期间,他参与了多个将AI技术转化为消费级产品的项目,这种工程化思维与Andrew Dai的理论研究形成完美闭环。

Elorian的核心突破点在于"原生多模态"架构。不同于现有模型通过文本接口嫁接视觉能力的模式,该公司计划构建能够直接理解物理世界逻辑的认知系统。这种技术路线在机器人控制、复杂界面交互等场景具有革命性潜力——想象一个能直接"看懂"Excel表格并自动生成报表的AI助手,或是无需API接口就能操作专业软件的智能体。

领投方Striker Venture Partners的背景折射出资本市场的深层逻辑。该基金创始人Max Gazor作为前CRV合伙人,以精准押注技术趋势著称。此次选择Elorian,既是对"谷歌+苹果"技术组合的认可,也暗合AI发展从文本生成向物理世界交互转型的产业趋势。知情人士透露,这笔投资可能创下早期AI公司融资规模的新纪录。

当前大模型竞争已进入深水区。OpenAI凭借ChatGPT占据文本生成制高点后,谷歌Gemini、Anthropic Claude等纷纷加码多模态能力。Elorian的差异化策略在于放弃通用模型路线,转而聚焦需要强视觉推理的垂直场景。这种"小而精"的打法,或许能为初创公司突破巨头封锁提供新思路。

两位创始人的职业轨迹颇具象征意义:Andrew Dai离开效力14年的谷歌,Yinfei Yang告别刚发布AI产品的苹果,这种"反叛"精神恰是硅谷创新的源泉。他们试图证明,在算力与数据逐渐趋同的今天,对认知本质的理解才是决定AI高度的关键。正如计算机视觉领域那句名言:"摄像头只是眼睛,算法才是灵魂",这场关于"看懂"世界的竞赛,才刚刚拉开帷幕。

OPPO折叠屏双旗舰来袭!Find N6二月首发,Find N7九月对标苹果新机
此前,网间曾陆续曝出过 @OPPO 新一代大折叠手机FindN6的消息,近日网间再次曝光了OPPO折叠新机的消息,从中可以看到,今年将带来的折叠新机不止一款,而很可能是两款,分别为OPPO Find N6和…

2026-01-12

OPPO Find X9 Ultra影像配置大揭秘:双2亿镜头+10倍光变,实力领跑影像赛道
早前,博主已经曝光过一款OPPO超大杯机型初版影像方案,这款手机将搭载第五代骁龙8至尊版芯片,用脚趾头就可以想到,这肯定是Find X9Ultra了。 具体来说,Find X9 Ultra的主摄是2亿超大…

2026-01-11

2026年CSRankings:南京大学人工智能居首,中国高校包揽前五四席
在2026年CSRankings发布的人工智能学科全球排名中,南京大学以23.7分的成绩位居世界第一,这一排名反映了南京大学在人工智能领域的卓越研究实力。 南京大学:作为全球排名第一的院校,南京大学在人工智能…

2026-01-11

马斯克下周开源
【环球网科技综合报道】1月11日消息,据the verge报道,埃隆·马斯克在社交平台

2026-01-11

2025年度字词“韧”与“深度求索”:于变局中探寻中国发展新力量
最近,国家语言资源监测与研究中心、商务印书馆等单位主办的“汉语盘点”活动选出了2025年的“年度字词”:国内字是“韧”,国内词是“深度求索(DeepSeek)”。 “韧”与“深度求索(DeepSeek)”这…

2026-01-11

“死了么”登顶付费榜引热议:直白命名护独居安全,开发者坚持初衷暂不更名
该应用是一款针对独居人群设计的安全工具,其独特的功能定位与颇具争议的应用名称成为公众讨论的焦点。后续,我们将继续打磨细节,用更完善的技术与服务,守护每一位独居者的平安。” 在评论区互动中,“死了么”开发者进…

2026-01-11

英伟达Jim Fan领衔30人团队:物理图灵测试攻坚路,自曝教训押注世界模型
它通过「数字梦境」生成大量虚拟机器人行为,再从视频中提取动作数据,用于训练机器人策略,从而实现新任务和新环境中的泛化学习。 另外,DoorMan是英伟达首个仅用RGB视觉、完全在仿真中训练、可零样本迁移到真…

2026-01-11

出门问问CES发布TicNote系列AI新品,软硬件协同赋能高效协作新体验
TicNote Pods与TicNote Watch搭载出门问问自研Agent「Shadow AI」,为用户提供实时转写与翻译、会议总结、思维导图、Aha顿悟,在庞大的信息流中有效提取洞察,助力用户进入深度…

2026-01-11