智快网
快讯 行业 产业 汽车 科技 AI+ 热点

苹果推出Pico-Banana-400K数据集,为文本引导图像编辑模型提供优质训练资源

2025-10-29来源:快讯编辑:瑞雪

苹果公司近日宣布推出一项名为《Pico-Banana-400K:面向文本引导图像编辑的大规模数据集》的研究成果,并同步公开了包含40万张图像的完整数据集。该数据集采用非商业性研究许可协议发布,允许全球学术机构和研究人员自由使用,但明确禁止商业用途。这一举措旨在解决当前图像编辑领域数据集质量参差不齐、共享性受限等核心问题。

研究团队指出,尽管近年来图像生成与编辑技术取得显著突破,但开放研究仍面临关键瓶颈。现有数据集普遍存在三大缺陷:依赖专有模型生成的合成数据、人工筛选子集规模有限、以及领域偏移与质量控制不一致等问题。这些缺陷直接导致鲁棒图像编辑模型的开发受阻。为突破这一局限,苹果团队历时数月构建了Pico-Banana-400K数据集。

该数据集的构建流程体现了严格的筛选机制。研究人员首先从OpenImages数据集中精选涵盖人物、物体及文字场景的多样化真实照片,随后设计了35类图像修改指令,并划分为八大编辑类别。具体包括像素与光度调整(如添加复古滤镜)、以人为中心的编辑(如生成Funko-Pop风格形象)、场景构成编辑(如天气条件变换)、对象级语义修改(如物体空间关系调整)等。

在技术实现层面,团队采用谷歌的Gemini-2.5系列模型完成核心工作。每张原始图像与编辑指令输入至Nanon-Banana模型(即Gemini 2.5-Flash-Image)生成编辑结果后,需通过Gemini 2.5-Pro模型的双重验证:评估编辑是否精准遵循指令,并确保视觉质量达标。只有通过严格筛选的样本才会被纳入最终数据集。

数据集的创新性体现在其结构设计上。除包含单轮编辑样本外,还首次引入多轮连续编辑序列,模拟真实场景中的渐进式修改需求。更值得关注的是"偏好对"样本的收录——通过对比成功与失败的编辑结果,为模型提供区分优质输出的学习范例。这种设计有助于提升下一代文本引导图像编辑模型的判断能力。

研究团队坦承,当前使用的Nanon-Banana模型在精细空间控制、布局外推及文字排版处理方面仍存在改进空间。但他们强调,Pico-Banana-400K的核心价值在于为行业提供首个可复现、高质量的训练与评测基准。目前,相关研究论文已上线预印本平台arXiv,完整数据集则在GitHub平台向全球研究者开放下载。

富士康携手英伟达,休斯顿工厂将启用人形机器人专产AI服务器
今年 6 月有消息称,富士康与英伟达正在洽谈将人形机器人引入休斯顿工厂,计划在 2026 年第一季度投入使用。 综合IT之家此前报道,今年 6 月的消息称,富士康正与英伟达联合开发自研人形机器人,并已测试中…

2025-10-29

红米k80 pro价格大跳水,16G+1TB版狂降超1500元,高性价比之选
这次红米k90 promax的定价提高到3999元,比上代涨价300元,但即使是涨价仍然有销量上涨的趋势,说明大众对这款手机还是认可的,看了配置后确实提升很大,达到了旗舰手机的水平。 不过上一代红米k80…

2025-10-29

iPhone17系列热销但Air遇冷,iPhone18发布或推迟至2027年引关注
同时,目前计划是26年9月推出iPhone18Pro系列、Air轻薄机、Fold折叠屏三个产品系列,27年上半年推出标准版iPhone18和iPhone18e两款产品。 另外,有网友询问2026年上半年会…

2025-10-29

​荣耀GT2系列屏幕升级引关注,或配1.5K 165Hz屏及9000mAh大电池​
在影响续航的关键部件电池上,新机亦有显著升级,其电池容量开案约为9000mAh,这将在目前手机市场中建立起显著的续航优势。屏幕方面,GT Pro配备了一块6.78英寸的1.5K分辨率OLED直屏,支持最高14…

2025-10-29

OpenAI CEO奥尔特曼筹备Merge Labs:以声波技术探索非侵入式脑机接口新路径
夏皮罗的加入标志着 Merge Labs 在非侵入式脑机接口技术方面迈出了重要一步,与埃隆·马斯克的 Neuralink 侵入式方法形成鲜明对比。夏皮罗的实验室还开展了基因疗法研究,使细胞在超声波下可见,这可…

2025-10-28

一加15重磅登场:3999元起售,电竞三芯+7300mAh电池,游戏体验再升级
10月27日晚间,一加15正式亮相。售价方面,12GB+256GB售价3999元;12GB+512GB售价4599元;16GB+256GB售价4299元;16GB+512GB售价4899元;16GB+1TB售…

2025-10-28

通体透明似水母!西工大团队研发仿生机器人,低功耗低扰动助力深海探测
陶凯教授现场演示了该机器人的智能化应用,通过集成微型摄像头模组和嵌入式 AI处理芯片,仿生水母机器人成功在动态水环境中实现稳定悬停,并精准识别出水下的特定目标(如校徽、小丑鱼)。 据IT之家了解,这款机器…

2025-10-27

圣路易斯华盛顿大学团队研制超强量子传感器 可测3万倍大气压下量子信息
在这样条件下研究量子行为长期以来一直是一个挑战,原因很简单:设计能够承受如此强大力量的传感器极其困难。这些传感器能够在材料承受的压力超过地球大气压30,000倍的情况下检测应力和磁场。 为了构建这一传感器,…

2025-10-27

双11电竞鼠标选购指南:星闪技术如何让连接“稳”如磐石?
因此,当我们将目光投向那些对性能有着极致追求的用户时,会发现他们选择的并非是功能堆砌的产品,而是侧重于在最基础也最核心的连接稳定性上,能提供绝对保障的“利器”。 这个视频展示了传统鼠标和搭载星闪技术的鼠标在…

2025-10-27

苹果2026年9月或推三款旗舰:iPhone 18 Pro领衔,Air轻薄机与Fold折叠屏同登场
【太平洋科技】10 月 27 日消息,据知名数码博主爆料,从供应链信息判断,苹果计划在2026 年 9 月推出包括 iPhone 18Pro 系列、Air 轻薄机和 Fold 折叠屏在内的三款旗舰设备。…

2025-10-27