智快网
快讯 行业 产业 汽车 科技 AI+ 热点

OpenAI开源新模型Circuit-Sparsity:小体量高可解释性,AI“黑箱”迎突破

2025-12-16来源:快讯编辑:瑞雪

OpenAI近日开源了一款名为Circuit-Sparsity的新型人工智能模型,其参数量仅0.4B,其中99.9%的权重被设定为零,仅保留0.1%的关键权重。这一创新旨在解决大语言模型(LLM)长期存在的“黑箱”问题,即模型决策过程难以解释、内部逻辑不透明等挑战。

在人工智能快速发展的背景下,大语言模型虽展现出强大的能力,但其内部运作机制始终难以捉摸。例如,在医疗、金融等高风险领域,模型决策的不可解释性成为其广泛应用的主要障碍。OpenAI的研究团队通过训练一种权重稀疏的Transformer模型,强制模型仅使用极少数关键连接,从而构建出内部逻辑清晰、可读的“电路”结构。

研究团队发现,在传统密集模型中,单个神经元往往需要同时处理多个概念,导致特征纠缠和决策混乱。而稀疏模型通过限制神经元之间的连接数量,使每个神经元仅负责特定任务。例如,在处理字符串闭合任务时,模型仅用12个节点就构建了一个清晰的电路,能够准确检测单引号或双引号是否闭合。部分神经元被观察到专门负责检测单引号,另一些则像“计数器”一样追踪列表的嵌套深度。

实验结果显示,稀疏模型的电路规模比密集模型缩小了16倍,这意味着解读模型思维的难度大幅降低。研究团队通过“均值消融”实验验证了这些电路的真实性:移除电路中的关键节点会导致模型性能崩溃,而移除非电路节点则几乎无影响。这一发现表明,稀疏模型中的电路确实是模型执行任务的“核心路径”。

尽管稀疏模型在可解释性方面表现突出,但其计算效率仍存在瓶颈。由于稀疏矩阵运算无法借助硬件加速,其运算速度较密集模型慢100至1000倍。这一限制使得该技术目前难以直接应用于千亿参数级别的大规模模型。为解决这一问题,研究团队提出了“桥梁网络”方案:通过在稀疏模型与密集模型之间插入编码器-解码器对,实现对密集模型的可解释性行为编辑。例如,研究人员可以在稀疏模型上修改某个特征,然后通过桥梁将其映射回密集模型,从而间接影响密集模型的决策过程。

研究团队在技术论文中指出,稀疏模型的性能与稀疏度之间存在权衡关系:在模型规模固定的前提下,提高稀疏度会略微降低模型性能,但能显著增强其可解释性。这一发现为未来设计更透明、更可控的人工智能系统提供了重要参考。

目前,OpenAI已将Circuit-Sparsity模型开源,并提供了详细的训练方法和实验数据。研究团队表示,下一步计划将相关技术扩展至更大规模的模型,同时探索从现有密集模型中提取稀疏电路的方法,以降低训练成本。团队还在研发更高效的可解释性模型训练技术,旨在推动相关技术在实际生产环境中的应用。

智能汽车ETF基金(159795)12月15日跌2.19%,年内份额规模双降流动性如何?
12月15日,汇添富中证智能汽车主题ETF(159795)收盘跌2.19%,成交额296.15万元。规模方面,截止12月12日,智能汽车ETF基金(159795)最新份额为3516.95万份,最新规模为368…

2025-12-16

智能网联汽车ETF(159872)12月15日收跌,年内份额规模双降流动性如何?
该基金管理费率每年0.50%,托管费率每年0.10%。规模方面,截止12月12日,智能网联汽车ETF(159872)最新份额为4679.97万份,最新规模为4655.17万元。股票代码股票名称持仓占比持仓股数…

2025-12-16

机器人ETF易方达(159530)12月15日跌1.85% 今年规模份额大幅增长
规模方面,截止12月12日,机器人ETF易方达(159530)最新份额为86.73亿份,最新规模为126.61亿元。回顾2024年12月31日,机器人ETF易方达(159530)份额为1.53亿份,规模为1…

2025-12-16

手机摄影新助力:优洋科技磁吸补光灯,高性价比的优质之选
手机磁吸补光灯作为提升拍摄效果的利器,正逐渐受到广大摄影爱好者和直播从业者的青睐。价格与性价比手机磁吸补光灯的价格因品牌、功能、质量等因素而异。 品牌与口碑在手机磁吸补光灯市场上,有许多品牌可供选择。 费用…

2025-12-15

2025年10-11月2000元档手机怎么选?三款新机满足不同需求全攻略
本次推荐聚焦近两个月发布的新款机型,从 “精准匹配预算”“全能体验”“游戏性能” 三大核心需求出发,筛选出 3款高性价比产品 ——既有1799元完美卡线、主打影像续航的机型,也有略超预算但性能 / 体验大幅…

2025-12-15

华为Mate X7折叠屏手机鸿蒙6.0.0.120升级,多项实用功能优化体验升级
据介绍,本次更新优化了相机在多种拍摄场景下的拍摄效果、带来了华为分享支持与 iOS 设备互传数据、户外探索模式支持多种手势交互等实用功能。华为分享 支持与 iOS、iPadOS、MacOS 设备互传图片、视…

2025-12-15

华为nova 15系列12月22日登场,Ultra版外观及核心配置抢先看
【太平洋科技】12 月 15 日消息,华为终端今日在官方微博正式宣布,将于 12 月 22 日下午 14:30 举行 nova 15系列及全场景新品发布会。 随后,华为公布了该系列 Ultra 版机型外…

2025-12-15