在科技飞速发展的今天,人工智能早已不是电影里遥不可及的幻想,而是逐渐融入我们生活的现实。认知智能全国重点实验室副主任王士进在接受专访时,为我们揭开了认知智能从实验室走向产业、走进大众生活的神秘面纱。

“我们的目标很明确,就是让机器能理解会思考,让认知智能既能在世界科技前沿领域有所建树,又能切实服务于国家战略和民生需求。”王士进这样阐述实验室的使命。所谓“顶天”,是探索认知智能的共性基础问题,紧跟世界科技前沿;所谓“立地”,则是将研究成果转化为在教育、医疗、交互、翻译等领域的实际应用,让智能技术惠及大众。
当下,以语言类大模型为代表的AI产品备受关注,但王士进指出,它们与实验室研究的认知智能有着本质差异。“大语言模型只是认知智能的一部分。”实验室更聚焦于认知基础共性技术,像高质量数据处理、知识表示与推理、持续学习、自主进化等。“我们致力于让机器真正理解世界,而不仅仅是生成流畅的文本。”认知智能的关键技术涵盖跨模态语义融合、可信知识推理、思维树提示、意图对齐强化学习等。实验室还在探索大模型与脑科学的交叉研究,试图解开智能产生的奥秘。
在机器能力与人类能力的对比上,王士进没有局限于单一的语言或推理能力,而是提到了大模型这一系统性突破。2023年5月6日,实验室发布了星火大模型,并不断迭代升级。2024年10月发布的讯飞星火4.0 Turbo,在七大核心能力上全面超越GPT - 4 Turbo,数学和代码能力更是超过GPT - 4o。到了2025年11月,实验室又推出深度推理大模型“讯飞星火X1.5”。这款采用MoE架构的模型,总参数达2930亿,激活参数300亿,推理效率比前代提升100%,整体性能达到GPT - 5的95%以上,覆盖130多个语种,在拉美、东盟等14个重点语言上表现优异。“我们正为世界提供AI发展的另一种选择。”王士进自豪地说。
实验室不仅追求技术突破,更注重技术的实际应用。从个性化学习系统到智医助理,从多语种语音翻译到智能客服,这些系统已经服务了亿万用户,成为推动社会发展的重要技术力量。
对于认知智能未来的落地场景,王士进认为,未来5到10年,教育、医疗、司法和人机交互四大领域将迎来深刻变革。在教育领域,实验室正在研发“口头与书面语言能力评测”“学情诊断与学习路径规划”等系统,助力实现个性化教育。在医疗领域,聚焦“时序推理智能诊断”“多模态问诊”“病历质控”等,推动优质医疗资源普惠。司法领域,AI可自动抽取案件信息、预判量刑、生成文书、推荐法条、审查证据链,提升司法效率与公正性。人机交互方面,实验室正推动“拟人化交互”技术落地,实现触摸、语音、手势、人脸等多模态融合,让人与机器的交流更自然。
当被问到“AI是否会取代人类工作”时,王士进持积极态度。“AI是人类的好帮手,它解放了生产力,激发了想象力。虽然一些重复性、基础性岗位可能被替代,但也会催生如‘AI训练师’等新职业。人与AI是协同进化的关系。”
关于机器是否会产生自我意识的问题,王士进表示,实验室在研发过程中始终将安全与伦理放在首位。“大模型的魅力在于其自主学习能力不断增强,我们必须保持敬畏。”实验室在推进技术的同时,也在探索AI的边界与可控性,确保其始终为人类服务。
实验室还有一些看似“天马行空”的研究方向,比如用AI解读梦境或创作艺术作品。王士进介绍,在艺术创作方面已有实际进展,文生图、文生视频等技术能够学习公开艺术数据,生成富有创意的内容。虽然距离“解读梦境”还有差距,但多模态技术的突破正不断拓展AI的创造力边界。
对于想深入了解认知智能的青少年,王士进建议可以从使用AI产品入手。“AI学习机、翻译机或智能音箱等,都能成为青少年接触AI的窗口。重要的是保持对AI的好奇心,因为它正在成为我们生活的一部分。”他还强调,科研和AI应用研发工作需要保持敬畏之心,实验室的每一项技术突破,都是在完成既定研究任务的基础上,面向多个领域开展基于认知大模型的应用创新,用AI解决社会刚需,这需要专注、热爱和敬畏。