智快网
快讯 行业 产业 汽车 科技 AI+ 热点

Claude拟推AI熟练度评分功能:助用户精准定位短板,提升AI使用效能

2026-05-27来源:快讯编辑:瑞雪

科技公司Anthropic正为其AI助手Claude开发一项创新功能——个性化“AI熟练度”评分系统。该功能基于用户与AI的交互行为生成能力评估报告,旨在帮助用户更科学地提升AI使用效率。这一设计源于今年2月发布的AI Fluency Index研究,该研究揭示了用户在使用AI工具时存在的认知偏差:虽然能更精准地提出复杂需求,却往往忽视验证AI输出的可靠性。

研究团队发现,当用户要求AI生成代码、应用程序或交互工具时,指令清晰度显著提升,但同时对AI结果的质疑意愿下降了37%。这种矛盾现象在专业用户群体中尤为明显——他们更倾向于接受排版规范、表述自信的回答,即便内容存在事实性错误。Anthropic联合学者Rick Dakan和Joseph Feller构建的4D评估框架指出,有效使用AI需要平衡“委派任务”“描述需求”“辨别信息”等核心能力。

新上线的评分系统将扫描用户在Chat对话、Code编程和CoWork协作等场景中的11项行为指标,包括需求澄清频率、修正迭代次数、多模态验证习惯等。系统还会统计近30天的功能使用数据,例如用户是否启用了web-search检索功能(当前平均使用27次/月)、是否创建过artifacts项目(平均3次/月)等。这些数据将通过算法转化为0-11分的综合评分,并生成可视化雷达图展示能力短板。

测试版本显示,评分报告会明确指出用户优势领域与改进方向。例如某用户获得7.5/11分时,系统可能标注“您在需求分解方面表现优异,但需要加强事实核查环节”,同时建议尝试未使用的memory记忆功能和connectors插件。这种动态反馈机制特别有利于新手用户,帮助他们快速建立正确的AI使用范式。

该功能目前已在Claude设置面板中开放测试,用户可自主选择是否生成能力报告。开发团队强调,所有数据采集均遵循隐私保护原则,仅用于个性化建议生成。随着AI工具深度融入工作流程,这种量化评估体系或将成为衡量数字素养的新标准。

小米MiMo大模型V2.5系列API永久降价,技术优化助力AI领域投入再加码
基于SGLang HiCache完整支持SWA(Sliding Window Attention),将KV Cache在GPU显存、CPU内存、SSD等多级存储之间的数据搬运量降低至优化前的近1/7,并将可缓…

2026-05-27

英伟达PiD图像生成技术亮相:消费级显卡秒级解码高分辨率图像
这项方法把潜在解码重新定义为条件式像素扩散,并把解码与上采样合并到同一个生成模块中,因此能在输出阶段补足纹理、结构和局部细节。 IT之家注:条件式像素扩散是一种在像素空间中逐步生成图像的方法,但它不是无条件生…

2026-05-27

荣耀600系列深度评测:影像续航双优,中端价位里的全能实力派之选
从2亿像素AI超清主摄到5000万OIS潜望长焦的完整影像系统设计;从8600mAh青海湖电池到80W+50W双快充的续航组合;从3840Hz护眼屏到IP68/69K顶级防护的细节考量——荣耀600系列以3…

2026-05-27