智快网
快讯 行业 产业 汽车 科技 AI+ 热点

OpenAI启动数据合作伙伴计划,推动AI模型训练

2023-11-10来源:智快科技编辑:芳华

【智快网】11月10日消息,OpenAI宣布了一项新的数据合作伙伴计划,旨在生成用于训练AI模型的公共和私有数据集。该合作伙伴关系的目标是扩大AI技术的应用范围,从更有用的模型中受益。

根据OpenAI的博客文章,他们提到:“为了最终使AI更加安全且造福于全人类,我们希望AI模型能够深入理解所有主题、行业、文化和语言,这需要尽可能广泛的训练数据集。”

作为数据合作伙伴计划的一部分,OpenAI计划收集“反映人类社会”的“大规模”数据集,这些数据目前不容易在网上获取。尽管OpenAI计划涵盖多种数据类型,包括图像、音频和视频,但他们特别强调了对不同语言、主题和格式的数据,以更好地“表达人类意图”,例如长篇写作或对话。

OpenAI表示,他们将采取必要的步骤,包括使用光学字符识别和自动语音识别工具,对训练数据进行数字化,并在必要时删除敏感或个人信息。

OpenAI计划创建两种类型的数据集:一个是公开开源数据集,可供任何人在AI模型训练中使用,另一个是私有数据集,用于训练特定领域的专有AI模型。

此外,OpenAI还强调私有数据集的重要性,特别适用于那些希望保持数据私密性但又希望OpenAI的模型能更好地理解其领域的组织。OpenAI已经与冰岛政府和Miðeind ehf合作,提高了GPT-4对冰岛语的理解能力,并与自由法律项目合作,提高了其模型对法律文件的理解。这一合作伙伴计划标志着OpenAI在共同推动AI技术发展方面迈出的重要一步。