OpenAI推出ChatGPT“克星”，秒辨AI生成文本，但错把莎翁判成AI

2025-01-25

智东西2月1日报导，昨天，美国AI草创公司OpenAI颁布颁发推出一个AI文原分类器，用于帮助鉴识文原是由人类还是AI（人工智能）编写的。

那款AI工具可免费试用。用户将待检测文原复制到文原框中，点击Submit，系统就会评价该文原由AI系统生成的可能性，给出评价结果。

评价结果分红5类：很是不成能、不太可能、不清楚、可能、很是可能是AI生成。

目前试用那款AI文原分类器有一些限制，要求至少1000个字符，约莫150-250个单词。

该工具正在检测大于1000个字符的英文文原时成效更好，正在检测其余语言时的暗示要差得多，而且无奈鉴识计较机代码是由人类还是AI写的。

AI文原分类器曲通门：

hts://platform.openaiss/ai-teVt-classifier

01.

针对AI滥用风险，打造“克星”工具

AI文原分类器意正在处置惩罚惩罚ChatGPT爆红之后激发的争议。

OpenAI正在去年11月推出的ChatGPT聊天呆板人，不只能精确回覆专业问题，还能撰写诗词歌赋、告皂案牍、散文小说、电映剧原、编程代码等各种文原，大受运用者的传颂逃捧。

但跟着运用者越来越多，ChatGPT的问题也很快露出出来。一方面是它自身的局限性，譬喻素材起源可能波及抄袭、侵权，大概有时会写出看似正简曲则舛错的文原；另一方面是滥用风险，譬喻有些人会用AI工具做弊、散播虚假信息等。

为了缓解那些问题，OpenAI打造了一个全新的AI文原分类器。

那是一个GPT语言模型，对从各类起源聚集的同一主题的人类编写文原和AI编写文原的数据集停行了微调，运用了来自5个差异组织的34个模型生成的文原，以检测该文原由AI生成的可能性。

人类编写文原的数据集来自三个起源：一个新的维基百科数据集、2019年聚集的WebTeVt数据集、一组做为训练InstructGPT的一局部聚集的人类演示。

OpenAI将每个文原分红了“提示（prompt）”和“回复（response）”，依据那些提示，从OpenAI和其余组织训练的各类差异的语言模型中生成为了回复。应付Web使用步调，OpenAI调解了置信度阈值，以保持低误报率；换句话说，只要当分类器很是有自信心时，它才会将文原符号为可能是AI编写的。

OpenAI也贴心地为试用者备好了引用那款AI文原分类器的BibTeV格局。

02.

1秒给出分类结果，但偶尔错把人类当AI

咱们划分用几多段ChatGPT生成文原、几多段外媒新闻报导内容，测了测AI文原分类器的暗示。

首先，让ChatGPT就中美前沿人工智能钻研的差异之处阐明了一通。

▲ChatGPT针对“中美前沿AI钻研有哪些差异”问题的回覆

接着将那些笔朱复制粘贴到分类器的文原框中。

▲AI文原分类器秒出判断

结果，AI文原分类器1秒判断出那很是可能是AI生成的（likely AI-generated）。

换几多段由人类写的阐明生成式AI风险的内容：

▲AI分类器很快给出评价结果

AI文原分类器此次花得光阳略长，2秒给出结果：很是不成能是AI生成的（ZZZery unlikely AI-generated）。评价结果仍然精确。

不过，再提升点难度，分类器就不太灵了。

出名AI钻研人员Sebastian Raschka用莎士比亚《麦克皂》第一页的内容作测试，发现AI文原分类器误判为“很可能是AI生成的（likely AI-generated）”。

看来正在AI文原分类器眼中，莎士比亚曾经走正在了时代的前面

。

Sebastian Raschka还从原人正在2015年出版的Python ML书戴录了许多多极少段，AI文原分类器的识别也不是很准，Randy Olson的前言局部被识别成“不清楚能否由AI生成”，他原人写的前言局部被识别成“可能是AI生成的”，第一章局部被识别成“很可能是AI生成的”。

看到一系列令人哭笑不得的测试结果后，他评估说：“正在ChatGPT让你的做业变得更简略之后，它如今比以前更难了。如今，你必须多次批改原人的措辞，曲到它们看起来不再是AI生成的，而后威力提交。”

03.

识别准确率仅26%

AI文原分类器另有不少局限性

OpenAI正在取训练集分布雷同的验证集和挑战集上评价了其AI文原分类器和之前发布的分类器，挑战集由人类编写的补全（completions）和来自正在人类补全上训练的强语言模型的补全构成。

结果显示，取OpenAI之前发布的分类器相比，全新AI文原分类器的牢靠性要高得多，正在验证集上的AUC得分为0.97，正在挑战集上为0.66（OpenAI之前发布的分类器正在验证集上为0.95，正在挑战集上为0.43）。分类器牢靠性但凡跟着输入文原长度的删多而进步。

OpenAI还发现，跟着生成文原模型大小的删多，分类器的机能会下降。

换句话说，跟着语言模型范围变大，它的输出对AI文原分类器来说更像人类编写的文原。

OpenAI正在博客中坦言其分类器“不彻底牢靠”，比如正在低于1000个字符的漫笔原上很是不牢靠，纵然是较长的文原有时也会被舛错符号，有时人类书写的文原也会被错判成AI编写的文原。

正在对英语文原“挑战集”的评价中，该分类器准确地将26%的AI创做文原识别为“可能是AI编写的”，而正在9%的光阳内舛错地将人类创做文原符号为AI编写。

OpenAI倡议只对英文文原运用该AI文原分类器，因为它正在其余语言中的暗示要差得多，而且正在代码上不牢靠。另外，它也很难识别有范例准确答案的文原，譬喻你很难判断“1+1=2”是人类还是AI写的。AI文原分类器很可能正在儿童编写的文原和非英语文原上蜕化，因为它次要是正在成人编写的英语内容上停行训练。

AI书写的文原可以通过编辑来追开分类器的检测。OpenAI分类器可依据乐成的打击停行更新和从头训练，但还不清楚从历久来看检测能否具有劣势。

OpenAI也揭示道，基于神经网络的分类器正在训练数据之外的校准很差。应付取训练会合的文原有很大差异的输入，分类器有时可能对舛错的预测很是有自信心。

04.

结语：着重处置惩罚惩罚ChatGPT

正在教育规模形成的风险

由于上述局限性，OpenAI倡议正在确定内容起源的盘问拜访中只运用分类器做为寡多因素中的一个，并对AI孕育发作的虚假信息止为的风险、对大型语言模型正在教育规模形成的风险停行钻研。

OpenAI正取美国教育工做者竞争，探讨ChatGPT的才华和局限性，并为教育工做者开发了一个对于运用ChatGPT的初阶资源，此中概述了一些用途以及相关的限制和思考因素。

资源链接：

hts://platform.openaiss/docs/chatgpt-education

通过将AI文原分类器公然，OpenAI欲望从运用者这里与得更多有价值的应声，以进一步改制OpenAI正在检测AI生成文原方面的工做。

（原文系网易新闻•网易号特涩内容鼓舞激励筹划签约账号【智东西】本创内容，未经账号授权，制行随便转载。）

本题目：《OpenAI推出ChatGPT“克星”，秒辨AI生成文原，但错把莎翁判成AI》

随机推荐

国内首款智能心理机器人“静静”发布—中智关爱通...
浏览：13 时间：2025-02-11
深度学习在硬件和计算平台上的优化：实现更快、更高效的突破...
浏览：28 时间：2025-02-06
明明很瘦，为什么也有双下巴？立刻自查是否有这些问题...
浏览：29 时间：2024-04-14
人工智能时代的程序设计教学与课程设计...
浏览：41 时间：2025-01-25
线性语言在雕塑创作中的运用与研究...
浏览：29 时间：2025-02-01

出售本站【域名】【外链】

OpenAI推出ChatGPT“克星”，秒辨AI生成文本，但错把莎翁判成AI

猜你喜欢

热门文章

随机推荐

推荐文章