OpenAI因准确性低而静默停产AI文本检测工具

OpenAI是领先的人工智能研究机构之一，也是GPT-4和ChatGPT的制造商，已经停止了其AI文本检测工具，称为AI分类器。该工具旨在区分人类编写的文本和AI生成的文本，但发现准确率较低。停用该工具的决定是悄悄做出的，该公告显示为对介绍该工具的原始博客文章的更新。

AI 分类器：承诺和性能

AI 分类器于 2023 年 26 月推出，承诺通过检测使用生成式 AI 创建的内容（例如 OpenAI 的 ChatGPT）来帮助教育工作者并保护学术诚信。然而，经过六个月的运行，该工具因其令人失望的性能而被关闭。OpenAI透露，该工具存在严重的准确性问题，使其在识别AI生成的内容方面不可靠。该工具仅将9%的AI编写的文本正确识别为“可能是AI编写的”，而在<>%的情况下错误地将人类编写的文本标记为AI编写的文本。

限制和未来计划

AI 分类器在处理包含少于 1，000 个字符的较短文本时遇到困难，并且经常将人工编写的内容错误地归类为 AI 生成的。基于神经网络的分类器在处理训练集之外的数据时表现不佳。尽管存在这些限制，OpenAI仍然致力于增强其工具并整合反馈。该组织目前正在研究更有效的文本来源技术，并决心开发允许用户辨别音频或视频内容是否由人工智能生成的机制。

OpenAI表示：“我们正在努力整合反馈，目前正在研究更有效的文本来源技术，并承诺开发和部署机制，使用户能够理解音频或视频内容是否是AI生成的。

对教育部门的影响

教育部门对准确的人工智能检测工具表现出浓厚的兴趣，特别是自 ChatGPT 推出以来。教育工作者对学生可能使用人工智能聊天机器人撰写论文和学术论文表示担忧。OpenAI承认了这些担忧，并表示识别AI编写的文本一直是教育工作者之间讨论的一个重要问题。虽然OpenAI删除了AI分类器，但还有其他公司承诺提供准确的AI检测，例如 originality.ai 将自己标榜为“最准确的AI内容检测器和抄袭检查器”。鉴于OpenAI自己拥有一流的AI专业知识和技术资源，这些工具也可能遇到与现已停产的AI分类器类似甚至更严重的问题。

正文完