论文AI率:检测原理是什么?该如何降低论文AI率?

我是娜姐 @迪娜学姐 ,一个SCI医学期刊编辑,探索用AI工具提效论文写作和发表。

图片

上一篇介绍了10个检测AI率的在线工具。本篇来说说AI率到底是如何检测出来的?该如何有效降低论文的AI率?

和AI大模型一样,AI检测的核心也是机器学习模型,它们在包含人类创作和AI生成文本样本的大型数据集上进行训练,通过学习每种文本中存在的模式和特征,以此来区分人类创作的文本和AI生成文本。

AI检测器查找的一些关键特征包括:

单词分布和重复性:

与人类写作相比,AI语言模型有时会过度使用某些单词或短语,使得单词频率分布显得不自然。比如,之前有个调查,pubmed数据库中自2023年以来,delve into的使用频次剧增,而这个词组正是ChatGPT的使用偏好之一。



此外,在同行评审中,某些词语(如“commendable值得称赞的”、“meticulous细致的”和“intricate复杂的”)的使用频率发生了显著变化。

详见:斯坦福最新研究:ChatGPT除了写论文,竟有17%的同行评审也是AI生成。


2 连贯性和逻辑性

虽然AI生成的文本在语法上可能是正确的,但它有时可能缺乏人类写作所自然具备的深层次语义理解、逻辑连贯性。比如,中文写作中出现的“首先、其次、然而、并且”等读起来很生硬的转折和连词。

逻辑性方面,有时候AI生成的文本并不具备意思上的因果关系,也就是它在“一本正经的胡说八道”。需要人类来确认这些内容的合理性。


3 创造力和原创性的局限:

在人类擅长的创造性隐喻、类比或提出真正新颖的观点方面,AI生成的内容逊色很多,因为这些内容超出了它的训练数据范畴。


4 内容的可预测性和困惑度:

这个检测指标是说,比如困惑度分数这样的统计指标可以反映一段文本内容的可预测性或意外性。与AI生成的文本相比,人类写作往往更加多样化和充满惊喜。而AI生成的文本则会显得很平淡和稍显乏味。


5 句子结构的单一性:

人类作者的文本在句子长度和结构上表现出更大的变化性,比如长句短句结合,各种语气的句子结合,而AI生成的文本则可能较为单一。


6 风格和语调一致性:

人类作者的写作通常风格、语调和语气在一篇文章中是一致的,而AI生成的文本则可能在同一篇文章中会出现风格上的突然转变。

AI检测工具的可靠性如何?

我在对比那10款AI检测工具的时候就发现,同样的一段文本内容,不同的工具显示出的AI率有很大差异。其实最早ChatGPT也生产过一款AI检测工具,后来下架了,因为它也发现测不准。

因为,一方面,AI能够生成文本也是在大量人类文本预训练的基础上获得的,只要提示语用得好,它可以无限接近人类风格。比如我的课程中的“论文润色提示语”,AI检测率为0.

另一方面,它也可能出现误报。一个精心润色、结构化的人类写作文本,可能因为其完美无瑕的特性而被错误标记为AI生成。

此外,AI检测器需要不断追赶快速发展的生成AI技术。随着AI模型变得更加先进,曾经容易识别的机器生成内容现在越来越接近人类的个性化特征,AI文本检测器的可靠性在很大程度上取决于检测算法的持续开发和改进。


如何有效降低论文的AI率?

1 使用更精细化的提示语prompt:

简单的改写可能不足以绕过AI检测器,它们能够识别出典型的生成式AI的模式。

但是,使用更加精细化的提示语,让AI更深度的在句子结构、语法、风格上模仿并生成人类语言,从而更贴近人类写作风格。

2 混合数据来源:

从多个多样化的来源获取数据或研究内容,可以有效地掩盖AI检测工具追踪的数字足迹。

数据来源的多样性不仅丰富了内容的真实性和复杂性,而且让AI检测器更难检测。

3 增强人类元素:

即使是使用AI写作工具,融入独特的人类洞察力和经验也至关重要。

为了降低AI检测率,尝试将你的个人独特风格融入写作,比如:独特语气语调,展示细节的真实生活的例子。

4 融入习语语言:

AI生成的内容往往缺乏人类写作中特有的习语、行话和口语表达。通过融入口语和地区习语,让你的内容显得更真实、更易于得到人类的认同。

5 在修改过程中使用AI检测器:

这种预防性检测,帮助你找出容易被标记为AI生成的文本元素,比如某些重复的模式或不自然的措辞。然后再通过重构句子、改变词序、替换同义词和重组段落的方式,来针对性降低AI率。

6 持续跟踪AI技术的发展:

随着AI能力的增长,检测此类内容的技术也在不断发展。持续保持对AI进展的关注,可以有效提升你利用AI的创作效率,并避免AI检测过高。

随着AI大模型的不断进化,这些AI检测工具也需要不断改进。

AI大模型和AI检测工具的具备竞赛在不断升级。对于我们人类创作者来说,跟上技术的进展,左右大模型,右手检测工具,让这些效率工具都为“我”所用,提升论文产出效率和质量,就对了。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/diannao/11063.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

vscode打开esp-idf工程,找不到头文件,有波浪线

就像这样 多半是因为原始的工程不是用vscode的插件新建的,因此没有相关的路径。需要在工程文件夹下的.vscode文件夹中的c_cpp_properties.json文件中增加路径,可以参考插件自动新建的工程里面的写法 {"configurations": [{"name":…

线上问题——一次几经反转惊心动魄的问题排查记录

背景简述 线上某业务由于查询大量数据频繁FullGc优化,依赖于用户完课进度,测试时需要造大量的用户和专栏内容发放数据,且需要用户完课触发,因此在FAT造了一个5000人的班级,这个班级只有3个课时,测试通过脚…

Midjourney与Stable Diffusion大比拼:AI绘画技术的未来

在当今快速发展的人工智能技术浪潮中,AI绘画软件成为了艺术和技术交汇的新领域。两大巨头——Midjourney和Stable Diffusion,在这一领域中引领风骚,它们以其独特的功能和强大的生成能力,让创作者能够将想象力化为现实。本文将深入…

进程与线程含义、区别及在操作系统中的意义(简要)

在现代操作系统中,进程和线程是构建多任务环境的基础。它们虽然紧密相关,但各自扮演着不同的角色。本文将深入探讨进程与线程的概念、它们之间的区别,以及为什么操作系统中会存在进程这一概念。 进程:独立运行的实体 它是操作系…

conan2 基础入门(04)-指定编译器(gcc为例)

conan2 基础入门(04)-指定编译器(gcc为例) 文章目录 conan2 基础入门(04)-指定编译器(gcc为例)⭐准备生成profile文件预备文件和Code ⭐使用指令预览正确执行结果可能出现的问题 ⭐具体讲解conancmake ENDsettings.yml ⭐准备 生成profile文件 # 生成默认profile文件&#xf…

国产操作系统下Chrome的命令行使用 _ 统信 _ 麒麟

原文链接:国产操作系统下Chrome的命令行使用 | 统信 | 麒麟 Hello,大家好啊!今天我们来聊聊如何在国产操作系统上使用命令行操作Google Chrome。无论是进行自动化测试、网页截图还是网页数据抓取,使用命令行操作Google Chrome都能…

Go编程语言的调试器Delve | Goland远程连接Linux开发调试(go远程开发)

文章目录 Go编程语言的调试器一、什么是Delve二、delve 安装安装报错cgo: C compiler "gcc" not found: exec: "gcc": executable file not found in $PATH解决 三、delve命令行使用delve 常见的调试模式常用调试方法todo调试程序代码与动态库加载程序运行…

常用的简单友好的工单系统(免费)- WGCAT

最近在项目中,有工单系统的需求场景,所以想寻找一款轻量简单的运维工单软件,主要用来记录和处理工作中的一些故障、维护,主要用来记录设备的维护状态,包括服务器、主机、交换机那些 WGCAT,是一款简单轻量的…

知从科技战略客户经理张志强受邀出席2024 AutoSec中国汽车网络安全与数据安全峰会

4月11-12日,AutoSec8周年年会暨中国汽车网络安全及数据安全合规峰会在上海成功举办。此次峰会吸引了来自全球各地的头部汽车网络安全企业、OEM厂商、安全专家和学者等齐聚盛会,零距离共话智能网联汽车产业的新发展、新趋势。 知从科技董事长成云霞亲自带…

mapreduce | 自定义Partition分区(案例1)

1.需求 将学生成绩,按照各个成绩降序排序,各个科目成绩单独输出。 # 自定义partition 将下面数据分区处理: 人名 科目 成绩 张三 语文 10 李四 数学 30 王五 语文 20 赵6 英语 40 张三 数据 50 李四 语文 10 张三 英语 70 李四 英语…

MapReduce | 二次排序

1.需求 主播数据--按照观众人数降序排序,如果观众人数相同,按照直播时长降序 # 案例数据 用户id 观众人数 直播时长 团团 300 1000 小黑 200 2000 哦吼 400 7000 卢本伟 100 6000 八戒 250 5000 悟空 100 4000 唐僧 100 3000 # 期望结果 哦吼 4…

字典是如何实现的?Rehash 了解吗?

字典是 Redis 服务器中出现最为频繁的复合型数据结构。除了 hash 结构的数据会用到字典外,整个 Redis 数据库的所有 key 和 value 也组成了一个 全局字典,还有带过期时间的 key 也是一个字典。(存储在 RedisDb 数据结构中) 字典结构是什么样的呢&#xf…

vue3 自定义国际化、elementPlus 国际化

自定义国际化 1. 引入 vue-i18n 插件 pnpm install vue-i18nnext 2. 页面添加语言文件目录,添加自定义的语言文件 3.语言目录里添加 index.ts, 内容如下 import { createI18n } from "vue-i18n";// 自定义语言文件 import zhCN from "…

【C/C++】内存分布

本文第一部分主要介绍了程序内存区域的划分以及数据的存储。第二部分有一段代码和一些题目,全面直观得分析了程序中的数组在内存中的存储。 因为不同的数据有不同的存储需求,各区域满足不同的需求,所以程序内存会有区域的划分。 根据需求的不…

MFC重要的初始化函数InitInstance

MFC应用程序最早处理的类的初始化函数通常是CWinApp类的构造函数。CWinApp类是MFC应用程序的主类,负责整个应用程序的初始化和管理。 在MFC应用程序中,通常会创建一个派生自CWinApp类的应用程序类,例如CMyApp。在应用程序启动时,…

【数据结构(邓俊辉)学习笔记】二叉树01——二叉树表示与实现

文章目录 0.概述1.树1.1 应用1.2 有根树1.3 有序树1.4 路径环路1.5 深度 层。1.6 树的表示 2. 二叉树的概述3 二叉树实现3.1 二叉树节点3.2 二叉树节点操作接口3.3 二叉树的实现 0.概述 介绍下二叉树的表示与实现。 1.树 1.1 应用 后缀表达式。 相对于线性结构O&#xff08…

力扣HOT100 - 121. 买卖股票的最佳时机

解题思路: 每次遍历price,更新最小的cost和最大的profit class Solution {public int maxProfit(int[] prices) {int cost Integer.MAX_VALUE, profit 0;for (int price : prices) {cost Math.min(cost, price);profit Math.max(profit, price - c…

MFC的句柄概念以及句柄类型

在MFC(Microsoft Foundation Class)桌面应用程序中,窗口是通过句柄(Handle)来进行管理和操作的。 句柄是一个标识符,用于唯一标识和引用窗口、控件、设备上下文等对象。在MFC桌面应用程序中,常…

LeetCode100题总结

LeetCode100题总结 前言LeetCode100题总结题型梳理双指针11. 盛最多水的容器234.回文链表75.颜色分类206.反转链表142.环形链表215.三数之和 滑动窗口3. 无重复字符的最长子串209. 长度最小的子数组438. 找到字符串中所有字母异位词 广搜102. 二叉树的层序遍历200. 岛屿数量617…

一对一WebRTC视频通话系列(六)——部署到公网

本系列博客主要记录一对一WebRTC视频通话实现过程中的一些重点&#xff0c;代码全部进行了注释&#xff0c;便于理解WebRTC整体实现。 本专栏知识点是通过<零声教育>的音视频流媒体高级开发课程进行系统学习&#xff0c;梳理总结后写下文章&#xff0c;对音视频相关内容感…