在人工智能生成文本日益猖獗普遍的今天,如果你呕心沥血创作的文章被判定为机器生成,你会如何?
淡定?愤怒?无语?争辩……明明是自己的创作竟然被质疑为机器生成,相信任谁也无法接受,可是一向被推崇为检测AI文本达九十巴仙准确率的检测工具为何频频“误判”?
有人说检测怎么能交由AI去判断?理应以文学感知作为检测标准,正如AI写作工具只能是辅助,检测工具当然也一样而非主导判定的最终标准。
事实也确实如此,我们必定是在阅读过程发现AI模式才以检测工具确认,人与AI都得出相同结论之下,对该篇疑似机器文本的判定是否就准确无误?
啄木鸟伯乐说在判断过程中必须慎之又慎,慎之又慎,慎之又慎啊——在维护纯人工创作的作品才能推荐上榜的规则下,误判确实寒了作者热情,于维护规则贯彻落实者而言,若因此成为众矢之的,何尝不也同样心寒?
问题是,自己的创作为何会被读出AI味道?捡测结果也显示机器生成?
AI生成文本依据人的提示词,即故事大纲、人物关系等等关键词,然后给出细节要求即可一键生成。简单来说,AI类似计算机,1加1即等于2,而答案则来自于数据库的抓取组合。
说起来与人工创作同一模式,只不过我们是在已有的故事概念中从自己大脑捕捉细节加以排列,在过程中存在变数,往往一加一不等于2。
如果你的排比句在全文大量制式化,无形中就变成了人工AI文。
在这种状况之下,存在误判吗?
人或检测工具只能从行文模式鉴定AI痕迹,但是无从确定AI文本模式背后究竟是人或机器生成。以文作为判定,其实并不存在误判,因为这篇文本事实上与AI文本如出一辙。
另外,如果以AI生成文本再经人工修饰润色,确实也有可能被判定为人工生成。
所以不论是肉眼或检测工具,都是“以文为本”。若说误判,也是误导在先。
AI写作工具可训练,检测工具也一样。所以AI生成不断进化,检测工具也日益优化,在此情况下,往后“误判”事件该如何解决?
如果往后的推文被读出AI模式,人人都以“写得像AI而已”作为自辩,那又该如何?不推,似乎对作者不公平,推,坚持AI介入文本不得上榜又变得毫无意义。
为此,我不断拿自己的文本稍嫌刻板的段落作为检测,果然,我特么也用了AI生成!
对此发现我该沮丧吗?不,这倒是在写作路上成长的一个契机——
楼船破浪平稳靠向渡口,一绣衣汉子迎风傲然挺立于船首,身后一干人等皆身着劲装,楼层顶端尚有数十弓弩手。
“来人可是绣衣楼?”我问老书虫。
“不,此人名叫高仁杰,听说乃是天眼最高统领。天眼,那可是天子的眼睛,也是天子的利器,今日大凶啊。”老书虫说他们远比绣衣楼神秘,也更为冷酷无情。
随着一波大浪冲上渡口,楼船缓缓停靠落锚。虽在远处仍可感受那双如猎鹰般犀利的眼神,可我们绝非鹰爪下的兔子。
我当然清楚这是行文模式的判断,若是检测全文的结果必然又会是人工生成,大可不必理会,但,我们既然已知问题所在,为何不加以修改呢?
楼船破浪逼近渡口,一个身着华丽绣衣汉子衣袂飞扬挺立于船首,身后一干人等皆身着劲装,楼层顶端尚有数十弓弩手。
“来人可是绣衣楼?”我问老书虫。
“不,此人名叫高仁杰,乃是天眼最高统领。天眼,那可是天子的眼睛,也是天子的利器,不可小觑啊?!崩鲜槌嫠堤煅圩橹侗刃逡侣ド衩?,也更为冷酷无情。
“说白了就是皇帝的猎犬,对吧?”卜浪四下一望又嗤笑说“岛上的兔子都溜了,待会谁是猎物还言之尚早呢?!?/b>
从这两个段落,你发现了问题没?一篇文章里的制式化占比会影响检测结果,即使真的没经过AI。
以我自己的文章作为检测,若是五千字仅仅出现两、三段落为机器生成模式,全篇检测依然会是人工生成。全篇显示为机器生成,也是因为大篇幅制式化导致。
再来,如果一篇文章从头至尾这么叙述:
李明打开窗户点了一根烟…………
他慢慢走下楼梯…………
他点了一杯咖啡和一片面包…………
李明望了一眼天空…………
全文类似这样,即使只靠肉眼也会怀疑是AI辅助,检测结果很大概率也会显示机器生成。
如何做到不要“疑似”、不要“影子”,实话说:真的很难。
可若是因为很难而放弃,未来的榜单又会如何?
也许,最后一道防线还是得辛苦伯乐——对于存在疑似AI介入的文本,还得再检测主页其它文章,如果发现确实有毋庸置疑的AI文本,既然存在疑义,大可选择不予推荐。
或者,鼓励该作者找出问题加以修改,只要检测结果显示为人工再给予推荐。从另一个角度来说,这也不失为提升自己写作技巧的机会。
事实证明,我对那个段落总觉不满意,主要就是因为刻板,像1加1等于2。
写作不是数学,1加1等于一百才好玩啊。