更新時間:2025-07-06 11:43:06作者:佚名
完成畢業論文的那一天,王子依首次進行了關于AIGC率(即人工智能生成內容比例,簡稱AI率)的檢測。然而,檢測結果顯示,她的論文有高達70%的部分被系統判定為AI生成,這讓她感到十分震驚。
在過去的兩年間,湖北大學、福州大學、中國人民大學以及中國傳媒大學等眾多高等教育機構已將人工智能輔助撰寫畢業論文的比例納入了畢業答辯的評判標準,同時確立了相應的比例警戒線。
眾多學生發現,AI檢測的準確度存在波動:不同平臺間的結果差異顯著,有時甚至出現相互沖突的情況。在寫作規范、用詞精準的情況下,AI檢測的比率卻反而上升。有的學生引用公式、法條、經典文獻卻被判定為“AI生成”,甚至致謝部分也被標記為紅色。
學生們想方設法降低AI率,力求向AI證明自己并非人工智能,以此獲得答辯資格。在這種模糊的評判標準下,竟然催生了一條隱秘的灰色產業鏈。
在另一邊,教師們正探索在教學中如何識別和掌控AI的介入。是選擇審查還是忽略、采納還是拒絕、在哪個環節應用算作作弊?這些問題尚無定論。
這一學術監管的挑戰正影響著全球教育領域。人工智能檢測技術似乎在協助我們區分人與機器的界限,然而,許多教師開始深思,當論文寫作這一領域恰好成為AI最為擅長的時,現行的評估方式是否已經偏離了教育的根本目的?
即將畢業的大學生們在拍照留念。圖源ic
降AI率,比寫論文還難?
直到答辯前一周,王子依仍深陷AI率的困擾。
她主修小學教育專業,其畢業論文聚焦于“小學游戲化教學”這一課題。在實習階段,她便獨立完成了問卷的發放以及數據的搜集工作。她原本以為,只要對論文內容進行精煉,并在答辯中表現良好,便可以順利畢業。
今年開春,學校出臺了新的規定,要求論文在經過查重程序的同時,還需通過知網的“AI率”檢測,并且作者需在答辯前上交檢測報告。按照規定,檢測結果顯示的“AI率”不應超過40%,一旦超過此標準,論文可能會被視作學術不端行為,作者可能面臨論文重寫或延遲畢業的處罰。
王子依透露,她在數據分析環節曾借助AI工具進行樣本獨立性的驗證。不過,她注意到AI生成的檢測報告主要指出的是格式上的規范性問題,諸如“其一”“其二”這樣的分點說明以及名詞的釋義被大量標注,甚至包括致謝部分引用的一首歌詞也無法逃脫被標記的命運。
王子依努力對被標注的句子進行修改,然而AI的準確率始終在五成左右波動。于是,她在社交平臺上發起了求助,結果很快吸引了數百條回復。她發現,近一個月來,她常常在凌晨兩三點收到新的評論和收藏。
一些學生反映,他們在不同平臺上檢測論文的AI率差異極大,免費網站顯示的AI率為60%,而付費網站僅10%;還有學生發現引用的古詩詞被系統標記;更有學生表示,修改論文后AI率不降反升;甚至有學生嘗試將論文中的句號全部改為逗號,結果AI率下降了20%。
評論區充斥著眾多降低AI率的技巧。有人建議運用翻譯工具,先將中文內容轉換成其他語言,再轉譯回來,但這樣得到的語句往往顯得生硬,邏輯混亂,甚至作者自己都無法順暢閱讀。還有觀點認為,可以在句子中加入“啊”“呢”“哦”等語氣詞。
王子依甚至運用了“魔法對轟”——即利用AI降低AI率的技術。她采納了這種方法,將原本結構嚴謹的教學設計轉變為一種口語化的“老師講述內容、學生如何回應”的對話形式,她表示畢業設計翻譯的英文,這樣的文本讀起來就如同兒童繪本一般。
新京報記者在評論區留意到,一些學生提出了質疑:“為何要讓AI來決定我是否是AI?”來自某高校首飾設計專業的趙霖也對此表示了相同的困惑。她的論文中包含了作品說明,然而學校的規定要求AI生成的比例不得高于10%。她曾利用AI來輔助潤色語句,然而系統卻判定其中90%的內容為AI所生成。
她表示,我們通常是先創作出作品,隨后才闡述我們的想法,而AI只是對語言進行了梳理。然而,系統只關注“是否像AI所寫”,卻對創作過程中的思考毫無關注。在她看來,“抄襲”與“借助AI進行潤色”是截然不同的概念。前者指的是缺乏原創性,而后者則是一種輔助手段。然而,在AI檢測率面前,這兩種行為往往被同等對待。
經過反復的修訂與核查,王子依發現她的論文漏洞百出,她本人也仿佛淪為了檢測結果的傀儡。導師建議她應將主要精力放在論文內容上,不必過度糾結于檢測環節。然而,她憂慮這會影響到答辯表現,于是不得不持續刪減那些被標記為錯誤的段落。
自2024年6月起,華東師范大學與北京師范大學共同發布了《生成式人工智能學生使用指南》,明確指出AI生成的文本內容不得超過全文的20%。與此同時,天津科技大學在同年對AIGC檢測的限額設定為40%。而福州大學則規定,學生在答辯前后需進行兩次AIGC檢測,檢測結果將成為評定成績和評選優秀畢業論文的重要參考。今年以來,又有多所高校加入檢測隊伍。
眾多學子們紛紛關注起每次考試結束后的成績數據。他們中的許多人坦言,自己真正憂慮的是,在這樣一個不明確的評價體系中,必須想方設法確保在成績數字上達到標準,才有可能獲得參與答辯的機會。
王子依社交平臺上收藏的降AI率的“攻略”。 受訪者供圖
“像不像AI”誰說了算?
經過一個多月的辛勤付出,王子依向知網提交了一份檢測報告,顯示AI的檢測比例為20%。然而,她對于這個AI率的計算方法始終感到困惑。
裴煒教授,北京航空航天大學法學院及數字正義研究中心的執行主任,指出:當前大多數AI文本檢測系統依賴“語言預測”原理:他們通過分析海量的AI生成文本,總結出AI的語言使用規律,例如某個詞組之后往往會出現哪些詞匯。隨后,這些系統會將這些規律與學生論文進行對比,一旦發現論文中的某段文字與AI生成文本的特征極為相似,便有可能將其判定為“AI生成”的內容。
然而,人類在學術寫作、技術報告等規范性文本中,慣于采用規范且反復出現的表達方式。“AI生成”并非等同于“AI原創”,其實質是AI依托人類所創作的語料,模擬人類的思考與表達模式所形成的結果。換言之,即便沒有AI,人類同樣能夠創造出類似的語言關聯和表達方式。
裴煒指出,目前對于AI率的評估技術存在一定的模糊性。她曾嘗試使用過一些AI檢測軟件,發現這些工具容易造成誤傷,若直接依賴和確認其結果,則可能對學生的實際勞動成果產生誤判。
此外,不同檢測網站的原始數據庫存在差異,這也導致了檢測結果的多樣性。一位專注于人工智能領域的專業人士向新京報記者闡述,鑒于大型模型的算法內部運作和決策流程具有神秘性,我們無法解釋為何這段文字被認定為AI創作,我們只能提供一個結論,例如:“AI生成率為73%”。
Open AI在2023年1月推出了一款名為“AI Classifier”的AI文本檢測工具,其目的是用于辨別文本是否由人工智能所創造。然而,由于該工具的準確率僅有26%,Open AI在同年7月決定停止使用該工具。
而即便是人類的語言學專家,也很難分辨二者區別。
在2023年,美國南佛羅里達大學進行了一項研究,該研究邀請了語言學家對人工智能所創作的文本與人類創作的文本進行辨別。結果顯示,72位專家在區分這兩者時的準確率僅為39%。
新京報記者同樣觀察到,眾多檢測平臺均標明了“免責聲明”。這些聲明指出,“AI生成文本的可能性及被標記的文本內容,僅代表具備AI生成文本的部分特性,并不能確定其確實為AI生成,僅供參考。”“鑒于AI模型的多樣性,檢測出的結果可能會有誤差。”此外,還有“AI特征值與論文的整體質量并無直接關聯,檢測結果僅供參考。”
盡管對于AIGC檢測的運作機制和精確度人們尚不明確,然而學生們所感受到的憂慮卻是切實存在的。
新京報記者在多個社交平臺上留意到“代降AI率”的廣告,其中一些廣告宣稱通過AI網站進行降重,只需購買相應字數,即可自動生成降重內容;另一些則提供人工降重服務,并聲稱提供“一對一修改,直至滿意為止”的服務。價格區間從幾十元到幾百元不等,通常根據字數或目標AI率來定價。
記者向幾位提供“降低AI率”服務的博主進行了咨詢,他們透露,一篇長達1萬字的論文,其AI率原本為45%,只需支付80元,就能將其降低至個位數貝語網校,操作方式為“完全人工修改”。另外一位博主則是根據修改的字數來收費,每千字費用為10元。
新京報記者觀察到,某些檢測平臺在提供AI檢測率的同時,還推出了所謂的“降低AI率”服務。其中,某網站提供的智能降AI率服務,每千字收費3至5元,能夠自動對疑似AI生成的片段進行改寫;而人工降重服務則需要通過添加客服微信進行咨詢,報價將依據論文題目、檢測結果、字數以及期望降低的程度而定。
新京報記者在一家提供免費AI率檢測服務的網站上發現,存在提供付費降低AI率的業務。圖片來源:網絡截圖。
“我不再是寫作者,而是信息傳送帶”
在教學的另一領域,即便不進行檢測,眾多教師亦能從學術論文中辨識出濃厚的“人工智能”氣息。
奇怪的表現、不符合年級水平的成績、虛構的文獻資料等,這些逐漸成為他們判斷學生是否借助AI工具的依據。
彭玉,陜西某高校會計專業教師,在審閱今年提交的初稿時發現,這些稿件的結構尚且完整,字數也符合要求,然而內容卻顯得枯燥乏味,財務數據分析既簡單又過于概括。她比喻說,這些內容仿佛是從龐大的數據庫中檢索信息隨意拼湊而成。
她原本擔憂可能會做出錯誤的判斷,然而學生卻回應了“好的”,并承諾會重新撰寫。她察覺到學生似乎也感到不安。她仍記得有一個學生在感謝信中,每個句子都只是簡單地以句號結束,并且對方也直言不諱地承認“整篇內容都是AI所寫”。
在小語種的教學領域,類似的感覺也有所體現。北京某高校的一位小語種教師嚴遠指出,盡管他們學校還未實施人工智能輔助的檢測系統,但在今年的論文答辯過程中,他明顯察覺到,有部分學生的論文內容與他們的學習階段并不相符,表現在知識積累和表達能力上存在較大差距。
他強調,人工智能在翻譯任務上的作用尤為突出。學生們上交的中文翻譯作品里,充斥著大量的排比句、隱喻手法以及富有修辭色彩的陌生表述。相較之下,中文譯成其他語言的文本則顯得過于流暢和地道。
西南財經大學社會發展研究院的副教授陳晶環,她的“警覺期”來得更早一些。在Chat GPT于2022年底問世僅數月之后,她便察覺到了學生作業質量上的顯著提升。
起初她感到非常高興,然而隨后她發現,盡管作業中充斥著眾多專業詞匯和正式的表達,但段落之間卻缺少邏輯上的連貫性,語言顯得空洞無物,甚至有些句子之間頗為相似。她不禁感嘆,現在看到那些不太流暢的句子,反而感到愉悅,認為那是學生獨立創作的成果。她直言不諱地說:“就連老師自己,也感到有些矛盾。”
對于AI率檢測,老師們態度不一。
彭玉所在的學校今年首次推出了AIGC檢測機制,明文規定學生撰寫的論文中AI生成的部分不能超過35%。此外,對于檢測費用,學校規定每位學生的最高報銷額度為200元。彭玉對此表示,這一制度至少能夠起到一定的震懾作用,對一部分人起到警示效果。
裴煒提出,即便“重復率”這一概念被廣泛采用,在學位論文的評價過程中仍存在不足之處。特別是在法學領域,眾多術語和法律表述具有固定性,若為降低重復率而改變表述,可能會對論述的精確度和周密性造成損害。至于“AI率”,其情況更為復雜,鑒于當前技術和評價標準尚不完善,直接應用可能導致更多的不公正和誤判。
她覺得人機協作的邊界相當不清晰,要評估一個學生在寫作過程中運用了多少“個人智慧”實屬不易。從僅提供標題就能自動生成整篇論文,到提供全面的研究問題和框架,再由AI進行內容擴展,或是AI幫助潤色和修改文本,這些步驟之間很難用某個“比例”來明確劃分。
嚴遠指出,我們必須對新興的技術官僚主義保持警覺。學生們借助AI撰寫論文,利用AI檢測論文的AI率,甚至用AI降低AI率,這一過程逐漸演變成了一場關于誰更擅長運用AI的較量,也變成了教育者與受教育者之間智謀與勇氣的較量。
陳晶環目睹了AI誤傷的大學生案例,感嘆道:“無論是防守還是進攻,全依賴AI,似乎無人能跳出AI的籠罩。”因此,她提出建議,或許可以設立一個溝通和解釋的平臺。學生應有機會提交初稿、修改記錄等資料,而非僅憑檢測數據來判定他們是否有資格參加答辯。
而在學業之外,AI對學生思維習慣的重塑更讓部分教師警惕。
陳晶環將此現象命名為“習得性求助”。在這種求助中,遇到問題時,人們的第一反應不再是獨立思考,而是直接尋求AI的幫助。這種求助方式導致了一個結果,那就是學生主動思考的過程被省略了:“我不再是以寫作者的身份出現,而是變成了信息傳遞的載體。”
她察覺到,工具的頻繁使用不僅導致思維能力的下降,還嚴重影響了學生的閱讀能力、耐心以及表達的意愿。有些學生甚至對AI生成的內容都不愿耐心閱讀,他們覺得前兩句內容相似,便直接將其復制粘貼到論文中。
大學期間最為關鍵的成長要素,在于是否養成了獨立思考的習慣與能力。在她眼中,那種被工具所引導和操控、逐步喪失主導地位的過程,被稱作“異化”。
知網個人AIGC檢測服務頁面上的常見問題解答指出,AI所生成的特征值與論文的整體質量并無直接聯系,用戶應將檢測結果視為參考信息,并留意到其可能包含的誤差。相關信息來源于網絡截圖。
AI無法替代人類對現實的感知與回應
夜里十一點,彭玉的微信又響起畢業設計翻譯的英文,是學生發來修改完的論文。
她對此種狀況早已司空見慣。大四的學生們多數已經到實習單位報到了,他們的注意力不再集中在學術研究上,而是急于完成學業,確保順利畢業。他們會在下班之后,或是利用周末的時間來趕寫論文。在就業壓力和工具便捷的雙重影響下,撰寫論文成了一項必須完成的“任務”。
本科畢業論文的初衷在于提升學生的科研水平與激發他們的探索熱情,具體表現為:能否提出一個研究課題,并對其進行系統的剖析。
陳晶環指出,在現實操作中,這一目標經歷了不斷的“降維”處理。我們不再對本科生提出理論創新的高要求,而是更注重學生是否具備基本的學術規范。只要他們能夠運用學術語言,表達清晰流暢,即便如此,也能被視為及格。
表述清晰、語言規范且格式一致,這正是AI在模仿方面展現出的強項。
嚴遠明確指出,面對當前的技術水平,以往的工作方式或評估體系已不再適用,就如同師生之間的一場相互欺騙游戲,仿佛在假裝人工智能并不存在。
換言之,當前我國高校所采用的考核教育的方法,已無法滿足人工智能等新興技術的廣泛應用需求。許多教師甚至明確指出,這就像是運用農業時代的考試方法,來應對智能時代的工具。
裴煒指出,在AI技術迅猛發展的當下,禁止學生接觸這一技術是不現實的。他強調,在未來的社會中,學生的數字化技能和智能化水平將成為他們的重要競爭優勢。因此,問題的核心并不在于學生如何利用AI來應對考試評估,而在于教育理念、教育手段以及人才評估體系必須跟上時代的步伐。
陳晶環指出,技術革新正促使教育領域進行結構性的變革,包括轉變評價手段、升級評價標準以及重新確立教學宗旨。“這屬于教育的職責范疇,而非學生應承擔的負擔。”
相較于對AI使用的限制或單純禁止,眾多教師強調,關鍵在于教育過程中正視這些工具的存在,并指導學生在運用過程中維護自身思維的獨立性。嚴遠觀察到,借助AI輔助,學生能夠更加方便地檢索多語言資料、掌握語法要點,尤其是在教師未能觸及的領域,AI甚至發揮了“補課”的效用。
面對這一態勢,教師們正積極作出調整,他們安排了那些AI難以完成的作業,亦或是讓AI僅作為輔助工具使用。
陳晶環將課程論文寫作轉變為口頭匯報,針對某部社會學著作進行闡述,且要求學生無需借助PPT進行脫稿講解,這促使他們在深入理解的基礎上,運用自己的語言進行表達。此外,她還指導學生撰寫個人生活史。這種非結構化的、與生活緊密相連的寫作方式,迫使學生們親自動手,無法依賴AI來完成。而在研究生課程中,她則鼓勵學生有意識地去探索AI的潛在應用。
嚴遠指導學生們對文本進行翻譯并為其配聲。學生們可以借助人工智能進行翻譯,然而,他們必須親自完成配音環節。在涉及小語種的學習過程中,口頭表達的能力比書面表達更能有效檢驗他們的學習成果。
此外,在嚴遠講解生態環保等繁復話題時,由于課時有限,難以進行延伸。他倡導學生們借助人工智能整理相關背景資料,隨后在課堂上就AI提供的見解進行探討。此方法不僅豐富了學生的知識面,而且促進了他們多角度的思考。“當不同學生運用AI時,偶爾會提出出乎意料的見解,這反而使得討論更加深入和多樣化。”
裴煒認為,技術變革是每一代人必須面對的課題。從更廣闊的視角來看,隨著人工智能在學術研究中的深度介入,我們或許需要逐步探討諸如學術誠信的界限、如何在論文中表述AI的功勞、AI是否應被列為論文作者,以及如何界定學術誠信、合作與學術剽竊等問題,這或許需要教育界與學術界攜手共同研究。
在采訪過程中,陳晶環分享了她在大涼山進行田野調查的經歷。她一直致力于研究彝族地區的農村基層治理,并深入探究了當地獨特的文化傳承。這些寶貴的知識僅能通過親臨現場進行實地調查來獲取。若將研究時間線延長至十年,追蹤觀察政策對一個特定村莊的演變產生的影響,這種深度和系統性的研究是人工智能無法實現的。
她指出,即便AI能力再卓越,也無法取代人類對周遭世界的感知和應對,這種能力恰恰是我們最不應放棄的。
記者李聰、編輯陳曉舒、校對趙琳,應受訪者要求,文中使用嚴遠、王子依、趙霖、彭玉等化名代替真實姓名。