調(diào)查發(fā)現(xiàn),89% 的美國(guó)大學(xué)生已經(jīng)在用 ChatGPT 寫作業(yè)了,而其中的 72% 也同時(shí)支持封殺。對(duì)此,老們的態(tài)度倒是褒貶不一值得玩味。ChatGPT 誕生才兩個(gè)月,但它給全世界投下的均國(guó)重磅彈」就沒停下來過。雖在很多學(xué)校,老師們防 ChatGPT 如洪水猛獸,卻還是屢禁不止一項(xiàng)調(diào)查顯示,現(xiàn)在美 89% 的大學(xué)生都是用 ChatGPT 做作業(yè)的。89% 的學(xué)生用 ChatGPT 做作業(yè)89%?沒錯(cuò),甚至,真實(shí)的比例更高。雖此前,紐約的教育系統(tǒng)面封殺了 ChatGPT,但憑學(xué)生們的聰明才智,怎么可能真正把它掉呢?果然,現(xiàn)在教育作者們不得不直面現(xiàn)實(shí)學(xué)生們已經(jīng)在用 ChatGPT 肆無忌憚地作弊了。比如,北密歇竹山學(xué)哲學(xué)教授 Antony Aumann 在為自己的評(píng)分時(shí)發(fā)現(xiàn),全第一的論文竟然是用 ChatGPT 寫的。在線課程供應(yīng)商 Study.com 向 1,000 名 18 歲以上的學(xué)生中發(fā)起一項(xiàng)調(diào)查詢問了他們?cè)谡n堂上使 ChatGPT 的情況。結(jié)果顯示 ——每 10 個(gè)學(xué)生中就有超過 9 個(gè)知道 ChatGPT,遠(yuǎn)遠(yuǎn)超過小學(xué)教育工作者超過 89% 的學(xué)生使用 ChatGPT 來完成家庭作業(yè)48% 的學(xué)生用 ChatGPT 完成小測(cè)驗(yàn),53% 的學(xué)生用 ChatGPT 寫論文,22% 的學(xué)生用 ChatGPT 生成論文大綱令人驚訝的是,72% 的大學(xué)生認(rèn)為 ChatGPT 應(yīng)該在大學(xué)網(wǎng)絡(luò)中被禁這些高得驚人的據(jù),令我們不得不正視個(gè)現(xiàn)象:AI 已經(jīng)融入了人類的社會(huì)結(jié)構(gòu),且生了廣泛而深遠(yuǎn)的后果有趣的是,雖然有將近 90% 的學(xué)生在家里用 ChatGPT 做作業(yè),但也有將近四分之的學(xué)生希望 ChatGPT 在學(xué)校被禁。也就是說,不患寡而患不均無論是在哪個(gè)場(chǎng)景,學(xué)們都希望站在同一起跑上。要么大家一起用,么就都不用。老師們?cè)?看?同時(shí),Study.com 也調(diào)查了 100 多名教育工作者,以便深入了解他們對(duì) ChatGPT 的感受。了解 ChatGPT 的大學(xué)教授中有 72% 擔(dān)心它對(duì)作弊的影響,小學(xué)教育工作者中這一例為 58%超過三分之一 (34%) 的教育工作者認(rèn)為 ChatGPT 應(yīng)該在學(xué)校中被禁,剩下 66% 的則支持學(xué)生使用看來,老師遠(yuǎn)比我們想象得開明。么他們打算如何使用 ChatGPT 呢?根據(jù) Study.com 的調(diào)查,已經(jīng)有 21% 的老師開始用 ChatGPT 輔助教學(xué)工作了 ——7% 使用 ChatGPT 提供寫作提示5% 使用 ChatGPT 來幫助授課4% 使用 ChatGPT 來制定課程計(jì)劃4% 使用 ChatGPT 教授寫作風(fēng)格3% 使用 ChatGPT 作為數(shù)字導(dǎo)師可以看到,我們的印象不同,參與查的老師中,大部分人于 AI 的態(tài)度是相對(duì)開明的,66% 的人認(rèn)為 ChatGPT 可以作為幫助學(xué)生的資源與之相比,反倒是學(xué)生自己的信任度要低得多高達(dá) 72% 的人認(rèn)為 ChatGPT 在學(xué)校里應(yīng)該被禁。在整個(gè)類歷史上,一項(xiàng)新事物誕生,往往伴隨著諸多議。很顯然,面對(duì) ChatGPT 這個(gè)誕生兩個(gè)月的「新生兒」,教團(tuán)隊(duì)內(nèi)部也并沒有統(tǒng)一見。其中一部分教師,于學(xué)生使用 ChatGPT 的態(tài)度非常鮮明 —— 就是純純的作弊!紐約大學(xué)教授:燕山像避神一樣躲開 ChatGPT!這幾天,美國(guó)的很多學(xué)校開學(xué)了,文子生中熱門的話題,無疑就是 ChatGPT。在紐約大學(xué),教學(xué)大綱的「學(xué)誠(chéng)信」部分已經(jīng)明確把用 AI 視為作弊行為,明令禁止。此外,學(xué)們?cè)谏险n第一天也收到教授的警告。在紐約大 Tisch 藝術(shù)學(xué)院的一堂課上,教授在教大綱上直截了當(dāng)?shù)貙懙?——「問:使用 ChatGPT 或其他生成文本或內(nèi)容的 AI 工具是否視為作弊?答:是。」即使在不需要寫論的課上,教授也提出了 ChatGPT 警告。一份宏觀經(jīng)濟(jì)學(xué)教學(xué)大這樣寫道:「我們刻意時(shí)間限制得很緊,所以不可能有時(shí)間查閱書籍ChatGPT 或其他資源,同時(shí)還能完成測(cè)。在測(cè)驗(yàn)的 24 小時(shí)中,學(xué)生不得與任何人包括 ChatGPT)交流。」當(dāng)然,眾所周 ChatGPT 面對(duì)數(shù)學(xué)題時(shí)常犯蠢,因此學(xué)系的教授們倒是免了一層擔(dān)憂。紐約大學(xué)文學(xué)院副院長(zhǎng) Jenni Quilter 表示,現(xiàn)在教授們都在擔(dān)心生會(huì)使用 ChatGPT 作弊。據(jù) Quilter 介紹,早在 12 月,就有學(xué)生使用 ChatGPT 的事件發(fā)生?!冈谖唇?jīng)允許的況下使用 ChatGPT,后果等同于任何學(xué)術(shù)剽竊事件,處擁有結(jié)果包重做作業(yè)、扣分、寫檢?!辜~約大學(xué)古典學(xué)教 David Levene 表示,他正在密切關(guān)注所有與 ChatGTP 相關(guān)的剽竊行為?!肝乙呀?jīng)明確警告學(xué)生除非有我的許可,否則論以任何形式使用 ChatGPT,都是作弊?!埂肝疫€跟他們說,我經(jīng)試過用 ChatGPT 寫論文,它的最好成績(jī)是 B-,最差是 F。所以如果他們想得到 B-更高的成績(jī),就應(yīng)該像避瘟神一樣避開它」紐約大學(xué)教授們的擔(dān)并非杞人憂天。根據(jù)斯福日?qǐng)?bào)進(jìn)行的一項(xiàng)調(diào)查17% 的學(xué)生曾使用 ChatGPT 來完成秋季學(xué)期的作業(yè)和考試不過,比起 Study.com 的 89% 和 48%,斯坦福這邊的比例顯然要低了很多AI 會(huì)讓學(xué)生「大腦萎縮」?很多教授在擔(dān)心AI 聊天機(jī)器人會(huì)對(duì)教育產(chǎn)生災(zāi)難性影驕山?!?僅因?yàn)橛幸慌_(tái)機(jī)器可以助我舉起啞鈴,并不意著我的肌肉就會(huì)發(fā)達(dá),西華盛頓大學(xué)歷史學(xué)教 Johann Neem 接受《華爾街日?qǐng)?bào)》采訪時(shí)說。鵌同樣地,一臺(tái)可以寫論文的機(jī)器不意味著我的思維就會(huì)展。」但其他教授認(rèn)為應(yīng)該利用 ChatGPT 強(qiáng)大的技術(shù),讓學(xué)生為新的現(xiàn)實(shí)做好準(zhǔn)備。伯州立大學(xué)教授 Alex Lawrence 表示:「我希望它能給足夠的啟發(fā)和教育,讓想要學(xué)習(xí)如何利用這些具,而不僅僅是學(xué)會(huì)更地作弊?!苟e夕法尼大學(xué)的 Ethan Mollick 說,他希望自己文學(xué)系的學(xué)生能利用技術(shù)「寫得更多」「寫得更好」。「ChatGPT 是寫作的力量倍增器,」Mollick 補(bǔ)充道?!肝蚁M麄兪褂盟!构雀杩晒喙?ChatGPT 就不行?雖然引發(fā)了學(xué)術(shù)誠(chéng)信風(fēng)暴,但許多專家認(rèn)為這項(xiàng)技術(shù)只是一個(gè)新學(xué)時(shí)代的開始 ——AI 寫作工具是學(xué)習(xí)的未來迪肯大學(xué)數(shù)字研究中心任 Phillip Dawson 表示:「我認(rèn)為這是人類能力提升一個(gè)重大時(shí)刻?!埂冈?看來,五年后畢業(yè)的學(xué)比現(xiàn)在的學(xué)生能做的事要多得多,因?yàn)樗麄冇?些 AI 工具。」他把寫論文的學(xué)生與駕駛現(xiàn)飛機(jī)的飛行員做了類比「是的,你必須學(xué)會(huì)使所有的儀器,你需要知這些儀器是如何工作的但你也需要在儀器出現(xiàn)障時(shí)駕駛飛機(jī)。」阿德德大學(xué)計(jì)算機(jī)與數(shù)學(xué)學(xué)講師 Cheryl Pope 博士表示,ChatGPT 非常適合編寫初稿,但無法取代騊駼編輯和事實(shí)核查的需求「你需要理解這個(gè)話題才能評(píng)論它產(chǎn)生的答案」ChatGPT 能讓你走出幾步,但不能讓獲得高分。但它的可能讓人興奮,能讓我們走更高的標(biāo)準(zhǔn)。就像我們兩個(gè)小時(shí)的筆試和兩個(gè)寫出的論文有不同的期。還有一個(gè)原因是,獲幫助需要大量的社會(huì)資。問別人一個(gè)蠢問題,讓人很羞愧,但是面對(duì) AI,我們永遠(yuǎn)不會(huì)有這樣的擔(dān)心。斯坦長(zhǎng)乘最強(qiáng)測(cè)器:DetectGPT有攻就有防,能為老師們解憂的 AI 作弊檢測(cè)工具,也火速誕生了最近,來自斯坦福大學(xué)研究團(tuán)隊(duì)就提出了一種于檢測(cè) AI 生成文本的全新方法 ——DetectGPT。概括來說:DetectGPT 通過利用模型的對(duì)數(shù)概函數(shù)的局部曲率(由 LLM 生成的往往占據(jù)負(fù)曲率區(qū)域),來檢測(cè)文是否出自預(yù)訓(xùn)練語言模。DetectGPT 只使用興趣模型計(jì)算出對(duì)數(shù)概率和來自另一個(gè)用預(yù)訓(xùn)練語言模型(如 T5)的隨機(jī)擾動(dòng),無需訓(xùn)練單獨(dú)的分類器,收真實(shí)或生成的段落數(shù)據(jù),或給生成文本加水印DetectGPT 的檢測(cè)效果比現(xiàn)有的零樣(zero-shot)方法更好,特別是將 20B 參數(shù) GPT-NeoX 生成的假新聞的檢測(cè)率從 0.81 AUROC 提高到了 0.95 AUROC。論文地址:https://arxiv.org/ abs / 2301.11305我們可以觀察到,機(jī)器生成的文本左)有位于對(duì)數(shù)負(fù)曲率域的趨勢(shì),而附近的樣平均具有較低的模型對(duì)概率。相比之下,人類文本(右)則不會(huì)明顯據(jù)負(fù)對(duì)數(shù)概率曲率區(qū)域接下來,想要確定一段字是否由一個(gè)特定的 LLM 產(chǎn)生,如 GPT-3。首先需要 DetectGPT 使用一個(gè)通用的預(yù)訓(xùn)練模型(如 T5)對(duì)該段落產(chǎn)生輕微的擾動(dòng)。然后再讓 DetectGPT 比較原始樣本與每個(gè)擾動(dòng)樣本對(duì)數(shù)概率。如果平均對(duì)比很高,則該樣本很可來自源模型。具體的測(cè)結(jié)果如下:此外,經(jīng)過實(shí)和生成文本的大型數(shù)集訓(xùn)練的有監(jiān)督檢測(cè)模,在分布式文本上的表與 DetectGPT 一樣,甚至更好。(上)然而,對(duì)于新的領(lǐng)域如 PubMed 醫(yī)學(xué)文本和來自 WMT16 的德國(guó)新聞數(shù)據(jù),zero-shot 是開箱即用的,而有監(jiān)督的檢方法則會(huì)由于過度的分偏移而垮掉。(下)不,DetectGPT 自身也存在著明顯的限。首先,DetectGPT 基于的是白盒假設(shè),即我們可以評(píng)估有關(guān)型的對(duì)數(shù)概率。對(duì)于那 API 背后的模型(如 GPT-3),評(píng)估概率還需要花錢。其次DetectGPT 需要獲得一個(gè)合理的擾動(dòng)數(shù)。雖然在這項(xiàng)工作中作者使用了現(xiàn)成的掩碼型,如 T5 和 mT5(用于非英語語言),但如果現(xiàn)有的始均型不能好地對(duì)空間進(jìn)行表征,么 DetectGPT 在一些領(lǐng)域的性能就可能會(huì)降低。最后,DetectGPT 比其他檢測(cè)方法的計(jì)算量更大,為它需要對(duì)每個(gè)候選段的擾動(dòng)集進(jìn)行抽樣和評(píng),而不是僅僅對(duì)候選段進(jìn)行評(píng)分。雖然 DetectGPT 現(xiàn)階段還沒開放,但問題不大。竟,市面上還有很多工可以直接使用。尤其是 GPTZero,不僅免費(fèi),而且效果拔群。小親測(cè)發(fā)現(xiàn),最新版本的 GPTZero 甚至可以明確地指出一段文字,哪段是 AI 生成的,哪段是人類寫的。體鏈接:https://gptzero.me/原理上,GPTZero 主要靠「困惑度」(文本的隨機(jī)性)和「瞿如發(fā)」(困惑度的變化)作指標(biāo)進(jìn)行判斷。在每次試中,GPTZero 還會(huì)挑選出困惑度最高那個(gè)句子,也就是 AI 寫出的最像人話的句子。參考資料:https://study.com/resources/perceptions-of-chatgpt-in-schoolshttps://stanforddaily.com/2023/01/22/scores-of-stanford-students-used-chatgpt-on-final-exams-survey-suggests/https://www.vice.com/en/article/n7zxe7/nyu-professors-tell-their-students-do-not-use-chatgpthttps://www.vice.com/en/article/xgyjm4/ai-writing-tools-like-chatgpt-are-the-future-of-learning-and-no-its-not-cheatinghttps://arxiv.org/abs/2301.11305本文來自微信公眾號(hào):新智元 (ID:AI_era)