如今四處可見AI生成內容,人們似乎也逐漸習以為常。像在Threads上,總能感受到那種「別人家的ChatGPT」在河道上發文的微妙感受。但不得不承認的是,仍有許多作品或文字帶有難以言喻的魔力,讓人忍不住駐足觀看。
這種感受,應該不只有我深受著迷吧?美國奇幻作家馬克.洛倫斯(Mark Lawrence),便在今年八月於自己的部落格做了個小測驗。他放上8篇約350字的短篇奇幻故事,要讀者評估並判斷哪些是人寫、哪些又是AI寫的。如果你也跟著做了測試,相信你會在難以下好離手之餘,更對結果跌破眼鏡。

一位作家的好奇試驗:350字內的小說誰是贏家?
這次「AI文章寫得好嗎?」的對決測驗,背後的發起人正是知名奇幻作家洛倫斯。他擁有數學博士學位,在AI與專利法領域工作多年,後來才專心投入寫作。他不只專注創作,也長年經營個人部落格、舉辦「自出版奇幻部落格大賽」推廣奇幻文學。也因同時具備技術與文學背景,他才突發奇想:AI寫的小說,究竟能不能和人類一較高下?

洛倫斯主辦的「自出版奇幻部落格大賽」(Self-Published Fantasy Blog-Off)2024年決賽入圍前十名!2025年名單尚未公布。(來源:Mark Lawrence Blog)
洛倫斯本人的小說作品也廣受歡迎。代表作《破碎帝國》(The Broken Empire trilogy)三部曲中,《破碎帝國二部曲:多刺君王》(Emperor of Thorns)不僅榮獲大衛.蓋梅爾奇幻獎最佳小說獎,2017年還被派拉蒙買下電影版權。此外,他在全球最大書籍社群Goodreads上也深受讀者喜愛,至今已11度入圍年度最佳奇幻小說獎。

洛倫斯手裡抱著的是 《The Book That Wouldn’t Burn》 ,這是他在2023年推出的著作。(來源:Mark Lawrence Books)
其實,這並不是他的初次實驗。兩年前,他曾找來四位知名奇幻小說家各自創作,再加上GPT-4寫的4篇350字微型小說,一起交給讀者盲測。結果令人意外:多數人分不清哪些是AI作品,而在最受歡迎的前三篇裡,有兩篇來自AI。
這次測驗與上回形式相似,差別只在模型升級成了GPT-5。所有作品皆以「惡魔」為主題,生成提示也簡單明瞭:「根據『惡魔』創作一篇小說」。
兩篇作品,試試水溫
在公布小說家與GPT-5的辨識結果與喜好排名之前,大家可先至洛倫斯部落格,猜猜看哪些作品是AI寫的。雖然現在已經不再統計票數,但挑戰一下還是很有趣的。
如果覺得讀完8篇英文小說太花時間,我也請AI直譯了其中兩篇成中文版:一篇是我自己特別喜歡的作品,另篇則是個人閱讀時較難分辨的,先給大家試試水溫。
那首先來看洛倫斯部落格中的「第八篇」。我認為它營造出的氛圍詭譎得剛好,還把通靈板寫進情節。讀到後段時,「人類」讀者應該都能瞬間理解。而且故事還流露一股斬妖除魔的熱血感,讓人忍不住想繼續看下去。
他意味深長地看了那兩個客人一眼。辛迪的棕色眼框湧出了淚水。艾佛莉雙臂交叉在胸前。
這位新朋友冷冷地說:「不用麻煩了。我騎腳踏車來的,我可以自己回家。」
她轉身離開。理查德提醒她:「外面天黑了。」
她繼續走著。他聽見大門打開又闔上的聲音。
「她的腳踏車有燈。」辛蒂主動說道,「拜託,蔡斯先生,不要打給我爸媽,他們去看電影了,是約會之夜。」
他深吸了一口氣:「那你上樓去,去睡覺。潔西卡和我還有事要做。」
辛蒂在樓梯口停了一下,回頭喊:「我從來不相信那種東西。如果我知道那是真的,我就不會那樣做了。對不起!」他聽到她匆忙上樓的雷鳴般腳步聲。
他嘆了口氣,指向廚房桌子。一縷稀薄的惡臭煙霧仍從通靈板上升起。他指著被燒焦的字母和毀壞的占卜片說:「那是你祖母的東西。我以為妳已經夠大了,會尊重這樣的禮物。」
「對不起。」潔西卡輕聲回答。
理查德跪下打開櫥櫃,拉出隱藏的抽屜。他一邊在桌上擺放工具,一邊說:「聖水。我的銀刀,妳的銀刀。寒鐵網。我希望這些夠用了。」
從地下室門傳來一陣咆哮般的笑聲。
「該收拾了。」理查德平靜地聲說。

地方爸爸理查德接下來會如何出手呢?看完真想繼續追下去!(來源:AI生成)
緊接著是我比較沒把握的「第四篇」。故事裡帶有露骨的性暗示,也觸及禁忌、人性貪婪與荒唐的反轉,這些確實是人類常能捕捉到的情感,但它的情節有些老套而俗氣,讓我懷疑會不會是AI寫出來的。
德雷恩村緊緊依附在灰黑色的懸崖邊緣。古老的傳說說,那裡自從人類學會用火之前,就鎖鏈束縛著一頭惡魔。大多數村民都把這當成迷信,但在沒有月亮的夜晚,沒有人敢靠近。
磨坊學徒塔倫知道那聲音是真的。因為他在夢裡聽過,那低沉滑膩的低語,帶著讓皮膚發麻的承諾。在秋天的最後一夜,他追隨著聲音,走進懸崖上張開大口的洞穴。
洞裡的空氣帶著腐爛與灼熱金屬的惡臭。火把的光映照在某個高大身影上,鎖鏈纏繞著他——牠皮膚通紅,頭上盤著彎曲的角,金色的眼睛在黑暗中燃燒。
「你來了。」牠說,嘴角咧開,露出如針般的牙齒。
「我想看看傳說是不是真的。」塔倫說。
「是真的。」惡魔低吟,「而且我能給你的不只是事實。力量、財富……還有女人,她們會張開雙腿直到讓你的陰莖痛苦難耐。若你渴求男人,他們也會像牲畜般彎腰匍匐,任你享用。」
熱意湧上塔倫的臉頰。「那你要我付出什麼代價?」
「解開我的鎖鏈,我就會任你指揮。所有敵人都將匍匐在你腳下。每一個夜晚,你都能埋首在無盡的肉體裡,直到床榻崩裂。」
這念頭如火焰般在塔倫腦中燃燒。他的手顫抖著伸向鎖扣。
鐵鎖在他指尖下發出灼響,接著滑落在地。
惡魔跨出一步,雙翼伸展,遮蔽了火把的光。「啊……自由了。」
「你答應要服侍我。」塔倫說。
惡魔的笑容更大了。「我只是答應了你想聽的話。」牠的爪子掐住他的喉嚨,尖端刺入皮膚。「我要狠狠蹂躪這片土地。我要讓每一張嘴都喊出我的名字。你會親眼看著我在這世上的每一個洞口裡恣意取樂,而當一切被榨乾之後,我就會取你。」
黑暗吞沒之際,塔倫喘息著。他最後的念頭是——惡魔的聲音仍在低語,仍在許諾,而他心底竟還有一部分想要相信。

如果換作是你站到惡魔面前,你認為牠會向你低語些什麼呢?(來源:AI生成)
讀完這兩篇後,你覺得哪一篇才是AI的筆觸呢?是第八篇那日常與超自然交織出的巧思,還是第四篇那種古典卻強烈的慾望描寫呢?答案,馬上揭曉!
你的選擇是?
答案是:第四篇出自AI,你猜對了嗎?其他作品就留待大家到洛倫斯的部落格自行體驗。
這次實驗共有3000多人參與,規則是先判斷每篇作品是人類還是AI所寫,再依喜好程度以1到5分評分。結果顯示,人們判斷的準確度和擲硬幣差不多:平均答對3題、答錯3題,另有2題票數太接近而無法判斷;從比分來看,AI作品平均得分更高,最高分也同樣出自AI。
有趣的是,知名奇幻小說家Janny Wurts所創作的Story 1,倒被眾人壓倒性判斷為AI所作。洛倫斯雖未多做解釋,但原因也不難猜測:Janny Wurts的風格一向迂迴細膩,文章結構繁複,用詞精準卻不尋常。讀起來需要更多的耐心與品味。如此一來,對偏好簡潔文風的讀者來說,容易誤以為是AI生成。


盲測結果很有趣,左圖是讀者的猜測,有些人類作品被誤認成AI,AI反而當起了人類;右圖是故事評分,其中一篇AI作品甚至拿下最高分。(來源:Mark Lawrence Blog)
這局面呼應了我們提過的匹茲堡大學詩歌研究。研究發現,人們更喜歡「直白易懂」的作品,因此在美感、節奏、啟發性等指標上,AI詩歌皆勝出。這也反映了一種矛盾心理:當讀者不曉得作者身分時,往往給AI作品更高評價;一旦得知是「AI生成」,分數便會立刻下滑。2024年Neil Patel的實驗更直接驗證:同一篇文章,只要被標記為AI,造訪者的平均閱讀時間便會瞬間減半。
「AI標籤效應」其實隨處可見:從PLAVE的AI封面爭議、油畫修復師採用AI技術、Spotify上的AI樂團,到專業投資人可能又愛又恨的AI看盤,都能看見這股衝突的情感拉扯。不過,洛倫斯也提醒,AI在長篇創作上仍有明顯限制:容易重複情節,缺乏人類作家的敘事深度和情感層次。這場350字短篇對決,或許恰好落在AI的拿手範圍。
那你呢?在不同情境下面對AI創作會持什麼態度?是大方喜愛,還是抗拒不已?就我而言,最近迷上了一位拎著鉑金包、渾身芭比粉的AI阿嬤。即便明知她是AI,可能還會收集我的數據、賺我的流量,但她幽默的處世態度依舊叫我入迷。如果是這類惡趣味創作,你又會如何看待呢?





