AI語音模型Bark:輸入文字讓AI大笑、嘆氣,展現豐富情感及語調

目前,AI模擬人聲技術已經進步到令人難分真假。就在不久前,陳珊妮宣布她的新歌〈教我如何做你的愛人〉其實是由AI所演唱的,如果不說,我們還真聽不出來。而近期抖音上一首爆紅的名曲〈Heart on My Sleeve〉,則是由一位匿名人士「Ghostwriter」運用AI技術模擬了Drake和The Weekend的聲音所創作出來的。聽聞此事的Drake也在IG上表示:「AI將是壓死駱駝的最後一根稻草。」(This is the final straw AI.)自然引發了一連串的熱議和猜測,然而,在此我們就先不多做探討了。


Bark讓AI也能笑粗乃😂

既然AI能夠把歌唱得比人類穩定甚至更好聽,但為什麼AI開口說話時,總是顯得生硬不自然,馬上破功呢?直到最近聽了Suno AI最新推出的文字轉語音(text-to-audio)模型「Bark」的示範與比較後,我終於明白了問題所在。原來,AI的語調太過於直接和流暢,反而失去了人味啊。

Suno AI所推出的「Bark」AI模型強調,它不僅具備一般文字轉語音AI所能達到的效果,而且只需透過簡單的文字指令,便能讓AI在說話過程中展現出猶豫、笑聲、悲傷、嘆息等情感和語調,甚至還能在說話前先清清喉嚨。細聽之下,AI在自我介紹時,那種邊思考邊說話的語速,加上略顯尷尬的感覺,才更接近一般人類的交流方式。

以下為官方列出的一些有趣指令,同時也表示「Bark」正在不斷學習中,請大家多多挖掘他的潛能:

  • [laughter] (大笑)
  • [laughs] (笑)
  • [sighs](嘆氣)
  • [music](音樂)
  • [gasps] (喘氣)
  • [clears throat](清喉嚨)
  • — or … for hesitations (用刪節號表示猶疑)
  • ♪ for song lyrics (用音符表示歌詞)
  • capitalization for emphasis of a word (強調用語)

如何使用Bark AI

Bark目前已經支援13種語言,包含英文、中文、日文、韓文等。而不只是支援多國語言,Bark還能穿插多國語言,一句話直接示範晶晶體,用上兩三種語言都不是問題。

而Suno AI目前也在開發一個包含了他們所有語音模型的playground,如果有興趣的話,歡迎大家前往登記

訂閱電子報

關於作者

返回頂端