用戶名: 密碼: 驗(yàn)證碼:

英偉達(dá)攜全新AI模型“顛覆”音頻界:可創(chuàng)作音樂(lè)、修改人聲

摘要:英偉達(dá)開(kāi)發(fā)新型AI模型Fugatto,可創(chuàng)造聲音效果、改變發(fā)音方式,用自然語(yǔ)言提示生成音樂(lè)。Fugatto能合成語(yǔ)音、為音樂(lè)加音效,被視為視頻和圖像生成模型的補(bǔ)充。

  ICC訊 據(jù)報(bào)道,英偉達(dá)(Nvidia)開(kāi)發(fā)了一種新型人工智能(AI)模型,可以創(chuàng)造聲音效果,改變?nèi)说陌l(fā)音方式,并使用自然語(yǔ)言提示生成音樂(lè)。

  這個(gè)模型被命名為Fugatto,即Foundational Generative Audio Transformer Opus 1,是一個(gè)研究項(xiàng)目。英偉達(dá)表示,它不會(huì)宣布任何發(fā)布這項(xiàng)技術(shù)的計(jì)劃,但它可能會(huì)對(duì)從音樂(lè)、娛樂(lè)到翻譯服務(wù)等行業(yè)產(chǎn)生廣泛的影響。

  英偉達(dá)應(yīng)用深度學(xué)習(xí)研究副總裁Bryan Catanzaro在接受采訪時(shí)表示:“Fugatto最令人興奮的地方在于,它擁有一個(gè)模型,你可以要求它以某種方式發(fā)出聲音,這真的打開(kāi)了你對(duì)它應(yīng)用范圍的想象?!?

  他進(jìn)一步解釋說(shuō),市場(chǎng)上的其他模型,有些可以合成語(yǔ)音,有些可以為音樂(lè)添加音效,但Fugatto全部都可以做到。Catanzaro說(shuō),可以將其視為視頻和圖像生成模型(如Stability AI的Stable Video Diffusion或OpenAI的Sora)的一種補(bǔ)充。

  “這里最基本的改進(jìn)是……我們能夠使用語(yǔ)言合成音頻,我認(rèn)為,這為人們可以用來(lái)創(chuàng)造驚人音頻的工具開(kāi)辟了新的前景?!彼a(bǔ)充說(shuō)。

  根據(jù)英偉達(dá)的說(shuō)法,F(xiàn)ugatto是第一個(gè)具有新興特性的基礎(chǔ)模型,這意味著它能夠混合經(jīng)過(guò)訓(xùn)練的元素,并遵循“自由形式的指令”。

  具體而言,該模型可以通過(guò)標(biāo)準(zhǔn)的文字提示生成音頻,也可以處理您上傳的音頻文件。所以,如果你有一個(gè)人說(shuō)話的文件,你可以把那個(gè)人的話翻譯成另一種語(yǔ)言,同時(shí)讓它聽(tīng)起來(lái)像他的聲音。你也可以選擇一個(gè)簡(jiǎn)單的曲調(diào),讓它聽(tīng)起來(lái)像管弦樂(lè)表演,或者在音樂(lè)中添加不同的節(jié)拍。

  此外,你也可以上傳一個(gè)文檔,讓模型用你喜歡的任何聲音朗讀。更重要的是,你可以告訴模型發(fā)出帶有情感分量的聲音。

  不過(guò),Catanzaro也補(bǔ)充說(shuō),這種模型并不總是完美的。而且,就像生成圖像和視頻的模型一樣,F(xiàn)ugatto也會(huì)催生藝術(shù)家、音響工程師和相關(guān)領(lǐng)域人員的擔(dān)憂。但Catanzaro指出,他的本意是希望這項(xiàng)技術(shù)能幫助音樂(lè)家。

  “我希望這是藝術(shù)家探索的新工具。”“我認(rèn)為音頻一直是一個(gè)富有成效的探索領(lǐng)域。你知道,當(dāng)我們獲得新的音頻工具時(shí),有時(shí)我們會(huì)獲得新的音樂(lè)形式?!彼f(shuō)。

內(nèi)容來(lái)自:財(cái)聯(lián)社
本文地址:http://m.huaquanjd.cn//Site/CN/News/2024/11/26/20241126030217027615.htm 轉(zhuǎn)載請(qǐng)保留文章出處
關(guān)鍵字:
文章標(biāo)題:英偉達(dá)攜全新AI模型“顛覆”音頻界:可創(chuàng)作音樂(lè)、修改人聲
1、凡本網(wǎng)注明“來(lái)源:訊石光通訊網(wǎng)”及標(biāo)有原創(chuàng)的所有作品,版權(quán)均屬于訊石光通訊網(wǎng)。未經(jīng)允許禁止轉(zhuǎn)載、摘編及鏡像,違者必究。對(duì)于經(jīng)過(guò)授權(quán)可以轉(zhuǎn)載我方內(nèi)容的單位,也必須保持轉(zhuǎn)載文章、圖像、音視頻的完整性,并完整標(biāo)注作者信息和本站來(lái)源。
2、免責(zé)聲明,凡本網(wǎng)注明“來(lái)源:XXX(非訊石光通訊網(wǎng))”的作品,均為轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。因可能存在第三方轉(zhuǎn)載無(wú)法確定原網(wǎng)地址,若作品內(nèi)容、版權(quán)爭(zhēng)議和其它問(wèn)題,請(qǐng)聯(lián)系本網(wǎng),將第一時(shí)間刪除。
聯(lián)系方式:訊石光通訊網(wǎng)新聞中心 電話:0755-82960080-168   Right