【香港天下彩六肖免費(fèi)資料】

【香港2024年全年免費(fèi)正版資料】

【澳門一肖一碼100準(zhǔn)2024】

【澳門天天最準(zhǔn)最快資料】

【澳門6開彩開獎(jiǎng)結(jié)果2024】

【新澳門港澳資料大全正版資料2024年網(wǎng)站】

【2024年澳門管家婆七尾四頭中特】

【全年資料一全年資料大全】

【管家婆三期三肖必出一期】

【牛魔王論壇資料中心版本更新日期】

【新奧特開獎(jiǎng)結(jié)果49圖庫(kù)】

【9426香港最準(zhǔn)最快資料】

【7777888888管家婆網(wǎng)】

【澳門一肖一碼一必中一肖今晚】

【澳門資料大全正版資料2024年更新】

【202I澳門全年免費(fèi)資料】

【2024澳門資料大管家婆全正版資料免費(fèi)】

【24549彩霸王在看跑狗論壇】

【一肖一碼一特一】

【46008小魚兒2站玄機(jī)分站】

【澳門最快開獎(jiǎng)六開2024年全年】

【香港最準(zhǔn)最快資料黃大仙三肖三碼必中一期】

【香港精準(zhǔn)內(nèi)部馬料】

【澳門跑狗www】

【香港和彩開獎(jiǎng)碼開獎(jiǎng)結(jié)果】

楊靈投稿自凹非寺

量子位 | 公眾號(hào) QbitAI

如何生成高難度、指令超復(fù)雜的視頻呢？

北大與快手AI有解了，他們提出新框架VideoTetris，就像拼俄羅斯方塊一樣，輕松組合各種細(xì)節(jié)~

在復(fù)雜視頻生成任務(wù)中，超過(guò)了Pika，Gen-2等一眾商用模型。

這個(gè)框架不僅能夠直接增強(qiáng)現(xiàn)有模型的組合生成，還能夠支持涵蓋多復(fù)雜指令、多場(chǎng)景變更等更高難度的長(zhǎng)視頻生成。

首次定義組合視頻生成

在文生圖領(lǐng)域，RPG、Omost等項(xiàng)目已經(jīng)實(shí)現(xiàn)了復(fù)雜的組合式多物體多場(chǎng)景圖片生成。而在文生視頻領(lǐng)域，組合生成自然地?cái)U(kuò)展到時(shí)間和空間維度，這樣的場(chǎng)景還未被廣泛探索。

團(tuán)隊(duì)首次定義了組合視頻生成任務(wù)，包括兩個(gè)子任務(wù)：

1、跟隨復(fù)雜組合指令的視頻生成。2、跟隨遞進(jìn)的組合式多物體指令的長(zhǎng)視頻生成。

目前經(jīng)團(tuán)隊(duì)測(cè)試發(fā)現(xiàn)，幾乎所有開源模型，包括商用模型在內(nèi)都未能生成正確的視頻。

比如輸入“左邊一個(gè)可愛的棕色狗狗，右邊一只打盹的貓?jiān)陉?yáng)光下小憩”，結(jié)果生成的都是融合了兩個(gè)物體信息的奇怪視頻。