无人区一码二码三码四码区,乱子轮视频在线看

【白小姐四肖期期精準(zhǔn)一肖】

【新澳門(mén)管家婆一肖一碼100精準(zhǔn)】

【管家婆一肖資料大全9494澳彩網(wǎng)】

【澳門(mén)一肖一碼100準(zhǔn)免費(fèi)資料澳門(mén)一肖一碼百分百】

【管家婆天天彩免費(fèi)資十件大全】

【香港4949澳門(mén)免費(fèi)資料大全特色】

【澳門(mén)017期今晚上9點(diǎn)半開(kāi)什么號(hào)】

【2024新奧門(mén)歷史開(kāi)獎(jiǎng)記錄】

【香港一碼一肖100準(zhǔn)資料】

【246天天免費(fèi)資料二四六好彩】

【2024年管家婆一獎(jiǎng)一特一中】

【澳門(mén)內(nèi)部四肖八碼期期準(zhǔn)】

【2024的新澳門(mén)開(kāi)獎(jiǎng)結(jié)果查詢】

【澳門(mén)六開(kāi)獎(jiǎng)最新開(kāi)獎(jiǎng)結(jié)果今天直播】

【管家婆一肖一碼期期免費(fèi)大公開(kāi)】

【管家婆一肖一馬新澳門(mén)資料】

【澳門(mén)精準(zhǔn)資料大全正版資料風(fēng)險(xiǎn)r】

【香港澳門(mén)開(kāi)獎(jiǎng)結(jié)果開(kāi)獎(jiǎng)結(jié)果記錄】

【澳門(mén)福利彩票特別號(hào)碼資料2024年每天資料】

【澳門(mén)三中三資料全新解密】

【新澳門(mén)開(kāi)獎(jiǎng)結(jié)果直播現(xiàn)場(chǎng)視頻下載】

【2024年澳門(mén)開(kāi)獎(jiǎng)結(jié)果直播視頻下載】

【2024年正版全年資料免費(fèi)大全】

【香港碼會(huì)正版資料免費(fèi)大公開(kāi)】

【381818白小姐中特+開(kāi)獎(jiǎng)號(hào)】

新智元報(bào)道

編輯：LRST 好困

【新智元導(dǎo)讀】拯救4bit擴(kuò)散模型精度，僅需時(shí)間特征維護(hù)——以超低精度量化技術(shù)重塑圖像內(nèi)容生成！

近日，北航、莫納什、UT Austin聯(lián)合推出了時(shí)間特征維護(hù)的擴(kuò)散模型低精度無(wú)損量化方法TFMQ-DM。

不僅以4bit的權(quán)重大小實(shí)現(xiàn)了目前無(wú)損條件下最極限的擴(kuò)散模型訓(xùn)練后壓縮，同時(shí)還實(shí)現(xiàn)了超過(guò)2.38倍真實(shí)硬件加速。

這一發(fā)現(xiàn)再次將Diffusion壓縮推向全新的高度。

目前，該工作已被CVPR 2024高分接收，并被接收為Highlight Poster (Top 2.8%)。

論文地址：https://arxiv.org/pdf/2311.16503

代碼地址：https://github.com/ModelTC/TFMQ-DM

擴(kuò)散模型由于引入了時(shí)間變量t，于是在模型中注入了時(shí)序信息，這正是擴(kuò)散模型不同于以往傳統(tǒng)視覺(jué)模型的一大特征。

同時(shí)該變量也通過(guò)將時(shí)序特征融入模型去控制去噪過(guò)程。研究人員首次定義了時(shí)間特征emb，同時(shí)發(fā)現(xiàn)現(xiàn)有量化算法對(duì)于這些特征將產(chǎn)生嚴(yán)重?cái)_動(dòng)，從而破壞圖片生成質(zhì)量：

1. 時(shí)間特征擾動(dòng)：研究人員發(fā)現(xiàn)量化導(dǎo)致了明顯的時(shí)間特征誤差，并將這種特征錯(cuò)誤內(nèi)的擾動(dòng)現(xiàn)象稱為時(shí)間特征擾動(dòng)；

2. 時(shí)間信息失配：時(shí)間特征擾動(dòng)改變了原始嵌入的時(shí)間信息。具體來(lái)說(shuō)，旨在對(duì)應(yīng)于時(shí)間步長(zhǎng)。然而，由于存在顯著的誤差，量化模型的不再準(zhǔn)確地與相關(guān)聯(lián)，傾向于與對(duì)應(yīng)的時(shí)間特征更為接近，這導(dǎo)致了該方法所說(shuō)的時(shí)間信息不匹配；

3. 去噪軌跡偏離：時(shí)間信息不匹配傳遞了錯(cuò)誤的時(shí)間信息，因此導(dǎo)致圖像在去噪軌跡中對(duì)應(yīng)的時(shí)間位置發(fā)生了偏差，最終導(dǎo)致圖片不再按原軌跡去噪：

（Diffusion中的時(shí)間特征擾動(dòng)）

擾動(dòng)誘因分析

研究人員發(fā)現(xiàn)該擾動(dòng)主要由以下兩個(gè)原因造成：

1. 不合適的重建對(duì)象：已有量化重建方法并未直接優(yōu)化時(shí)間特征，同時(shí)時(shí)間特征將會(huì)受到有限的校準(zhǔn)數(shù)據(jù)影響產(chǎn)生過(guò)擬合現(xiàn)象，如下圖Prev所示，其中Freeze代表凍結(jié)相關(guān)量化參數(shù)；

2. 忽略了時(shí)間特征相關(guān)模塊中的有限激活：由于輸入是有限整數(shù)，因此產(chǎn)生時(shí)間特征的模塊將僅產(chǎn)生有限且隨時(shí)間變化的激活，而已有量化策略均考慮分布層級(jí)優(yōu)化，忽略了對(duì)于此類有限激活的擬合近似。

（Diffusion中時(shí)間特征相關(guān)模塊有限激活）

時(shí)間特征維護(hù)-——TFMQ-DM

基于以上的誘因分析研究人員提出了如下時(shí)間特征維護(hù)策略，在低bit量化下完美的保證了Diffusion模型的時(shí)間特征精度與圖像生成質(zhì)量。

（TFMQDM整體壓縮框架）

1. 時(shí)間信息塊：將時(shí)間特征生成相關(guān)模塊進(jìn)行整合得到時(shí)間信息塊（見(jiàn)框架圖）：

2. 時(shí)間信息感知重建：基于時(shí)間信息塊，研究人員提出了時(shí)間信息感知重建 (TIAR) 來(lái)應(yīng)對(duì)第一個(gè)誘因。在重構(gòu)過(guò)程中，該塊的優(yōu)化目標(biāo)如下：

3. 有限集校準(zhǔn)：為了解決第二個(gè)誘因中有限集內(nèi)激活范圍寬泛的挑戰(zhàn)，研究人員提出了有限集校準(zhǔn) (FSC) 用于激活量化。這個(gè)策略為所有時(shí)間信息塊內(nèi)的每個(gè)激活使用T組量化參數(shù)，例如激活x的量化參數(shù)可為。在時(shí)間步長(zhǎng)為t時(shí)，x的量化函數(shù)可以表示為：

其中sT, zt分別為量化縮放因子和零偏移。

實(shí)驗(yàn)結(jié)果

研究團(tuán)隊(duì)在DDIM，LDM以及Stable Diffusion系列模型上驗(yàn)證了無(wú)條件生成、分類條件生成、文本條件以及多種先進(jìn)采樣器生成下TFMQ-DM框架性能。

TFMQ-DM在平均4或8 bit權(quán)重，8或32 bit激活時(shí)，所有評(píng)價(jià)指標(biāo)均超過(guò)Q-Diffusion，PTQD等已有最先進(jìn)方法，且在大部分場(chǎng)景下，該方案使用4bit權(quán)重量化超越了已有技術(shù)在8-bit權(quán)重甚至于全精度權(quán)重的模型的性能。

結(jié)果表明，TFMQ-DM率先在4bit權(quán)重、8bit權(quán)重下實(shí)現(xiàn)了對(duì)于 Diffusion的無(wú)損壓縮加速，推動(dòng)了Diffusion無(wú)訓(xùn)練量化的邊界。

（LDM系列無(wú)條件生成對(duì)比結(jié)果）

（左：LDM系列分類條件生成對(duì)比結(jié)果；右：DDIM系列無(wú)條件生成對(duì)比結(jié)果）

具體來(lái)說(shuō)，在 CelebA-HQ 256 × 256 數(shù)據(jù)集上，與當(dāng)前最先進(jìn)的方法相比，該團(tuán)隊(duì)的方法在 w4a8 設(shè)置下將FID與sFID分別降低了 6.71和 6.60（越低越好）。

值得注意的是，現(xiàn)有方法，無(wú)論是4 bit還是8bit權(quán)重量化，在人臉數(shù)據(jù)集如 CelebA-HQ 256 × 256 和 FFHQ 256 × 256 上與 FP 模型相比都顯示出明顯的性能下降，而 TFMQ-DM 與全精度模型相比幾乎沒(méi)有性能損失。

（Stable Diffusion系列文本條件生成對(duì)比結(jié)果）

（左：PLMS系列先進(jìn)采樣器無(wú)條件生成對(duì)比結(jié)果右：DPM++系列先進(jìn)采樣器無(wú)條件生成對(duì)比結(jié)果）

此外，對(duì)于當(dāng)下最流行的文本條件生成類模型Stable Diffusion，TFMQ-DM在 w8a8 設(shè)置下的 FID 和在 w4a32 設(shè)置下的 sFID 甚至略低于全精度模型。

然而，雖然現(xiàn)有的指標(biāo)無(wú)法充分評(píng)估生成圖像的語(yǔ)義一致性以及物體細(xì)節(jié)，該團(tuán)隊(duì)提出的方法產(chǎn)生了更高質(zhì)量的圖像（見(jiàn)后文），具有更真實(shí)的細(xì)節(jié)，更好地展示了語(yǔ)義信息。

由于現(xiàn)有指標(biāo)并不能完全反映生成圖像效果的優(yōu)劣，該團(tuán)隊(duì)研究人員提供了大量可視化效果對(duì)比圖，體現(xiàn)出更加細(xì)膩和準(zhǔn)確的生成質(zhì)量：

（LDM上無(wú)條件圖像生成效果圖）

（LDM上分類條件圖像生成效果圖）

（Stable Diffusion上文本條件圖像生成效果圖，左提示詞：“A digital illustration of the Babel tower, detailed, trending in artstation, fantasy vivid colors”。右提示詞：“A beautiful castle beside a waterfall in the woods”。）

除測(cè)試集精度和可視化效果外，團(tuán)隊(duì)人員還在Intel? Xeon? Gold 6248R 處理器上驗(yàn)證框架的推理加速效果，相比原始浮點(diǎn)模型實(shí)現(xiàn)了 2.38 倍的顯著速度提升。

（Stable Diffusion在CPU上真實(shí)加速）

總結(jié)

基于時(shí)間特征維護(hù)的校準(zhǔn)量化可確保 Diffusion的量化參數(shù)準(zhǔn)確保留原始時(shí)間信息。廣泛的實(shí)驗(yàn)證明，TFMQ-DM 在 DDIM、LDM及Stable-Diffusion 系列中實(shí)現(xiàn)了令人信服的精度提升，尤其是在w4a8等極低比特設(shè)置下表現(xiàn)出了明顯優(yōu)勢(shì)；同時(shí)該方案也實(shí)現(xiàn)了真實(shí)硬件部署加速。

其次TFMQ-DM 具有良好的兼容性，可與各種Diffusion量化框架無(wú)縫集成?？偟膩?lái)說(shuō)，TFMQ-DM 提供的顯著量化精度提升與其對(duì)于硬件的高度友好，有助于在資源受限的情況下進(jìn)行實(shí)際部署，進(jìn)一步促進(jìn)了文生圖模型的更廣泛普及和應(yīng)用。

TFMQ-DM 具有顯著的兼容性，可與各種Diffusion量化框架無(wú)縫集成。TFMQ-DM 提供的顯著量化精度，有助于在資源受限的情況下進(jìn)行實(shí)際部署。

參考資料：

https://arxiv.org/pdf/2311.16503