近日,在中關(guān)村論壇系列活動(dòng)第12屆數(shù)字金融與科技金融大會(huì)上,螞蟻數(shù)科的 Deepfake 檢測(cè)方案入選大會(huì)“金融科技技術(shù)創(chuàng)新與應(yīng)用案例”。
螞蟻數(shù)科依托旗下天璣實(shí)驗(yàn)室,業(yè)界首次構(gòu)建了大規(guī)模、高質(zhì)量、多模態(tài)的 Deepfake 數(shù)據(jù)集,其合成超過(guò)百萬(wàn)級(jí)多媒體內(nèi)容,充分地模擬了真實(shí)世界金融風(fēng)控環(huán)境中的Deepfake攻擊樣本,成為評(píng)測(cè)現(xiàn)有金融領(lǐng)域Deepfake檢測(cè)模型性能的重要標(biāo)準(zhǔn)。在金融業(yè)務(wù)場(chǎng)景中,螞蟻數(shù)科多組測(cè)試數(shù)據(jù)集上的 Deepfake 檢測(cè)準(zhǔn)確率達(dá)到了98%以上,并成功阻止了多起利用Deepfake技術(shù)進(jìn)行的欺詐行為,保護(hù)了用戶的資產(chǎn)安全。
該數(shù)據(jù)集解決了以往金融領(lǐng)域Deepfake檢測(cè)模型無(wú)法大規(guī)模訓(xùn)練,無(wú)法在真實(shí)環(huán)境中測(cè)評(píng)的問(wèn)題,并且從多模態(tài)分析角度促進(jìn)了傳統(tǒng)檢測(cè)模型的發(fā)展。目前該數(shù)據(jù)集已經(jīng)成為螞蟻數(shù)科反深偽產(chǎn)品 ZOLOZ Deeper 對(duì)外服務(wù)客戶的關(guān)鍵能力。
據(jù)了解,螞蟻數(shù)科使用先進(jìn)的多達(dá) 81 種 Deepfake 技術(shù)生成高質(zhì)量的合成圖像,覆蓋了多種偽造技術(shù)類(lèi)型、復(fù)雜光照條件、背景環(huán)境和面部表情,以模擬復(fù)雜逼真的真實(shí)世界攻擊環(huán)境。除了靜態(tài)圖像外,還收集并生成了大量包含聲音的視頻數(shù)據(jù),包括100多種偽造技術(shù)類(lèi)型,涵蓋不同語(yǔ)種、口音和背景噪音,確保數(shù)據(jù)集的多樣性和復(fù)雜性。
在數(shù)據(jù)預(yù)處理和標(biāo)注階段,螞蟻數(shù)科對(duì)收集到的數(shù)據(jù)進(jìn)行清洗和預(yù)處理,確保數(shù)據(jù)質(zhì)量。通過(guò)專(zhuān)家團(tuán)隊(duì)對(duì)數(shù)據(jù)進(jìn)行標(biāo)注,明確每張圖像或每個(gè)視頻是否為Deepfake生成的內(nèi)容,同時(shí)保證偽造痕跡的最小化,達(dá)到高度逼真的效果。此前,螞蟻數(shù)科發(fā)布了AI數(shù)據(jù)合成與生產(chǎn)平臺(tái),在數(shù)據(jù)標(biāo)注層面實(shí)現(xiàn)了 “AI 主導(dǎo)”,標(biāo)注模型依賴人工標(biāo)注量降低了 70%以上。
此外,螞蟻數(shù)科在 2024 外灘大會(huì)發(fā)起了一場(chǎng) Deepfake 攻防挑戰(zhàn)賽,將Deepfake數(shù)據(jù)集作為比賽的基礎(chǔ)訓(xùn)練和測(cè)試數(shù)據(jù),吸引到了全球 26 個(gè)國(guó)家和地區(qū),2200 多名選手報(bào)名參賽。通過(guò)大賽選手貢獻(xiàn)的算法方案,Deepfake 數(shù)據(jù)集的攻擊質(zhì)量和檢測(cè)難度得到了有效驗(yàn)證和評(píng)估。
隨著人工智能技術(shù)的發(fā)展,Deepfake技術(shù)也在迅速進(jìn)步。這種技術(shù)利用深度學(xué)習(xí)算法,可以對(duì)視頻中的人臉進(jìn)行逼真的替換。盡管Deepfake在娛樂(lè)和傳媒等領(lǐng)域有著積極的應(yīng)用,但在金融領(lǐng)域,特別是身份驗(yàn)證和交易驗(yàn)證環(huán)節(jié),Deepfake技術(shù)帶來(lái)了新的風(fēng)險(xiǎn)。金融機(jī)構(gòu)的身份驗(yàn)證系統(tǒng)往往依賴于生物識(shí)別技術(shù),如人臉識(shí)別。一旦這些系統(tǒng)被Deepfake技術(shù)所欺騙,可能導(dǎo)致嚴(yán)重的金融欺詐。
鑒于此,開(kāi)發(fā)針對(duì)Deepfake攻擊的檢測(cè)系統(tǒng)在金融領(lǐng)域是十分必要的,但是強(qiáng)大的Deepfake檢測(cè)防御模型需要高質(zhì)量符合真實(shí)世界環(huán)境的人臉Deepfake數(shù)據(jù)集,所以如何構(gòu)建模擬真實(shí)世界的數(shù)據(jù)集以及如何驗(yàn)證其有效性是緊迫的問(wèn)題。
(責(zé)任編輯:張紫祎)