10月22日,以“前沿發(fā)明,引領(lǐng)AI產(chǎn)業(yè)新變革”為主題的“2024百度十大科技前沿發(fā)明”發(fā)布會在北京召開。在今年的十大前沿發(fā)明中,大模型已成為產(chǎn)業(yè)創(chuàng)新和解鎖新質(zhì)生產(chǎn)力的重要抓手,AI原生應(yīng)用正在融入生產(chǎn)生活的方方面面。北京市知識產(chǎn)權(quán)局副局長潘新勝、百度首席技術(shù)官(CTO)王海峰等出席儀式并為發(fā)布會致辭。
百度首席技術(shù)官(CTO)王海峰表示,前沿發(fā)明不僅支持百度提升了自有產(chǎn)品、業(yè)務(wù)效果和效能,也為百度產(chǎn)品AI原生化重構(gòu),為人工智能賦能千行百業(yè)貢獻(xiàn)了力量。百度發(fā)布十大發(fā)明,一方面,通過表彰這些引領(lǐng)產(chǎn)業(yè)創(chuàng)新的前沿成果,鼓勵(lì)更多的創(chuàng)新創(chuàng)造;另一方面,推動(dòng)產(chǎn)業(yè)界更多應(yīng)用這些成果,加快產(chǎn)業(yè)化進(jìn)程。早在2017年,百度就開始探索和研究大模型技術(shù),并進(jìn)一步突破基于思考模型的智能體技術(shù),拓展了大模型的能力邊界,促進(jìn)大模型應(yīng)用爆發(fā)。
北京市知識產(chǎn)權(quán)局副局長潘新勝指出,近年來,國家高度重視人工智能產(chǎn)業(yè)發(fā)展,北京市正在大力推動(dòng)人工智能創(chuàng)新策源地和產(chǎn)業(yè)高地建設(shè)。市知識產(chǎn)權(quán)局大力支持以百度公司為代表的產(chǎn)業(yè)知識產(chǎn)權(quán)龍頭企業(yè),在重點(diǎn)領(lǐng)域開展產(chǎn)業(yè)知識產(chǎn)權(quán)促進(jìn)中心建設(shè),以知識產(chǎn)權(quán)為紐帶帶動(dòng)重點(diǎn)產(chǎn)業(yè)強(qiáng)鏈增效。作為人工智能領(lǐng)域領(lǐng)先企業(yè),百度創(chuàng)新技術(shù)和知識產(chǎn)權(quán)工作已經(jīng)走在了全國的前列。希望百度以此次發(fā)布會為契機(jī),繼續(xù)加強(qiáng)科技創(chuàng)新,以人工智能技術(shù)加快賦能產(chǎn)業(yè)高質(zhì)量發(fā)展。
現(xiàn)如今,人工智能與實(shí)體經(jīng)濟(jì)加速融合,我國完備的產(chǎn)業(yè)體系為人工智能技術(shù)提供了廣闊應(yīng)用舞臺,推動(dòng)產(chǎn)業(yè)轉(zhuǎn)型升級,成為科技革命和產(chǎn)業(yè)變革的關(guān)鍵力量。2024年兩會提出“人工智能+”戰(zhàn)略,強(qiáng)調(diào)AI在數(shù)字經(jīng)濟(jì)中的重要性,加快實(shí)現(xiàn)高水平科技自立自強(qiáng)。百度作為領(lǐng)先科技企業(yè),積極推進(jìn)技術(shù)規(guī)模化落地,加強(qiáng)自主創(chuàng)新,在城市、交通、工業(yè)、金融等領(lǐng)域取得顯著成果,為科技強(qiáng)國和產(chǎn)業(yè)強(qiáng)國目標(biāo)貢獻(xiàn)力量。AI產(chǎn)業(yè)正處奇點(diǎn),技術(shù)紅利將釋放,技術(shù)發(fā)展也將為各行業(yè)轉(zhuǎn)型注入新動(dòng)力。
百度集團(tuán)專利事務(wù)部總經(jīng)理崔玲玲發(fā)布“2024百度十大科技前沿發(fā)明”:百度發(fā)布這些前沿發(fā)明成果,不僅是對百度技術(shù)創(chuàng)新能力的集中展示,更是對未來人工智能發(fā)展趨勢的深刻洞察。百度人工智能領(lǐng)域的前沿專利發(fā)明,涵蓋了從基礎(chǔ)算法到應(yīng)用場景的全方位突破,正引領(lǐng)著AI產(chǎn)業(yè)新的變革,我們希望不斷加速專利技術(shù)的產(chǎn)業(yè)化進(jìn)程,以此推動(dòng)千行萬業(yè)的智能化升級,從而促進(jìn)經(jīng)濟(jì)高質(zhì)量和可持續(xù)的發(fā)展。
自2013年入局AI領(lǐng)域,百度一直堅(jiān)持壓強(qiáng)式、馬拉松式的研發(fā)投入,近十年累計(jì)研發(fā)投入近1700億元。據(jù)國家工業(yè)信息安全發(fā)展研究中心、工信部電子知識產(chǎn)權(quán)中心今年4月份發(fā)布的《新一代人工智能專利技術(shù)分析報(bào)告》顯示,截至2023年底,百度在人工智能全領(lǐng)域?qū)@暾埩?9308件、授權(quán)量9260件,連續(xù)六年位居國內(nèi)第一;在以大模型為核心的新一代AI領(lǐng)域,百度專利申請1432件、授權(quán)651件,成為技術(shù)創(chuàng)新和專利布局領(lǐng)軍者。根據(jù)專利數(shù)據(jù)庫機(jī)構(gòu)IFIclaims發(fā)布的生成式人工智能專利圖景洞察,百度生成式人工智能專利申請量躋身全球TOP10,是唯一進(jìn)入該榜單的中國創(chuàng)新主體,并且專利技術(shù)涵蓋文本、圖像、語音、視頻四大基礎(chǔ)領(lǐng)域,成為這四個(gè)領(lǐng)域全面布局的全球四家公司之一。百度在人工智能及大模型技術(shù)領(lǐng)域的領(lǐng)先地位和卓越專利布局成績的取得,離不開其對AI技術(shù)長期持續(xù)的投入和專注。
11月12日,以“應(yīng)用來了(Applications Are Here)”為主題的百度世界2024即將在上海舉辦。作為一年中備受矚目的科技發(fā)布會,百度也將發(fā)布最新成果,再次帶來令人矚目的技術(shù)突破和產(chǎn)品發(fā)布。同時(shí),百度也將通過持續(xù)的研發(fā)投入和技術(shù)創(chuàng)新,不斷加強(qiáng)數(shù)智產(chǎn)業(yè)的快速發(fā)展,為經(jīng)濟(jì)高質(zhì)量增長帶來更多動(dòng)能。
百度2024十大科技前沿發(fā)明,具體如下:
一、基于生成式大模型的智能體技術(shù)
該發(fā)明技術(shù)創(chuàng)新性地引入了思考模型,使智能體具備了任務(wù)規(guī)劃、工具調(diào)用、知識增強(qiáng)和反思進(jìn)化等多重能力。通過系統(tǒng)化的設(shè)計(jì)與核心能力的定向優(yōu)化,能夠低成本地支持不同應(yīng)用場景下智能體的規(guī)?;ㄔO(shè)與部署;通過建設(shè)大規(guī)模仿真能力,加速智能體構(gòu)建與分發(fā)。該技術(shù)系統(tǒng)已成功應(yīng)用于文心智能體平臺、商家智能體、文心快碼等多個(gè)重點(diǎn)場景,顯著提升了智能體的研發(fā)效率,降低了研發(fā)門檻。其中,商家智能體通過規(guī)劃+專家的多模型協(xié)同技術(shù)和大規(guī)模仿真技術(shù),提升反思、進(jìn)化和使用工具的能力,構(gòu)建AI營銷能力;文心快碼依托代碼推薦和智能體系統(tǒng),與傳統(tǒng)DevOps工具鏈有機(jī)結(jié)合,推動(dòng)人機(jī)協(xié)同結(jié)對編程的深度探索與落地。
二、基于大模型高效訓(xùn)練框架的多模型協(xié)同進(jìn)化技術(shù)
該發(fā)明技術(shù)從工程和算法兩個(gè)角度攻克系列難題。工程架構(gòu)上,從混合并行策略、通信效率、計(jì)算存儲優(yōu)化全方位創(chuàng)新突破,顯著提升大語言模型訓(xùn)練性能,支撐文心全系列模型全流程高效穩(wěn)定訓(xùn)練。算法策略上,研發(fā)了大小模型協(xié)同的預(yù)訓(xùn)練技術(shù),攻克了模型間知識難以繼承的技術(shù)難題,改變了傳統(tǒng)模型的訓(xùn)練范式,降低了新模型訓(xùn)練成本?;谠摪l(fā)明構(gòu)建了各規(guī)模模型的技術(shù)壁壘,使文心大模型訓(xùn)練吞吐速度在過去一年提升了4.1倍,支持文心一言高效滿足不同需求的廣泛業(yè)務(wù),賦能千行萬業(yè)。
三、基于大模型和知識檢索增強(qiáng)技術(shù)的多模態(tài)內(nèi)容創(chuàng)編一體的智能系統(tǒng)
本發(fā)明技術(shù)綜合運(yùn)用知識增強(qiáng)、多源內(nèi)容解析、融合式編輯、檢索增強(qiáng)文生圖等技術(shù),解決了專業(yè)長文及多模態(tài)內(nèi)容生成質(zhì)量弱、創(chuàng)編無法共享容器、文生圖主體準(zhǔn)確性差等問題。檢索增強(qiáng)文生圖,旨在通過智能判斷用戶需求自適應(yīng)處理參考圖,進(jìn)而基于混合模態(tài)的生圖系統(tǒng)顯著提升了生圖主體的一致性,有效彌補(bǔ)長尾內(nèi)容刻畫不準(zhǔn)確的短板,整體效果遠(yuǎn)遠(yuǎn)超過文生圖原生系統(tǒng)。百度文庫已經(jīng)在基于用戶指令及上傳內(nèi)容實(shí)時(shí)生成行業(yè)研報(bào)、演示文稿、思維導(dǎo)圖、畫本漫畫并支持一站式編輯、跨模態(tài)轉(zhuǎn)換、通用/個(gè)性化生圖等復(fù)雜任務(wù)方面取得了顯著的效果提升。2024年8月,極光旗下月狐數(shù)據(jù)發(fā)布報(bào)告顯示,百度文庫智能PPT市場份額已達(dá)八成,近3月用戶規(guī)模復(fù)合增速達(dá)23%,增速遠(yuǎn)超行業(yè)水平。
四、支持規(guī)?;淖詣?dòng)駕駛定位和車道級地圖生成技術(shù)
該發(fā)明技術(shù)突破了傳統(tǒng)模式的效率和成本問題,降低了地圖制圖成本95%,車道級道路里程超過360萬公里,實(shí)現(xiàn)全國超過41000個(gè)城鄉(xiāng)鎮(zhèn)道路的全覆蓋?;诘貓D數(shù)據(jù)進(jìn)一步構(gòu)建的多模態(tài)傳感器融合的自動(dòng)駕駛高精定位技術(shù),精度達(dá)到厘米級,極大提高了可量產(chǎn)性,將車端定位依賴的地圖包體積降低97.5%,可靠性達(dá)到99.9999%,全面支撐目前蘿卜快跑全無人駕駛的規(guī)?;\(yùn)營,在高架橋下、多層路、隧道等各種復(fù)雜困難場景實(shí)現(xiàn)全無人駕駛。
五、面向大模型智能化的個(gè)性化記憶機(jī)制
該發(fā)明技術(shù)創(chuàng)新性地提出了一套全面的記憶機(jī)制,涵蓋記憶加工、存儲、管理、觸發(fā)和利用五大模塊,賦予大模型個(gè)性化記憶能力。記憶加工借鑒人類海馬體機(jī)制,實(shí)現(xiàn)了對全場景用戶信息的深度理解和精準(zhǔn)加工;記憶管理支持用戶主動(dòng)與系統(tǒng)自動(dòng)的增刪改查,確保了記憶庫的實(shí)時(shí)更新與準(zhǔn)確;記憶觸發(fā)和利用,通過相關(guān)記憶的推測生成,輔助大模型產(chǎn)生更加擬人和個(gè)性化的回復(fù)。該發(fā)明技術(shù)已廣泛應(yīng)用于智能AI助手、數(shù)字人等場景。
六、基于大模型的超擬真數(shù)字人建模、驅(qū)動(dòng)與生成系統(tǒng)
該發(fā)明技術(shù)提出了一整套的超擬真數(shù)字人建模、驅(qū)動(dòng)和生成方案。針對真人數(shù)字人,研發(fā)了數(shù)據(jù)驅(qū)動(dòng)的人像建模、跨模態(tài)驅(qū)動(dòng)和人像視頻生成大模型,實(shí)現(xiàn)了自然、擬真的數(shù)字人內(nèi)容生產(chǎn),獨(dú)家支持大幅動(dòng)作&遮擋場景的直播人像克隆,并實(shí)現(xiàn)了首個(gè)全身智能驅(qū)動(dòng)直播間落地。針對超寫實(shí)3D數(shù)字人,基于文心大模型研發(fā)了模態(tài)遷移和多智能體協(xié)作技術(shù),實(shí)現(xiàn)了分鐘級制作媲美影視大片、3A游戲的超寫實(shí)數(shù)字人形象及運(yùn)營內(nèi)容。本發(fā)明技術(shù)已廣泛地應(yīng)用于數(shù)字人直播、視頻生產(chǎn)、智能體等眾多真人和3D數(shù)字人的產(chǎn)品中。
七、基于大模型的生成式商業(yè)檢索系統(tǒng)
該發(fā)明技術(shù)變革了傳統(tǒng)的 “索引-召回-排序”流程,扁平化系統(tǒng)漏斗,減少信息損失,通過構(gòu)建索引學(xué)習(xí)任務(wù),將商業(yè)信息編碼進(jìn)模型參數(shù),實(shí)現(xiàn)“模型即索引”,利用大模型的理解和推理能力,實(shí)現(xiàn)“生成即檢索”,新范式顯著提升系統(tǒng)定向效率120%。該發(fā)明所涉及項(xiàng)目業(yè)界率先落地,實(shí)現(xiàn)大規(guī)模工業(yè)化應(yīng)用,生成式大模型結(jié)合商業(yè)搜索場景取得多項(xiàng)技術(shù)創(chuàng)新,創(chuàng)意豐富度提升37倍,創(chuàng)意質(zhì)量提升92%,獲得了顯著的業(yè)務(wù)收益和廣泛技術(shù)影響力。
八、大模型數(shù)據(jù)飛輪技術(shù)
該發(fā)明技術(shù)通過整合用戶反饋、執(zhí)行反饋和自監(jiān)督反饋等多來源和形式的信息,自動(dòng)識別模型缺陷并高效合成高質(zhì)量、多樣化的訓(xùn)練數(shù)據(jù)。同時(shí)結(jié)合多源反饋的強(qiáng)化學(xué)習(xí)方法,顯著提升了模型訓(xùn)練效果。該創(chuàng)新技術(shù)構(gòu)建了一個(gè)能夠持續(xù)自我改進(jìn)的數(shù)據(jù)飛輪,有效突破了大模型的數(shù)據(jù)瓶頸,降低了數(shù)據(jù)獲取成本,提高了大模型的適應(yīng)性和魯棒性,提升了模型在不同任務(wù)場景下的泛化能力,加速大模型持續(xù)進(jìn)化。
九、大模型高效推理技術(shù)
該發(fā)明技術(shù)提出的高效推理技術(shù),底層模型層基于飛槳框架,在推理架構(gòu)方向,結(jié)合主流的PrefixCaching、Lookahead、PagedAttention、PD分離等方向持續(xù)創(chuàng)新,并將各項(xiàng)技術(shù)高效結(jié)合,大幅提升模型吞吐和性能。在大模型壓縮方面,采用大模型無損量化技術(shù),通過激活自適應(yīng)分段平滑與權(quán)重聯(lián)動(dòng)重排等方法,在業(yè)內(nèi)率先實(shí)現(xiàn)了對百億千億級大模型的高效無損壓縮。該發(fā)明支持多種大模型壓縮和推理加速手段,目前已應(yīng)用于百度智能云千帆大模型平臺等核心業(yè)務(wù),減少模型推理的資源消耗,節(jié)省大模型部署成本超50%,提升模型性能,模型吞吐提升3-5倍。
十、用戶數(shù)據(jù)反饋驅(qū)動(dòng)的檢索生成系統(tǒng)
該發(fā)明技術(shù)提出的檢索生成系統(tǒng),能夠結(jié)合用戶行為反饋信號,實(shí)現(xiàn)快速自我強(qiáng)化。通過滿意度建模和強(qiáng)化學(xué)習(xí)直接對齊用戶偏好,并利用用戶反饋觸發(fā)系統(tǒng)快速反思,解決了傳統(tǒng)數(shù)據(jù)應(yīng)用時(shí)專家反饋效率低和用戶偏好建模難的問題。基于該框架的檢索生成系統(tǒng)已覆蓋18%的搜索流量,廣泛應(yīng)用于文字、視頻、圖片等搜索場景。多元用戶反饋的規(guī)模大、可循環(huán)的特性,使系統(tǒng)能夠快速適應(yīng)數(shù)據(jù)、產(chǎn)品和環(huán)境的變化,幫助系統(tǒng)自動(dòng)化尋優(yōu),加速系統(tǒng)向理想狀態(tài)演進(jìn),具備極高的實(shí)用價(jià)值和市場競爭力。
(責(zé)任編輯:王擎宇)