前沿發(fā)明引領(lǐng)產(chǎn)業(yè)創(chuàng)新：2024百度十大科技發(fā)明展現(xiàn)未來技術(shù)趨勢

2024年10月23日09:45 中國網(wǎng)科技

新聞爆料: alltech@china.org.cn 電話:(010)82081166-6059

　　10月22日，以“前沿發(fā)明，引領(lǐng)AI產(chǎn)業(yè)新變革”為主題的“2024百度十大科技前沿發(fā)明”發(fā)布會在北京召開。在今年的十大前沿發(fā)明中，大模型已成為產(chǎn)業(yè)創(chuàng)新和解鎖新質(zhì)生產(chǎn)力的重要抓手，AI原生應(yīng)用正在融入生產(chǎn)生活的方方面面。北京市知識產(chǎn)權(quán)局副局長潘新勝、百度首席技術(shù)官(CTO)王海峰等出席儀式并為發(fā)布會致辭。

　　百度首席技術(shù)官(CTO)王海峰表示，前沿發(fā)明不僅支持百度提升了自有產(chǎn)品、業(yè)務(wù)效果和效能，也為百度產(chǎn)品AI原生化重構(gòu)，為人工智能賦能千行百業(yè)貢獻(xiàn)了力量。百度發(fā)布十大發(fā)明，一方面，通過表彰這些引領(lǐng)產(chǎn)業(yè)創(chuàng)新的前沿成果，鼓勵(lì)更多的創(chuàng)新創(chuàng)造；另一方面，推動(dòng)產(chǎn)業(yè)界更多應(yīng)用這些成果，加快產(chǎn)業(yè)化進(jìn)程。早在2017年，百度就開始探索和研究大模型技術(shù)，并進(jìn)一步突破基于思考模型的智能體技術(shù)，拓展了大模型的能力邊界，促進(jìn)大模型應(yīng)用爆發(fā)。

　　北京市知識產(chǎn)權(quán)局副局長潘新勝指出，近年來，國家高度重視人工智能產(chǎn)業(yè)發(fā)展，北京市正在大力推動(dòng)人工智能創(chuàng)新策源地和產(chǎn)業(yè)高地建設(shè)。市知識產(chǎn)權(quán)局大力支持以百度公司為代表的產(chǎn)業(yè)知識產(chǎn)權(quán)龍頭企業(yè)，在重點(diǎn)領(lǐng)域開展產(chǎn)業(yè)知識產(chǎn)權(quán)促進(jìn)中心建設(shè)，以知識產(chǎn)權(quán)為紐帶帶動(dòng)重點(diǎn)產(chǎn)業(yè)強(qiáng)鏈增效。作為人工智能領(lǐng)域領(lǐng)先企業(yè)，百度創(chuàng)新技術(shù)和知識產(chǎn)權(quán)工作已經(jīng)走在了全國的前列。希望百度以此次發(fā)布會為契機(jī)，繼續(xù)加強(qiáng)科技創(chuàng)新，以人工智能技術(shù)加快賦能產(chǎn)業(yè)高質(zhì)量發(fā)展。

　　現(xiàn)如今，人工智能與實(shí)體經(jīng)濟(jì)加速融合，我國完備的產(chǎn)業(yè)體系為人工智能技術(shù)提供了廣闊應(yīng)用舞臺，推動(dòng)產(chǎn)業(yè)轉(zhuǎn)型升級，成為科技革命和產(chǎn)業(yè)變革的關(guān)鍵力量。2024年兩會提出“人工智能+”戰(zhàn)略，強(qiáng)調(diào)AI在數(shù)字經(jīng)濟(jì)中的重要性，加快實(shí)現(xiàn)高水平科技自立自強(qiáng)。百度作為領(lǐng)先科技企業(yè)，積極推進(jìn)技術(shù)規(guī)模化落地，加強(qiáng)自主創(chuàng)新，在城市、交通、工業(yè)、金融等領(lǐng)域取得顯著成果，為科技強(qiáng)國和產(chǎn)業(yè)強(qiáng)國目標(biāo)貢獻(xiàn)力量。AI產(chǎn)業(yè)正處奇點(diǎn)，技術(shù)紅利將釋放，技術(shù)發(fā)展也將為各行業(yè)轉(zhuǎn)型注入新動(dòng)力。

　　百度集團(tuán)專利事務(wù)部總經(jīng)理崔玲玲發(fā)布“2024百度十大科技前沿發(fā)明”：百度發(fā)布這些前沿發(fā)明成果，不僅是對百度技術(shù)創(chuàng)新能力的集中展示，更是對未來人工智能發(fā)展趨勢的深刻洞察。百度人工智能領(lǐng)域的前沿專利發(fā)明，涵蓋了從基礎(chǔ)算法到應(yīng)用場景的全方位突破，正引領(lǐng)著AI產(chǎn)業(yè)新的變革，我們希望不斷加速專利技術(shù)的產(chǎn)業(yè)化進(jìn)程，以此推動(dòng)千行萬業(yè)的智能化升級，從而促進(jìn)經(jīng)濟(jì)高質(zhì)量和可持續(xù)的發(fā)展。

　　自2013年入局AI領(lǐng)域，百度一直堅(jiān)持壓強(qiáng)式、馬拉松式的研發(fā)投入，近十年累計(jì)研發(fā)投入近1700億元。據(jù)國家工業(yè)信息安全發(fā)展研究中心、工信部電子知識產(chǎn)權(quán)中心今年4月份發(fā)布的《新一代人工智能專利技術(shù)分析報(bào)告》顯示，截至2023年底，百度在人工智能全領(lǐng)域?qū)＠暾埩?9308件、授權(quán)量9260件，連續(xù)六年位居國內(nèi)第一；在以大模型為核心的新一代AI領(lǐng)域，百度專利申請1432件、授權(quán)651件，成為技術(shù)創(chuàng)新和專利布局領(lǐng)軍者。根據(jù)專利數(shù)據(jù)庫機(jī)構(gòu)IFIclaims發(fā)布的生成式人工智能專利圖景洞察，百度生成式人工智能專利申請量躋身全球TOP10，是唯一進(jìn)入該榜單的中國創(chuàng)新主體，并且專利技術(shù)涵蓋文本、圖像、語音、視頻四大基礎(chǔ)領(lǐng)域，成為這四個(gè)領(lǐng)域全面布局的全球四家公司之一。百度在人工智能及大模型技術(shù)領(lǐng)域的領(lǐng)先地位和卓越專利布局成績的取得，離不開其對AI技術(shù)長期持續(xù)的投入和專注。

　　11月12日，以“應(yīng)用來了(Applications Are Here)”為主題的百度世界2024即將在上海舉辦。作為一年中備受矚目的科技發(fā)布會，百度也將發(fā)布最新成果，再次帶來令人矚目的技術(shù)突破和產(chǎn)品發(fā)布。同時(shí)，百度也將通過持續(xù)的研發(fā)投入和技術(shù)創(chuàng)新，不斷加強(qiáng)數(shù)智產(chǎn)業(yè)的快速發(fā)展，為經(jīng)濟(jì)高質(zhì)量增長帶來更多動(dòng)能。

　　百度2024十大科技前沿發(fā)明，具體如下：

　　一、基于生成式大模型的智能體技術(shù)

　　該發(fā)明技術(shù)創(chuàng)新性地引入了思考模型，使智能體具備了任務(wù)規(guī)劃、工具調(diào)用、知識增強(qiáng)和反思進(jìn)化等多重能力。通過系統(tǒng)化的設(shè)計(jì)與核心能力的定向優(yōu)化，能夠低成本地支持不同應(yīng)用場景下智能體的規(guī)?；ㄔO(shè)與部署；通過建設(shè)大規(guī)模仿真能力，加速智能體構(gòu)建與分發(fā)。該技術(shù)系統(tǒng)已成功應(yīng)用于文心智能體平臺、商家智能體、文心快碼等多個(gè)重點(diǎn)場景，顯著提升了智能體的研發(fā)效率，降低了研發(fā)門檻。其中，商家智能體通過規(guī)劃+專家的多模型協(xié)同技術(shù)和大規(guī)模仿真技術(shù)，提升反思、進(jìn)化和使用工具的能力，構(gòu)建AI營銷能力；文心快碼依托代碼推薦和智能體系統(tǒng)，與傳統(tǒng)DevOps工具鏈有機(jī)結(jié)合，推動(dòng)人機(jī)協(xié)同結(jié)對編程的深度探索與落地。

　　二、基于大模型高效訓(xùn)練框架的多模型協(xié)同進(jìn)化技術(shù)

　　該發(fā)明技術(shù)從工程和算法兩個(gè)角度攻克系列難題。工程架構(gòu)上，從混合并行策略、通信效率、計(jì)算存儲優(yōu)化全方位創(chuàng)新突破，顯著提升大語言模型訓(xùn)練性能，支撐文心全系列模型全流程高效穩(wěn)定訓(xùn)練。算法策略上，研發(fā)了大小模型協(xié)同的預(yù)訓(xùn)練技術(shù)，攻克了模型間知識難以繼承的技術(shù)難題，改變了傳統(tǒng)模型的訓(xùn)練范式，降低了新模型訓(xùn)練成本?；谠摪l(fā)明構(gòu)建了各規(guī)模模型的技術(shù)壁壘，使文心大模型訓(xùn)練吞吐速度在過去一年提升了4.1倍，支持文心一言高效滿足不同需求的廣泛業(yè)務(wù)，賦能千行萬業(yè)。

　　三、基于大模型和知識檢索增強(qiáng)技術(shù)的多模態(tài)內(nèi)容創(chuàng)編一體的智能系統(tǒng)

　　本發(fā)明技術(shù)綜合運(yùn)用知識增強(qiáng)、多源內(nèi)容解析、融合式編輯、檢索增強(qiáng)文生圖等技術(shù)，解決了專業(yè)長文及多模態(tài)內(nèi)容生成質(zhì)量弱、創(chuàng)編無法共享容器、文生圖主體準(zhǔn)確性差等問題。檢索增強(qiáng)文生圖，旨在通過智能判斷用戶需求自適應(yīng)處理參考圖，進(jìn)而基于混合模態(tài)的生圖系統(tǒng)顯著提升了生圖主體的一致性，有效彌補(bǔ)長尾內(nèi)容刻畫不準(zhǔn)確的短板，整體效果遠(yuǎn)遠(yuǎn)超過文生圖原生系統(tǒng)。百度文庫已經(jīng)在基于用戶指令及上傳內(nèi)容實(shí)時(shí)生成行業(yè)研報(bào)、演示文稿、思維導(dǎo)圖、畫本漫畫并支持一站式編輯、跨模態(tài)轉(zhuǎn)換、通用/個(gè)性化生圖等復(fù)雜任務(wù)方面取得了顯著的效果提升。2024年8月，極光旗下月狐數(shù)據(jù)發(fā)布報(bào)告顯示，百度文庫智能PPT市場份額已達(dá)八成，近3月用戶規(guī)模復(fù)合增速達(dá)23%，增速遠(yuǎn)超行業(yè)水平。

　　四、支持規(guī)?；淖詣?dòng)駕駛定位和車道級地圖生成技術(shù)

　　該發(fā)明技術(shù)突破了傳統(tǒng)模式的效率和成本問題，降低了地圖制圖成本95%，車道級道路里程超過360萬公里，實(shí)現(xiàn)全國超過41000個(gè)城鄉(xiāng)鎮(zhèn)道路的全覆蓋?；诘貓D數(shù)據(jù)進(jìn)一步構(gòu)建的多模態(tài)傳感器融合的自動(dòng)駕駛高精定位技術(shù)，精度達(dá)到厘米級，極大提高了可量產(chǎn)性，將車端定位依賴的地圖包體積降低97.5%，可靠性達(dá)到99.9999%，全面支撐目前蘿卜快跑全無人駕駛的規(guī)?；\(yùn)營，在高架橋下、多層路、隧道等各種復(fù)雜困難場景實(shí)現(xiàn)全無人駕駛。

　　五、面向大模型智能化的個(gè)性化記憶機(jī)制

　　該發(fā)明技術(shù)創(chuàng)新性地提出了一套全面的記憶機(jī)制，涵蓋記憶加工、存儲、管理、觸發(fā)和利用五大模塊，賦予大模型個(gè)性化記憶能力。記憶加工借鑒人類海馬體機(jī)制，實(shí)現(xiàn)了對全場景用戶信息的深度理解和精準(zhǔn)加工；記憶管理支持用戶主動(dòng)與系統(tǒng)自動(dòng)的增刪改查，確保了記憶庫的實(shí)時(shí)更新與準(zhǔn)確；記憶觸發(fā)和利用，通過相關(guān)記憶的推測生成，輔助大模型產(chǎn)生更加擬人和個(gè)性化的回復(fù)。該發(fā)明技術(shù)已廣泛應(yīng)用于智能AI助手、數(shù)字人等場景。

　　六、基于大模型的超擬真數(shù)字人建模、驅(qū)動(dòng)與生成系統(tǒng)

　　該發(fā)明技術(shù)提出了一整套的超擬真數(shù)字人建模、驅(qū)動(dòng)和生成方案。針對真人數(shù)字人，研發(fā)了數(shù)據(jù)驅(qū)動(dòng)的人像建模、跨模態(tài)驅(qū)動(dòng)和人像視頻生成大模型，實(shí)現(xiàn)了自然、擬真的數(shù)字人內(nèi)容生產(chǎn)，獨(dú)家支持大幅動(dòng)作&遮擋場景的直播人像克隆，并實(shí)現(xiàn)了首個(gè)全身智能驅(qū)動(dòng)直播間落地。針對超寫實(shí)3D數(shù)字人，基于文心大模型研發(fā)了模態(tài)遷移和多智能體協(xié)作技術(shù)，實(shí)現(xiàn)了分鐘級制作媲美影視大片、3A游戲的超寫實(shí)數(shù)字人形象及運(yùn)營內(nèi)容。本發(fā)明技術(shù)已廣泛地應(yīng)用于數(shù)字人直播、視頻生產(chǎn)、智能體等眾多真人和3D數(shù)字人的產(chǎn)品中。

　　七、基于大模型的生成式商業(yè)檢索系統(tǒng)

　　該發(fā)明技術(shù)變革了傳統(tǒng)的 “索引-召回-排序”流程，扁平化系統(tǒng)漏斗，減少信息損失，通過構(gòu)建索引學(xué)習(xí)任務(wù)，將商業(yè)信息編碼進(jìn)模型參數(shù)，實(shí)現(xiàn)“模型即索引”，利用大模型的理解和推理能力，實(shí)現(xiàn)“生成即檢索”，新范式顯著提升系統(tǒng)定向效率120%。該發(fā)明所涉及項(xiàng)目業(yè)界率先落地，實(shí)現(xiàn)大規(guī)模工業(yè)化應(yīng)用，生成式大模型結(jié)合商業(yè)搜索場景取得多項(xiàng)技術(shù)創(chuàng)新，創(chuàng)意豐富度提升37倍，創(chuàng)意質(zhì)量提升92%，獲得了顯著的業(yè)務(wù)收益和廣泛技術(shù)影響力。

　　八、大模型數(shù)據(jù)飛輪技術(shù)

　　該發(fā)明技術(shù)通過整合用戶反饋、執(zhí)行反饋和自監(jiān)督反饋等多來源和形式的信息，自動(dòng)識別模型缺陷并高效合成高質(zhì)量、多樣化的訓(xùn)練數(shù)據(jù)。同時(shí)結(jié)合多源反饋的強(qiáng)化學(xué)習(xí)方法，顯著提升了模型訓(xùn)練效果。該創(chuàng)新技術(shù)構(gòu)建了一個(gè)能夠持續(xù)自我改進(jìn)的數(shù)據(jù)飛輪，有效突破了大模型的數(shù)據(jù)瓶頸，降低了數(shù)據(jù)獲取成本，提高了大模型的適應(yīng)性和魯棒性，提升了模型在不同任務(wù)場景下的泛化能力，加速大模型持續(xù)進(jìn)化。

　　九、大模型高效推理技術(shù)

　　該發(fā)明技術(shù)提出的高效推理技術(shù)，底層模型層基于飛槳框架，在推理架構(gòu)方向，結(jié)合主流的PrefixCaching、Lookahead、PagedAttention、PD分離等方向持續(xù)創(chuàng)新，并將各項(xiàng)技術(shù)高效結(jié)合，大幅提升模型吞吐和性能。在大模型壓縮方面，采用大模型無損量化技術(shù)，通過激活自適應(yīng)分段平滑與權(quán)重聯(lián)動(dòng)重排等方法，在業(yè)內(nèi)率先實(shí)現(xiàn)了對百億千億級大模型的高效無損壓縮。該發(fā)明支持多種大模型壓縮和推理加速手段，目前已應(yīng)用于百度智能云千帆大模型平臺等核心業(yè)務(wù)，減少模型推理的資源消耗，節(jié)省大模型部署成本超50%，提升模型性能，模型吞吐提升3-5倍。

　　十、用戶數(shù)據(jù)反饋驅(qū)動(dòng)的檢索生成系統(tǒng)

　　該發(fā)明技術(shù)提出的檢索生成系統(tǒng)，能夠結(jié)合用戶行為反饋信號，實(shí)現(xiàn)快速自我強(qiáng)化。通過滿意度建模和強(qiáng)化學(xué)習(xí)直接對齊用戶偏好，并利用用戶反饋觸發(fā)系統(tǒng)快速反思，解決了傳統(tǒng)數(shù)據(jù)應(yīng)用時(shí)專家反饋效率低和用戶偏好建模難的問題。基于該框架的檢索生成系統(tǒng)已覆蓋18%的搜索流量，廣泛應(yīng)用于文字、視頻、圖片等搜索場景。多元用戶反饋的規(guī)模大、可循環(huán)的特性，使系統(tǒng)能夠快速適應(yīng)數(shù)據(jù)、產(chǎn)品和環(huán)境的變化，幫助系統(tǒng)自動(dòng)化尋優(yōu)，加速系統(tǒng)向理想狀態(tài)演進(jìn)，具備極高的實(shí)用價(jià)值和市場競爭力。

(責(zé)任編輯：王擎宇)

版權(quán)聲明：
1.凡本網(wǎng)站注明“來源：中國網(wǎng)科技”的所有作品，均為本網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品。
2.未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的，應(yīng)在授權(quán)范圍內(nèi)使用，并注明“來源及作者”。違反上述聲明者，本網(wǎng)將追究其相關(guān)法律責(zé)任。