近日,OpenAI發(fā)布了新一代旗艦生成模型GPT-4o(“o”代表omni,即全能的意思)。據(jù)悉,GPT-4o為面向未來(lái)人機(jī)交互范式的全新大模型,具有文本、語(yǔ)音、圖像三種模態(tài)的理解力,反應(yīng)極快還帶有感情,也“很通人性”。
開(kāi)源證券研究報(bào)告介紹,GPT-4o有四大特點(diǎn):一是多模態(tài)能力大幅提升,可以跨文本、音頻和視頻進(jìn)行實(shí)時(shí)推理;二是更加“像人”;三是毫秒級(jí)響應(yīng),API(應(yīng)用程序接口)成本更低;四是擁有3D視覺(jué)內(nèi)容生產(chǎn)能力。
全球大模型競(jìng)爭(zhēng)加劇
據(jù)悉,GPT-4o將免費(fèi)提供給所有用戶,OpenAI還將推出桌面版ChatGPT,輕量化的使用體驗(yàn)可以融入任何工作流程中。
“GPT-4o作為一個(gè)具有多模態(tài)能力的生成型模型,將在客戶服務(wù)、醫(yī)療保健、教育、娛樂(lè)、無(wú)障礙技術(shù)等諸多領(lǐng)域發(fā)揮重要作用,助力相關(guān)領(lǐng)域的AI應(yīng)用‘更加好用,性價(jià)比更高’,更好地打開(kāi)應(yīng)用商業(yè)化空間,也會(huì)加劇全球各大模型廠商的競(jìng)爭(zhēng)。”中國(guó)電子商務(wù)專家服務(wù)中心副主任郭濤在接受《證券日?qǐng)?bào)》記者采訪時(shí)表示。
近段時(shí)間,不少海內(nèi)外行業(yè)巨頭頻頻發(fā)布大模型最新成果。例如谷歌發(fā)布升級(jí)版的最強(qiáng)大AI模型Gemini迎戰(zhàn)GPT-4o,谷歌CEO桑達(dá)爾·皮查伊表示:“谷歌所有的工作都圍繞生成式AI模型Gemini來(lái)做,希望每個(gè)人都能從Gemini所做的事中受益。”
國(guó)內(nèi)的知名私募巨頭幻方量化旗下的AI公司DeepSeek(深度求索)發(fā)布全新第二代MoE(混合專家)大模型DeepSeek-V2,該模型擁有2360億個(gè)參數(shù),其中有210億個(gè)活躍參數(shù)。
昆侖萬(wàn)維正式將天工大模型迭代至3.0版本,據(jù)悉“天工3.0”采用4000億參數(shù)MoE架構(gòu),是目前全球模型參數(shù)最大、性能最強(qiáng)的開(kāi)源MoE模型之一?!疤旃?.0”在語(yǔ)義理解、邏輯推理等方面能力實(shí)現(xiàn)質(zhì)的飛躍,其技術(shù)知識(shí)能力較上一代模型提升20%,數(shù)學(xué)、代碼等能力提升超30%。此外,百度、商湯科技等也發(fā)布了最新多模態(tài)模型成果。
“OpenAI推出GPT-4o及近期海內(nèi)外廠商頻頻發(fā)布大模型迭代升級(jí)成果,競(jìng)爭(zhēng)焦點(diǎn)或集中在多模態(tài)能力、Agent(指能自主活動(dòng)的軟件或者硬件的智能體)能力和API調(diào)用成本優(yōu)化等,均為大模型應(yīng)用落地并商業(yè)化的關(guān)鍵因素?!遍_(kāi)源證券分析師方光照認(rèn)為。
多家公司跟進(jìn)AI應(yīng)用布局
多模態(tài)模型可以應(yīng)用于各種終端設(shè)備,如智能手機(jī)、平板電腦、車載多媒體端口、智能音箱、機(jī)器人等。此外,還可以應(yīng)用于企業(yè)級(jí)產(chǎn)品,如影視、教育、營(yíng)銷、搜索、辦公等各個(gè)領(lǐng)域。
在此背景下,不少上市公司通過(guò)大模型加速推動(dòng)在AI領(lǐng)域的業(yè)務(wù)布局與應(yīng)用。5月15日,金蝶集團(tuán)發(fā)布基于企業(yè)管理、AI、大模型三者疊加結(jié)合的金蝶Cosmic,這款應(yīng)用具備感知、記憶、思考、行動(dòng)能力,助力管理者及員工輕松應(yīng)對(duì)多項(xiàng)管理工作。
主營(yíng)為營(yíng)銷傳播智慧服務(wù)的因賽集團(tuán)日前對(duì)外表示,公司自研的營(yíng)銷行業(yè)AIGC應(yīng)用級(jí)模型InsightGPT,不斷取得技術(shù)突破,“圖生視頻”“文生視頻”等各項(xiàng)功能和產(chǎn)品發(fā)布始終走在行業(yè)前列。同時(shí),公司會(huì)密切關(guān)注世界前沿的最新技術(shù),持續(xù)對(duì)InsightGPT各項(xiàng)產(chǎn)品和功能進(jìn)行優(yōu)化與迭代,適時(shí)拓展新的產(chǎn)品方向,目前論證可行的產(chǎn)品方向包括但不限于3D視頻與數(shù)字人。
奧飛娛樂(lè)在互動(dòng)易平臺(tái)上表示,目前其持有光年無(wú)限5%股權(quán),光年無(wú)限有自己的AI對(duì)話機(jī)器人產(chǎn)品——圖靈機(jī)器人開(kāi)放平臺(tái),并上線AI對(duì)話小程序“喜羊羊與灰太狼+”,定位兒童用戶,提供親子陪伴體驗(yàn)。
字節(jié)跳動(dòng)也最新發(fā)布了豆包大模型,據(jù)字節(jié)跳動(dòng)旗下云服務(wù)平臺(tái)火山引擎總裁譚待介紹:“經(jīng)過(guò)一年時(shí)間的迭代和市場(chǎng)驗(yàn)證,豆包大模型正成為國(guó)內(nèi)使用量最大、應(yīng)用場(chǎng)景最豐富的大模型之一,目前日均處理1200億Tokens文本,生成3000萬(wàn)張圖片。大模型從以分計(jì)價(jià)到以厘計(jì)價(jià),將助力企業(yè)以更低成本加速業(yè)務(wù)創(chuàng)新?!?/p>
“擁有多模態(tài)能力的大模型將為上市公司在客服服務(wù)、教育培訓(xùn)和終端應(yīng)用等領(lǐng)域提供了廣闊的應(yīng)用前景。這種全新的交互模式將為企業(yè)帶來(lái)更高的效率和更低的成本,同時(shí)為用戶帶來(lái)更便捷與愉悅的體驗(yàn)?!敝袊?guó)信息協(xié)會(huì)常務(wù)理事朱克力向記者表示。
(責(zé)任編輯:畢安吉)