MMMU權(quán)威評測榜更新，云知聲山海UniGPT-mMed榮登榜首

2024-10-08 20:16:48 來源：天極網(wǎng) 作者：　

摘要：近日，多模態(tài)人工智能模型基準(zhǔn)評測集MMMU更新榜單，云知聲山海多模態(tài)大模型UniGPT-mMed以通用能力、醫(yī)療專業(yè)能力雙雙排名第一的優(yōu)異成績登頂榜首，力壓GPT-4V，充分彰顯其硬核實力。

近日，多模態(tài)人工智能模型基準(zhǔn)評測集MMMU更新榜單，云知聲山海多模態(tài)大模型UniGPT-mMed以通用能力、醫(yī)療專業(yè)能力雙雙排名第一的優(yōu)異成績登頂榜首，力壓GPT-4V，充分彰顯其硬核實力。

作為國內(nèi)權(quán)威多模態(tài)基準(zhǔn)評測，MMMU由IN.AI Research等多家機(jī)構(gòu)聯(lián)合構(gòu)建，專注于考量人工智能在解決大學(xué)層次多學(xué)科問題時的多模態(tài)理解與推理能力。

該評測集涉及藝術(shù)與設(shè)計、商科、科學(xué)、健康與醫(yī)學(xué)、人文與社會科學(xué)、技術(shù)與工程等六個常見學(xué)科，包含 1.15 萬個精心選取的多模態(tài)問題，涵蓋 30 個不同的科目和183 個子領(lǐng)域。同時，MMMU 中許多問題都需要專家級的推理能力，例如，使用傅立葉變換或均衡理論來推導(dǎo)問題的解，這在滿足評測內(nèi)容廣泛性的同時，也確保了其深度。

此外，MMMU還提出了兩個獨特的挑戰(zhàn)：一是其涵蓋多種圖像格式，從照片和繪畫等視覺場景到圖表和表格，可用于測試 LMM 的感知能力；二是MMMU的輸入形式是文本和圖像的混合，要求AI模型能夠?qū)D像和文本信息結(jié)合起來進(jìn)行深入理解，并在此基礎(chǔ)上執(zhí)行復(fù)雜推理。這不僅考驗了模型的學(xué)科知識儲備，也對其綜合分析和應(yīng)用能力提出了更高要求。

評測結(jié)果顯示，云知聲山海多模態(tài)大模型UniGPT-mMed以總分57的優(yōu)異成績登頂榜首，并在健康與醫(yī)學(xué)細(xì)分賽道超越GPT-4V，力壓一眾大模型拔得頭籌，充分展現(xiàn)出其在擁有業(yè)內(nèi)一流的通用能力之外，更具備打造世界領(lǐng)先的行業(yè)大模型的能力。

UniGPT-mMed是云知聲基于山海大模型底座構(gòu)建的多模態(tài)大模型。其通過分析和整合海量論文、書籍及網(wǎng)站數(shù)據(jù)，利用精細(xì)化數(shù)據(jù)處理技術(shù)，自動識別并提取圖片及其相關(guān)文本描述，并通過多模態(tài)分析技術(shù)評估圖片的質(zhì)量和圖文之間的匹配度，篩選出最優(yōu)數(shù)據(jù)。與此同時，系統(tǒng)能夠參考圖片和上下文信息對圖片進(jìn)行重新描述，使得圖文數(shù)據(jù)更加對齊。

通過預(yù)設(shè)問答場景，UniGPT-mMed能夠?qū)D文對齊數(shù)據(jù)轉(zhuǎn)化為高質(zhì)量的場景問答數(shù)據(jù)集，并采用思維鏈和自我反思技術(shù)，進(jìn)一步優(yōu)化生成數(shù)據(jù)，最終構(gòu)建起一個包含數(shù)億條高質(zhì)量圖文問答的數(shù)據(jù)集，進(jìn)而為用戶提供更加豐富、準(zhǔn)確和可靠的信息檢索和問答服務(wù)。

此次評測，是云知聲在多模態(tài)大模型賽道持續(xù)深耕、不斷技術(shù)創(chuàng)新的成果體現(xiàn)。

作為中國AGI技術(shù)產(chǎn)業(yè)化的先行者，云知聲于2016年開始打造Atlas人工智能基礎(chǔ)設(shè)施，并以此為基礎(chǔ)，構(gòu)建云知大腦(UniBrain)技術(shù)中臺——以山海（UniGPT）通用認(rèn)知大模型為核心，結(jié)合多模態(tài)感知與生成、知識圖譜、物聯(lián)平臺等智能組件，為云知聲智慧物聯(lián)、智慧醫(yī)療、智慧座艙、智慧交通等業(yè)務(wù)提供高效的產(chǎn)品化支撐，持續(xù)推動“U(云知大腦)+X(應(yīng)用場景)”戰(zhàn)略布局，致力推動千行百業(yè)的智慧化升級。

作為云知大腦的核心，山海大模型具備語言生成、語言理解、知識問答、邏輯推理、代碼能力、數(shù)學(xué)能力、安全合規(guī)能力七項通用能力及插件擴(kuò)展、領(lǐng)域增強(qiáng)、企業(yè)定制三項行業(yè)落地能力，能夠滿足更多場景的應(yīng)用需求。今年8月，云知聲推出山海多模態(tài)大模型，通過整合跨模態(tài)信息，山海多模態(tài)大模型能夠接收文本、音頻、圖像等多種形式作為輸入，并實時生成文本、音頻和圖像的任意組合輸出，帶來實時多模態(tài)擬人交互體驗，開啟AGI新范式。

目前，山海大模型已相繼在OpenCompass大模型評測、SuperCLUE中文大模型基準(zhǔn)測評、MedBench評測、Flageval大模型評測、SuperBench等多個權(quán)威評測中屢創(chuàng)佳績，穩(wěn)居國內(nèi)大模型第一梯隊；在醫(yī)療專業(yè)能力上，其基于山海大模型孵化的醫(yī)療大模型在CCKS 2023 PromptCBLUE醫(yī)療大模型評測中奪得通用賽道一等獎，并在MedBench評測中位列全球第一，各項指標(biāo)全面超越GPT-4。

登頂MMMU評測榜，充分印證了云知聲山海多模態(tài)大模型在通用能力、專業(yè)能力層面的突出實力，也將鞭策云知聲持續(xù)迭代多模態(tài)大模型技術(shù)底座，實現(xiàn)大模型技術(shù)在多領(lǐng)域場景下的滲透和應(yīng)用，以技術(shù)創(chuàng)新為各行各業(yè)帶來更多智能化變革。

上一篇： 核心資產(chǎn)強(qiáng)勢反攻，果鏈龍頭藍(lán)思科技領(lǐng)漲超18%
下一篇： 炸裂！A股驚天暴漲，真就無腦賺錢？

宇通集團(tuán)與啟明創(chuàng)投等多家機(jī)構(gòu)表態(tài)看好文遠(yuǎn)知行長期價值

智能+文遠(yuǎn)知行

4月23日,全球自動駕駛科技領(lǐng)軍企業(yè)文遠(yuǎn)知行(Nasdaq:WRD)原始股正式解禁,其核心股東宇通集...

10小時前

人形機(jī)器人角逐半馬賽場，我國現(xiàn)存機(jī)器人相關(guān)企業(yè)超86.3萬家

天眼查智能+

2025年4月19日，全球首個人形機(jī)器人半程馬拉松在北京亦莊舉辦。

11小時前

智能家居需防“被監(jiān)聽”，全國現(xiàn)存智能家居相關(guān)企業(yè)近10萬家

天眼查智能+

智能家居的普及帶來了便捷，但也引發(fā)了隱私泄露的擔(dān)憂。

11小時前

小度AI助手賦能Cleer ARC 5開放式AI耳機(jī)，開啟AI無界體驗

智能+小度 Cleer

4月22日,Cleer重磅發(fā)布了新一代旗艦產(chǎn)品——Cleer ARC 5 音弧開放式AI耳機(jī),據(jù)介...

4天前

啟明創(chuàng)投、上海國投孚騰資本聯(lián)合領(lǐng)投，未來智能場景化落地能力成關(guān)鍵

智能+未來智能

繼今年1月完成Pre A輪融資后，AI硬件企業(yè)未來智能再傳捷報。

5天前

精彩閱讀原創(chuàng)資訊投資人物專欄

圣迪亞絲點燃深圳內(nèi)衣展：情趣內(nèi)衣“破界”引領(lǐng)行業(yè)新風(fēng)向

大消費圣迪亞絲

這是一場突破行業(yè)邊界的先鋒盛宴，在3月25日深圳內(nèi)衣展上，圣迪亞絲的首秀如同一顆耀眼的明星，瞬間吸引...

2025-03-26

藥安保悄然上線人保APP！互聯(lián)網(wǎng)門診險發(fā)展黃金時期已至？

金融科技中國人保

近日,筆者觀察到中國人保APP上線了一款名為「藥安保」的互聯(lián)網(wǎng)門診險。

2025-03-26

從規(guī)模到質(zhì)量：雅迪控股年報揭示品牌價值增長新邏輯

上市公司雅迪控股

近日，雅迪控股（01585.HK）公布 2024 年度業(yè)績報告。

2025-03-26

吸煙率每年下降10%，新西蘭為何在控?zé)煼矫孀坑谐尚В?/a>

大消費電子煙

近日，一項發(fā)表在國際權(quán)威期刊《癮》（ADDICTION）上的研究發(fā)現(xiàn)，新西蘭成人吸煙率的下降速度是澳...

2025-03-26

從UR六小時直播大秀，看天貓服飾如何解鎖“內(nèi)容時代”的新想象？

大消費天貓服飾

2025-03-26

橋田自動換模解決方案：更高效，更安全，更智能!

智能+橋田

“CHINAPLAS 國際橡塑展”作為亞洲規(guī)模最大的頂尖行業(yè)盛會，將于4月15日-18日在深圳國際會...

2025-03-26

啟時代新篇！九游娛樂攜手佛羅倫薩俱樂部達(dá)成合作

創(chuàng)新創(chuàng)業(yè)九游娛樂

近日，亞洲領(lǐng)先的數(shù)字娛樂平臺九游娛樂正式宣布成為意甲豪門佛羅倫薩足球俱樂部的亞洲官方合作伙伴。

2025-03-26

用營養(yǎng)傳遞愛，用責(zé)任踐行公益飛鶴啟動12億生育補(bǔ)貼計劃

大消費飛鶴乳業(yè)

3月26日，中國飛鶴宣布，將于4月初開始在全國范圍內(nèi)啟動飛鶴生育補(bǔ)貼計劃，為全國范圍內(nèi)符合條件的孕期...

2025-03-26

五菱汽車2024年股東應(yīng)占凈利大增115.6%，“菱勢工程”引領(lǐng)開啟增長新征程

上市公司五菱汽車

國內(nèi)先進(jìn)的汽車零部件及商用整車制造商五菱汽車(00305.HK)于3月25日公布2024年全年業(yè)績。

2025-03-26

《禮賓出行服務(wù)通則》行業(yè)首發(fā)，耀出行引領(lǐng)行業(yè)標(biāo)準(zhǔn)化

創(chuàng)新創(chuàng)業(yè)耀出行

近日，由耀出行牽頭，中國標(biāo)準(zhǔn)化研究院、中國計量大學(xué)等科研機(jī)構(gòu)、院校及企業(yè)聯(lián)合編制的《禮賓出行服務(wù)通則...

2025-03-26

投資家網(wǎng)（www.51baobao.cn）是國內(nèi)領(lǐng)先的資本與產(chǎn)業(yè)創(chuàng)新綜合服務(wù)平臺。為活躍于中國市場的VC/PE、上市公司、創(chuàng)業(yè)企業(yè)、地方政府等提供專業(yè)的第三方信息服務(wù)，包括行業(yè)媒體、智庫服務(wù)、會議服務(wù)及生態(tài)服務(wù)。長按右側(cè)二維碼添加"投資哥"可與小編深入交流，并可加入微信群參與官方活動，趕快行動吧。