tubesex18 video,国产亚洲婷婷香蕉久久精品 ,九九99久久精品综合,国产精品99久久不卡,久久精品免视看国产成人

昆侖萬維開源R1V視覺思維鏈推理模型,開啟多模態(tài)思考新時代

3個月前 來源:財經網 觀看:45

3月18日,昆侖萬維正式開源首款工業(yè)界多模態(tài)思維鏈推理模型Skywork R1V,即日起開源模型權重和技術報告。43f即熱新聞——關注每天科技社會生活新變化gihot.com

143f即熱新聞——關注每天科技社會生活新變化gihot.com

開啟多模態(tài)思考新時代43f即熱新聞——關注每天科技社會生活新變化gihot.com

繼OpenAI o1和DeepSeek-R1在全球掀起長思考模型熱潮后,大模型進入新技術范式。昆侖萬維秉持實現(xiàn) AGI 的初心,積極貢獻開源社區(qū),正式開源Skywork R1V多模態(tài)視覺推理模型,成為中國第一個開源「多模態(tài)推理模型」的企業(yè)。43f即熱新聞——關注每天科技社會生活新變化gihot.com

什么是視覺推理模型?43f即熱新聞——關注每天科技社會生活新變化gihot.com

視覺推理模型是一類能夠解決需要思維鏈(Chain-of-Thought)的視覺任務的模型,通過對視覺信息進行多步邏輯推理與分析,逐步推導出最終結果。這種模型不僅關注圖像內容的識別與理解,更強調通過層層遞進的推理路徑,實現(xiàn)復雜視覺問題的精準求解,例如視覺邏輯推理、視覺數(shù)學問題、圖像中的科學現(xiàn)象分析、醫(yī)學影像的診斷推理等,從而有效拓展了視覺大模型的應用邊界。43f即熱新聞——關注每天科技社會生活新變化gihot.com

無論是日常繁瑣的工作任務、復雜的數(shù)據(jù)分析、難以解答的學術問題,還是前所未見的陌生場景,都可以交給Skywork R1V進行高效處理。43f即熱新聞——關注每天科技社會生活新變化gihot.com

快速體驗下來,R1V的視覺理解和推理能力雙雙在線。這樣的模型能力是如何煉成的呢?43f即熱新聞——關注每天科技社會生活新變化gihot.com

強大推理能力,刷新跨模態(tài)任務新高度43f即熱新聞——關注每天科技社會生活新變化gihot.com

在Reasoning推理能力方面,Skywork R1V實現(xiàn)了模型的頂尖邏輯推理與數(shù)學分析能力。在權威的MATH500和AIME基準測試中,Skywork R1V分別取得了94.0和72.0的高分,明顯領先于行業(yè)內眾多主流模型。Skywork R1V在純文本復雜推理任務中展現(xiàn)出卓越性能,使其在邏輯推理和數(shù)學問題求解領域展現(xiàn)出人類專家級別的水準。43f即熱新聞——關注每天科技社會生活新變化gihot.com

在Vision視覺理解能力方面,Skywork R1V成功地將其強大的文本推理與思維鏈推導能力高效遷移到視覺任務中。憑借創(chuàng)新的跨模態(tài)遷移技術與推理優(yōu)化框架,Skywork R1V能夠高效解決需要多步視覺推理的問題,在MMMU與MathVista等視覺推理基準中分別取得了69和67.5的優(yōu)異成績。這些結果不僅明顯超越了多個近似大小的開源競爭模型,更達到與規(guī)模更大的閉源模型媲美的水準,充分證實了Skywork R1V在需要視覺思維鏈推理的跨模態(tài)任務中的領先優(yōu)勢。43f即熱新聞——關注每天科技社會生活新變化gihot.com

Skywork R1V通過視覺與文本能力的深度融合和視覺思維鏈推理能力的突破,推動了多模態(tài)推理模型的進一步發(fā)展,標志著人工智能領域的又一重大進步。43f即熱新聞——關注每天科技社會生活新變化gihot.com

目前,Skywork R1V已全面開源,期望助力全球范圍內更多視覺推理任務的學術研究與產業(yè)應用探索。43f即熱新聞——關注每天科技社會生活新變化gihot.com

和開源同規(guī)?;蚋笠?guī)模模型的對比,Skywork R1V 38B體現(xiàn)出行業(yè)顯著優(yōu)異的推理能力,以及領先的多模態(tài)視覺理解能力。如下圖,與開源同規(guī)模或更大規(guī)模模型的對比:43f即熱新聞——關注每天科技社會生活新變化gihot.com

243f即熱新聞——關注每天科技社會生活新變化gihot.com

與閉源頭部模型性能對比,R1V 38B模型性能媲美甚至超越更大開源模型以及主流閉源模型。如下圖,與開源大尺寸模型與閉源專有模型的對比:43f即熱新聞——關注每天科技社會生活新變化gihot.com

343f即熱新聞——關注每天科技社會生活新變化gihot.com

三大核心技術創(chuàng)新,引領視覺推理新突破43f即熱新聞——關注每天科技社會生活新變化gihot.com

Skywork R1V能夠達到當前的性能高度,依賴于以下三項關鍵技術創(chuàng)新:43f即熱新聞——關注每天科技社會生活新變化gihot.com

1、文本推理能力的多模態(tài)高效遷移43f即熱新聞——關注每天科技社會生活新變化gihot.com

昆侖萬維團隊首次提出利用Skywork-VL的視覺投影器,無需重新訓練語言模型和視覺編碼器,即可實現(xiàn)文本推理能力的高效遷移到視覺任務,同時保留了優(yōu)秀的原本推理文本能力(AIME 72.0,MATH500 94.0)。43f即熱新聞——關注每天科技社會生活新變化gihot.com

2、多模態(tài)混合式訓練(IterativeSFT+GRPO)43f即熱新聞——關注每天科技社會生活新變化gihot.com

通過結合迭代監(jiān)督微調(Iterative SFT)和GRPO強化學習,分階段對齊視覺-文本表征,實現(xiàn)跨模態(tài)任務的高效融合,極大提升跨模態(tài)任務的表現(xiàn)。推動模型在MMMU基準達到69分的能力,同時在MathVista達到67.5分,與更大規(guī)模的閉源模型基本持平。通過反復迭代地利用高質量數(shù)據(jù)與高難度數(shù)據(jù)的組合,實現(xiàn)模型持續(xù)的知識鞏固與錯誤糾正,顯著提升了多模態(tài)推理的精度與泛化性能。43f即熱新聞——關注每天科技社會生活新變化gihot.com

圖丨多模態(tài)混合式訓練(來源:Skywork R1V技術報告)43f即熱新聞——關注每天科技社會生活新變化gihot.com

圖丨多模態(tài)混合式訓練(來源:Skywork R1V技術報告)43f即熱新聞——關注每天科技社會生活新變化gihot.com

3、自適應長度思維鏈蒸餾43f即熱新聞——關注每天科技社會生活新變化gihot.com

團隊提出了一種基于視覺-文本復雜度的自適應推理鏈長度控制機制,動態(tài)優(yōu)化模型推理過程,避免模型“過度思考”,提升推理效率。結合多階段自蒸餾策略,進一步提升了數(shù)據(jù)生成與推理過程的質量,促進了模型在復雜多模態(tài)任務中的表現(xiàn)。43f即熱新聞——關注每天科技社會生活新變化gihot.com

圖丨自適應長度思維鏈蒸餾(來源:Skywork R1V技術報告)43f即熱新聞——關注每天科技社會生活新變化gihot.com

圖丨自適應長度思維鏈蒸餾(來源:Skywork R1V技術報告)43f即熱新聞——關注每天科技社會生活新變化gihot.com

Skywork R1V在訓練過程中創(chuàng)新性地采用了三階段方法,使得文本端強大的推理能力得以高效遷移至視覺任務上,具體訓練流程如下:43f即熱新聞——關注每天科技社會生活新變化gihot.com

1、STEP1 視覺語言表征的初始對齊43f即熱新聞——關注每天科技社會生活新變化gihot.com

訓練時首先使用輕量級的視覺適配器(MLP)連接視覺編碼器(ViT)與語言模型,在已有的200萬條常規(guī)多模態(tài)數(shù)據(jù)上進行訓練,使得MLP初步學習如何將圖像特征映射至語言空間。這一階段僅訓練MLP適配器,視覺編碼器和語言模型參數(shù)保持凍結不變,快速、高效地實現(xiàn)視覺與語言表征的初步對齊。43f即熱新聞——關注每天科技社會生活新變化gihot.com

2、STEP2 推理能力遷移43f即熱新聞——關注每天科技社會生活新變化gihot.com

利用第一階段訓練好的MLP適配器,直接將視覺編碼器與原始的強推理語言模型(R1-distilled-Qwen-32B)連接,形成Skywork-R1V視覺推理模型。雖然此時語言模型的參數(shù)發(fā)生了改變,但得益于語言模型架構的高度相似性和MLP的泛化能力,重新組裝后的模型已能表現(xiàn)出一定的視覺推理能力,初始性能即達到業(yè)內同等規(guī)模的先進水平。43f即熱新聞——關注每天科技社會生活新變化gihot.com

3、STEP3 視覺與文本模態(tài)精準對齊43f即熱新聞——關注每天科技社會生活新變化gihot.com

最后,采用創(chuàng)新的“混合優(yōu)化框架”,進一步精準對齊視覺和語言模態(tài)的表征。這一階段分為兩大步驟:迭代監(jiān)督微調(Iterative SFT)和群組相對策略優(yōu)化(GRPO)強化學習。在整個訓練過程中,Skywork-R1V還創(chuàng)新性地引入了“自適應長度思維鏈蒸餾技術”,動態(tài)優(yōu)化推理鏈長度,防止模型過度思考,從而提升了推理效率和質量。43f即熱新聞——關注每天科技社會生活新變化gihot.com

通過以上的訓練策略,Skywork R1V在視覺推理任務上取得突破性進展,并在多個公開評測基準中達到或超過了現(xiàn)有領先模型的性能。43f即熱新聞——關注每天科技社會生活新變化gihot.com

此外,Skywork團隊多模態(tài)理解模型也在進行"全面貫通"的進化,將視覺多模態(tài)擴展為全模態(tài)模型,引入語音理解能力。當前,全模態(tài)模型往往受限于特定領域不僅需要獨立訓練多個專業(yè)模型,更面臨跨模態(tài)協(xié)同的算力挑戰(zhàn)。43f即熱新聞——關注每天科技社會生活新變化gihot.com

基于R1V模型,Skywork團隊設計了一種靈活在R1V中擴展語音理解模態(tài)的方式,從而實現(xiàn)一個全模態(tài)思考大模型,該在單個模型中同時實現(xiàn)圖像、視頻、語音的全模態(tài)理解能力,并在語音和視覺理解評測中斬獲多項SOTA成績。我們將陸續(xù)公布測評成績、開源全模態(tài)思考大模型。43f即熱新聞——關注每天科技社會生活新變化gihot.com

持續(xù)開源回饋社區(qū),堅定邁向AGI43f即熱新聞——關注每天科技社會生活新變化gihot.com

2023年10月以來,昆侖萬維陸續(xù)開源了百億級大語言模型「天工」Skywork-13B系列、數(shù)字智能體全流程研發(fā)工具包AgentStudio、4000億參數(shù)MoE超級模型、2千億稀疏大模型Skywork-MoE、推理模型Skywork-o1-Open等。2025年2月18日,昆侖萬維同時將SOTA級別的SkyReels-V1和SkyReels-A1進行開源。43f即熱新聞——關注每天科技社會生活新變化gihot.com

在語言生成模型、AI Agent、推理模型、視頻生成模型等相繼開源、多點開花之后,我們正式開源Skywork R1V多模態(tài)推理模型,在文本-視覺多模態(tài)推理方向再下一城,成為中國第一家開源多模態(tài)思考模型的企業(yè)。43f即熱新聞——關注每天科技社會生活新變化gihot.com

中國企業(yè)過去一年在AI領域的開源貢獻,讓全世界AI從業(yè)者和開發(fā)者享受到了技術共享帶來的普惠發(fā)展。DeepSeek的開源為AI行業(yè)提供了新的發(fā)展范本,多項開源成果顯著降低了AI技術的應用門檻、促進全球AI技術的民主化。昆侖萬維作為中國AI領軍企業(yè),我們將持續(xù)開源優(yōu)秀的模型、數(shù)據(jù)集等,共建開發(fā)者生態(tài)、加速技術創(chuàng)新、降低應用門檻、推動技術平權和AI行業(yè)發(fā)展。43f即熱新聞——關注每天科技社會生活新變化gihot.com

此文內容為企業(yè)供稿,僅供參考。43f即熱新聞——關注每天科技社會生活新變化gihot.com


43f即熱新聞——關注每天科技社會生活新變化gihot.com

本文鏈接:http://jphkf.cn/news-14-7857-0.html昆侖萬維開源R1V視覺思維鏈推理模型,開啟多模態(tài)思考新時代

聲明:本網頁內容由互聯(lián)網博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯(lián)系,我們將在第一時間刪除處理。

上一篇:甜啦啦獲評2025年度特色茶飲十大品牌

下一篇:百利好:國際金價持續(xù)大漲后續(xù)走勢會怎樣?

為你推薦
華納兄弟游戲近日宣布,旗下推出不久的實時服務大亂斗格斗游戲《華納大亂斗》即將在最后一個賽季,第五賽季之后關服。雖然在這之后仍然可以離線游玩,但游戲的網絡...
02-04
2月8日,幻想冒險RPG游戲《二重螺旋》「狩夜測試」宣布定檔2月20日,據(jù)悉,測試將于2月20日10:00開啟,2月28日17:00結束。目前游戲的測試招募仍在進行中,預計2月10日23...
02-10
極目新聞通訊員 李展鵬春運過半,東航武漢以高效運行和暖心服務交出一份亮眼答卷,截至2月1日,累計執(zhí)行航班3200余班,運輸旅客超44萬人次,較2024年同期分別增長6.59%、10.42%;平均客...
02-03
記者從國鐵集團了解到,2月6日,全國鐵路發(fā)送旅客1514萬人次;自1月14日春運啟動至2月6日,已累計發(fā)送旅客3.1億人次。今天(2月7日),全國鐵路預計發(fā)送旅客1410萬人次,計劃加開列車1469列...
02-07
“成功!”1月9日,伴隨著最后一個控制開關被合上,寬敞明亮的集控室內爆發(fā)出熱烈的掌聲與歡呼聲,中國能建主體投資建設的全球首座300兆瓦(MW)壓氣儲能示范...
01-21
當下,IP成為了企業(yè)品牌發(fā)展的主旋律,而創(chuàng)始人IP更是企業(yè)品牌營銷中常見的一個名詞。2024年12月26日至28日,全球創(chuàng)始人IP領袖高峰論壇順應時勢,圍繞“創(chuàng)...
01-21
  農業(yè)是國民經濟的基礎產業(yè)。去年,我省農業(yè)農村經濟運行實現(xiàn)穩(wěn)中有進、穩(wěn)中有增的良好態(tài)勢,第一產業(yè)增...
02-11
  春節(jié)假期雖然已經結束,但是全國各地的旅游熱度依舊不減。錯峰出游成為不少人的選擇,既能避開...
02-11
新聞記者 曹磊通訊員 王璐 呂巍在手機上登錄各大外賣、團購、電商平臺,搜索“江城百臻”,就能立即下單,10分鐘至30分鐘內就能夠拿到最地道的武漢地理農產品。1月21日,新聞記者從...
01-21
  近日,杭州的徐先生和賴先生向潮新聞記者反映:他們在知名網購平臺“得物APP”上買到的茅臺疑似為假。1月19日,投訴者帶著得物平臺購得的8瓶茅臺,在潮新聞記者和該平臺工作...
01-21
1 月 24 日消息,據(jù)“一汽紅旗”官方公眾號,一汽紅旗宣布旗下天工系列全新電動中型車定名為天工 05,該車是紅旗天工系列的首款轎車,官圖稱該車將于“新歲登場”,結合該車...
01-25
2 月 2 日消息,比亞迪今日公布 1 月銷售新車300538 輛,乘用車銷售 296446 輛,同比增長 47.5%。其中,乘用車海外銷售 66336 輛,同比增長 83.4%。此外,比亞迪新能源累銷超 1...
02-03
  1、《掌心》采蓮最后的結局被禮宗旭的人殺死了,禮宗旭不僅害死了采蓮,還差點活埋了葉平安?! ?、在計劃敗露后,采蓮為了不讓證物落入禮宗旭的手中,不顧危險想要奪回證物...
02-15
《逆襲人生之情定大士院》的播出吸引了更多人對優(yōu)秀演員、導演和編劇的關注,也讓觀眾對劇情產生了濃厚的興趣。許多網友紛紛上網搜尋相關信息,希望能找到滿意...
02-21
21世紀經濟報道記者李佳英、季媛媛 廣州、上海報道 細胞療法,作為新一代精準醫(yī)療技術的典范,正在推動全球生物制藥行業(yè)的最新一輪發(fā)展和變革...
01-25
  春節(jié)后第一個重要節(jié)日元宵節(jié)到來。除了看花燈、猜燈謎,品嘗元宵(湯圓)也是千家萬戶過節(jié)的重要...
02-13
  大眾網記者 秦瑾 通訊員 吳悅 報道  12月19日,2024年度山東省數(shù)據(jù)要素發(fā)展大會暨可信數(shù)據(jù)空間建設啟動會在山東大廈舉行。齊魯師范學院人工智能教育研究院研發(fā)的“...
01-21
教師與外來務工人員子女一起創(chuàng)作大型蛇主題非遺剪紙 譚云俸 攝外來務工人員子女體驗非遺剪紙 譚云俸 攝  寒假期間,浙江省湖州市長興縣夾浦鎮(zhèn)中心小學為就地過年的外來務...
01-21
  近日,多家消費金融公司圍繞春節(jié)購物、出行、旅游等消費需求,打造多樣化服務和優(yōu)惠舉措,推出滿...
01-24
  中國證券報記者1月26日獲悉,國家金融監(jiān)督管理總局近日已批復開展第二批保險資金長期股票投資...
02-05
射手座的男生通常是開朗、樂觀、自由奔放的,他們對待感情也是如此。然而,當他們真正愛上...
01-22
獅子座是十二星座中的一員,他們以自信、勇敢和領導能力著稱。然而,有時候我們可能會遇到...
01-22
男生喜歡女生的穿搭類型?一、男生喜歡女生的穿搭類型?主要包括有性感、清新可愛、知性優(yōu)雅、運動休閑等。其中,性感的穿搭可讓男生感覺到女生的魅力和女性特有的自信;清新可愛的...
02-12
關于穿搭的爆火文案? t恤的多種穿搭方法?一、關于穿搭的爆火文案?我的衣服并不能改變世界,但是它可以改變我的心情。你的穿搭風格決定了你的氣質,讓自己看起來更自信更迷人。不要...
02-12
已經鬧上法庭。1、三只羊公司被起訴過去了這么久,沒等到小楊哥復出,卻等來了三只羊的官司。近日,據(jù)天眼查消息,合肥三只羊網絡科技有限公司、廣州市美誠食品有限公司等新增一則...
02-13
1.阿里緩過來了開年兩個月,阿里巴巴就展現(xiàn)出強勁的“復興”勢頭,成為市場矚目的焦點。近期,隨著馬云頻繁亮相,公眾對阿里的關注度顯著提升。同時,阿里在AI領域的表現(xiàn)也備受矚目。...
02-22
2月16日消息,亞冬會近日在哈爾濱舉行,吸引入境賓客在哈爾濱暢游暢買,也給文旅消費增添了新活力。支付寶數(shù)據(jù)顯示,亞冬會期間(2月7日-14日),入境賓客用支付寶消費金額同比去年同期增...
02-17
3月4日消息,農歷二月初二“龍?zhí)ь^”,理發(fā)行業(yè)迎來生意開門紅。美團數(shù)據(jù)顯示,“龍?zhí)ь^”當天,理發(fā)訂單量較去年同期翻倍增長,理發(fā)訂單預約量周同比增長270%,上午11時-12時、下午16...
03-05
12月3日消息,悅點科技宣布公司完成數(shù)千萬人民幣的天使輪融資。此次融資由云啟資本獨家投資,本輪融資將主要用于悅點科技在企業(yè)級GenAI應用平臺的進...
02-07
2月5日,有投資者在投資者互動平臺向東峰集團提問:公司公告預計虧損5億元左右,感覺公司今年在洗澡。國資入主后是否會調整并購策略?未來準備如何提升公司經營業(yè)績?東峰集團在投資...
02-09
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕