tubesex18 video,国产亚洲婷婷香蕉久久精品 ,九九99久久精品综合,国产精品99久久不卡,久久精品免视看国产成人

AI醫(yī)療進入精準化“深水區(qū)” :OpenAI醫(yī)療評估基準落地、大模型加速變革|AI醫(yī)療浪潮?

1個月前 來源: 觀看:72

21世紀經(jīng)濟報道記者 閆碩 北京報道MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

近日,OpenAI推出HealthBench開源基準測試,用于衡量大語言模型在醫(yī)療健康領(lǐng)域的性能表現(xiàn)與安全可靠性,引發(fā)業(yè)內(nèi)廣泛討論。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

根據(jù)官方信息,HealthBench由262位來自60個國家/地區(qū)執(zhí)業(yè)的醫(yī)生共同參與構(gòu)建,整合了5000段真實的醫(yī)療對話數(shù)據(jù)。與以前的狹窄基準不同,HealthBench通過48562個獨特的醫(yī)生編寫的評分標準進行有意義的開放式評估,涵蓋多個健康背景和行為維度。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

有研報分析指出,隨著OpenAI推出HealthBench等醫(yī)療大模型評估基準的建立和完善,AI醫(yī)療模型的性能評估將更加科學(xué)、全面,有助于加速AI技術(shù)在醫(yī)療領(lǐng)域的落地應(yīng)用,為醫(yī)療行業(yè)的智能化升級提供有力支持,相關(guān)企業(yè)有望迎來新的發(fā)展機遇。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

另一方面,大模型本身也在加速變革。事實上,隨著大模型競爭的白熱化,競爭的焦點也已進入全新階段:從早先粗放的參數(shù)體量堆砌競賽,轉(zhuǎn)變?yōu)槟P托蕛?yōu)化與單位算力下的性能提升。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

IQVIA艾昆緯戰(zhàn)略規(guī)劃副總監(jiān)Barrett Li向21世紀經(jīng)濟報道記者表示,隨著大模型的不斷進化,以及模型優(yōu)化方法的不斷提升,已經(jīng)為AI在要求更特殊的專業(yè)場景中的更廣泛應(yīng)用拓展了可能性,尤其是對于醫(yī)藥行業(yè)的AI應(yīng)用來說,已顯現(xiàn)三大趨勢:模型即產(chǎn)品、本地與端側(cè)部署、研發(fā)端AI應(yīng)用的快速拓展。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

新的評估測試集

改善人類健康將成為通用人工智能(AGI)的決定性影響之一。如果能夠得到有效開發(fā)和部署,大語言模型有望拓展健康信息的獲取渠道,支持臨床醫(yī)生提供高質(zhì)量醫(yī)療服務(wù),并幫助人們維護自身健康。而評估對于理解模型在醫(yī)療場景中的表現(xiàn)至關(guān)重要。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

OpenAI認為,現(xiàn)有評估仍然存在一些問題,首先,未反映真實場景,脫離了實際醫(yī)療互動的復(fù)雜性,如僅采用標準化測試或有限臨床問題。其次,缺乏專家醫(yī)學(xué)驗證,評分標準未經(jīng)過醫(yī)療專家嚴格審核,難以體現(xiàn)專業(yè)醫(yī)療判斷。此外,也并未預(yù)留改進空間,最先進模型已接近“天花板”得分,無法激勵持續(xù)優(yōu)化。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

也因此,在過去的一年里,OpenAI與60個國家的262名醫(yī)生合作構(gòu)建了HealthBench,包括5000個真實的醫(yī)療對話數(shù)據(jù)。HealthBench 的測試樣本被分為7個主題和5個評估維度。其中,7個主題包括緊急轉(zhuǎn)診、專業(yè)溝通定制、健康數(shù)據(jù)任務(wù)等方面,5個評估緯度則包含準確性、溝通質(zhì)量、情境理解等方面。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

在HealthBench的基礎(chǔ)上,OpenAI還推出了兩個特別版本:HealthBench Consensus(共識版)和HealthBench Hard(困難版)。前者包含34個經(jīng)醫(yī)生共識驗證的、對模型行為表現(xiàn)尤為關(guān)鍵的評估維度;后者則設(shè)置了更高難度的評估場景,目前最高得分僅為o3模型的32%,主要被用于挑戰(zhàn)模型在復(fù)雜醫(yī)療情境中的極限表現(xiàn)。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

對于HealthBench的可信度,OpenAI開展了HealthBench Consensus(共識版)的元評估,即將模型的打分結(jié)果與醫(yī)生人工打分進行對比。結(jié)果表明,7個評估領(lǐng)域中的6個領(lǐng)域,模型打分結(jié)果與醫(yī)生評分的中位數(shù)水平高度一致。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

有券商分析師向21世紀經(jīng)濟報道記者表示,在醫(yī)療等垂直領(lǐng)域,準確性和實際場景的相關(guān)性比“流暢對話”更為關(guān)鍵,HealthBench不同于過去大多關(guān)注通用大語言模型表現(xiàn)的基準,而是聚焦醫(yī)療垂直領(lǐng)域,為醫(yī)療領(lǐng)域的AI應(yīng)用提供更為專業(yè)的評估工具,同時也將推動大模型領(lǐng)域建立專業(yè)的AI評估標準。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

值得一提的是,在HealthBench的測評中可以發(fā)現(xiàn),大模型在醫(yī)療領(lǐng)域的應(yīng)用正迅速發(fā)展。比如,2023年推出的GPT-3.5Turbo得分為16%,而2024年5月推出的GPT-4o得分已達到32%,2024年12月推出的o3模型得分更是達到60%。另外,較小規(guī)模的模型尤其進步顯著,GPT-4.1 nano的表現(xiàn)超過GPT-4o,且成本僅為GPT-4o的1/25。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

大模型持續(xù)優(yōu)化

根據(jù)世界經(jīng)濟論壇發(fā)布的《人工智能驅(qū)動健康的未來:引領(lǐng)潮流》報告,人工智能是醫(yī)療保健的主要變革力量,預(yù)計2024年—2032年,AI醫(yī)療市場將以每年43%的速度增長,市場規(guī)模有望達到4910億美元。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

其中,AI在醫(yī)療服務(wù)中的應(yīng)用前景廣闊。中信建投證券分析指出,AI可以擴展醫(yī)療服務(wù)可及性,可應(yīng)用于診斷前、診治及診斷后階段,解決當前醫(yī)院系統(tǒng)醫(yī)療人員短缺和缺乏有效分流等問題,以少量資源實現(xiàn)高效率。此外,AI輔助醫(yī)生診療未來有望降低誤診率的同時,在部分疑難雜癥診療方面也有望發(fā)揮協(xié)同作用。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

也因此,不僅評估工具在發(fā)生變革,大模型本身也在持續(xù)優(yōu)化。當前,AI在醫(yī)療領(lǐng)域的應(yīng)用歷經(jīng)了從規(guī)則驅(qū)動到數(shù)據(jù)驅(qū)動、從單一任務(wù)優(yōu)化到多模態(tài)協(xié)同的演變,已進入到多模態(tài)融合階段。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

浙商證券分析指出,大模型的多模態(tài)能力解決了早期AI醫(yī)療存在的信息割裂和數(shù)據(jù)孤島等問題,大模型通過“預(yù)訓(xùn)練+微調(diào)”架構(gòu),用統(tǒng)一參數(shù)體系處理多模態(tài)醫(yī)療數(shù)據(jù)。在臨床應(yīng)用中,借助多模態(tài)技術(shù),AI可以實現(xiàn)跨模態(tài)數(shù)據(jù)的理解和動態(tài)時序建模,使得AI診療與醫(yī)生的診療水平更加接近。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

需要指出的是,由于萬億級參數(shù)模型高昂的訓(xùn)練成本與當下較低的投資回報比,疊加通用參數(shù)的堆砌對專業(yè)場景下的模型效率提升遇到了瓶頸,大模型競爭的焦點已從早先粗放的參數(shù)體量堆砌競賽,轉(zhuǎn)向模型效率優(yōu)化與單位算力下的性能提升。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

在應(yīng)用方面,Barrett Li向記者總結(jié)道,隨著大模型的不斷進化,目前對于醫(yī)藥行業(yè)的AI應(yīng)用來說,幾大趨勢已經(jīng)顯現(xiàn):MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

首先,模型即產(chǎn)品。相比通用大模型在其他行業(yè)中相對較低的應(yīng)用門檻,醫(yī)藥行業(yè)高度專業(yè)性的場景,對于模型的適配性有著更高的要求。而隨著模型訓(xùn)練與針對特定知識庫優(yōu)化的技術(shù)與應(yīng)用逐漸推廣,大模型廠商未來預(yù)計會逐步關(guān)閉對外的API接口,轉(zhuǎn)而將專業(yè)化后的模型本身作為產(chǎn)品直接提供給企業(yè)用戶使用,顛覆現(xiàn)有的套殼應(yīng)用層。而現(xiàn)有的專業(yè)AI軟件,也必須逐步增強其底層模型訓(xùn)練的能力以應(yīng)對這一挑戰(zhàn)。在可見的未來,將會有更多直接針對醫(yī)藥行業(yè)訓(xùn)練的模型被廣泛應(yīng)用。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

其次,本地與端側(cè)部署。針對特定場景而訓(xùn)練優(yōu)化的專業(yè)模型,可以在滿足性能要求的前提下,減少對硬件方面提出過高的要求。因此在成本可控性、分析可溯源、數(shù)據(jù)安全、反饋延遲等要求更高的場景下,專業(yè)中小模型的本地部署會提供極大的賦能。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

“此外,研發(fā)端AI應(yīng)用也在快速拓展。出于高度專業(yè)性、數(shù)據(jù)安全、隱私合規(guī)等因素,相比通用大模型在商業(yè)化階段的快速發(fā)展,醫(yī)藥行業(yè)企業(yè)尚未在研發(fā)階段感受到AI所帶來的巨大轉(zhuǎn)變。而隨著特定場景專業(yè)模型訓(xùn)練的普及,研發(fā)階段AI應(yīng)用的壁壘未來也有望被逐一消解?!盉arrett Li說道。MRY即熱新聞——關(guān)注每天科技社會生活新變化gihot.com

本文鏈接:http://jphkf.cn/news-7-17974-0.htmlAI醫(yī)療進入精準化“深水區(qū)” :OpenAI醫(yī)療評估基準落地、大模型加速變革|AI醫(yī)療浪潮?

聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻,不代表本站觀點,本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。

上一篇:CXO企業(yè)一季報:5家營收破10億元,8家虧損,國際化與創(chuàng)新賽道或成破局關(guān)鍵

下一篇:交易超10億美金,石藥這款首仿藥何以搶灘全球市場?

為你推薦
21世紀經(jīng)濟報道記者林昀肖 北京報道1月14日,市場監(jiān)管總局官網(wǎng)正式發(fā)布《醫(yī)藥企業(yè)防范商業(yè)賄賂風(fēng)險合規(guī)指引》。《指引》共四章49條,其中包括...
01-21
21世紀經(jīng)濟報道記者 韓利明 上海報道隨著四大跨國疫苗企業(yè)輝瑞、葛蘭素史克(GSK)、默沙東、賽諾菲陸續(xù)發(fā)布2024年業(yè)績,21世紀經(jīng)濟報道記者依...
02-11
記者11月13日從教育部獲悉,教育部辦公廳近日發(fā)出通知,部署加強市域產(chǎn)教聯(lián)合體建設(shè)。通知提出將市域產(chǎn)教聯(lián)...
01-21
  大眾網(wǎng)記者 王一剛 報道  報紙王國歡迎您,紙不僅是孩子們熟知的事物,更是他們游戲,創(chuàng)作和探索的素材,在《報紙王國》主題活動中孩子們與報紙展開了一系列的活動,不知不...
01-21
  昨日,菜粕走勢強勁,2503合約一度觸及漲停。截至下午收盤,菜粕2503合約上漲3.75%,菜粕2505合約上...
02-11
  近期,受美國關(guān)稅政策影響,市場情緒波動較大,螺紋鋼期價呈沖高回落走勢,主力合約自高位累計下跌3...
02-13
在愛情的世界里,有時候我們會遇到一些人,他們似乎對我們表現(xiàn)出了濃厚的興趣,但卻讓我們感...
01-22
天蝎男是一個神秘而深沉的星座,他們喜歡與人保持一定的距離感,不輕易展示自己的內(nèi)心世界...
01-22
白色長款襯衫怎么搭配?一、白色長款襯衫怎么搭配?長款白襯衫可以搭配鉛筆褲,充滿休閑時尚感;長款白襯衫可搭配短褲,顯示出修長的腿型;長款白襯衫搭配闊腿褲,知性又略帶慵懶;在白襯衫...
02-17
museum服飾品牌介紹? 玫服飾品牌介紹?museum服飾品牌介紹?品牌 MUSIUM 的名字是揉合了 Museum(博物館)以及 Music(音樂)兩者的意思,其整體的設(shè)計氛圍猶如一所集實驗室化學(xué)元素與...
02-17
外賣大戰(zhàn)一觸即發(fā)。1.京東外賣放大招,商家全年0傭金外賣市場的天,恐怕就要變了。2月11日,京東外賣正式啟動“品質(zhì)堂食餐飲商家”招募,進軍外賣市場。同時,京東丟下一顆重磅炸彈:20...
02-18
一場劉強東和王興的巔峰對決。美團將為騎手繳納社保新的一年,美團要為騎手創(chuàng)造更多的安全感。2月19日下午,美團宣布將為全職及穩(wěn)定兼職騎手繳納社保。目前,公司正在搭建騎手社...
02-20
2月4日消息,抖音生活服務(wù)發(fā)布《2025春節(jié)消費數(shù)據(jù)報告》,展現(xiàn)乙巳年農(nóng)歷除夕至正月初六期間消費特色及用戶購買偏好。數(shù)據(jù)顯示,今年春節(jié)消費需求旺盛,1月28日-2月3日,平臺吃喝游玩...
02-07
2月25日消息,平安健康日前推出名醫(yī)AI助理服務(wù)“平安芯醫(yī)”,全面開放AI輔助專家7*24小時健康咨詢服務(wù)。該數(shù)字人作為真實醫(yī)生的數(shù)字分身,依托數(shù)字人技術(shù)和醫(yī)學(xué)大數(shù)據(jù)支撐下的AI...
02-26
春雪食品集團股份有限公司(證券代碼:605567)于2025年1月20日發(fā)布了2024年年度業(yè)績預(yù)盈公告,預(yù)計實現(xiàn)歸屬于母公司所有者的凈利潤670.00萬元至800.00萬元,與上年同期相比成功扭虧...
01-21
【#哪吒汽車旗下電驅(qū)公司被強執(zhí)1051萬#】天眼查App顯示,近日,浩智科技電驅(qū)(桐城)有限公司新增一條被執(zhí)行人信息,執(zhí)行標的1051萬余元,執(zhí)行法院為桐城市人民法院。該公司成立于2022...
02-09
1月29日,暴雪宣布下個月將舉辦一場《守望先鋒2》聚焦活動,旨在這款英雄射擊游戲被《漫威對決》壓制了約兩個月后,公布其 “突破性的改動”。該公告還確認,作為活動...
02-03
加州大學(xué)歐文分校2023年的一項研究《茫然與困惑:關(guān)于reCAPTCHAv2的大規(guī)模真實用戶研究》得出結(jié)論,驗證碼不僅在實際阻止機器人流量方面效果不佳,還通過追蹤cookie...
02-10
極目新聞記者 張靜嫻在清晨六七點的隨州農(nóng)貿(mào)市場,賣菜賣肉的攤位前早已擠滿了人,洋溢著濃厚的春節(jié)氛圍。在年貨市場上,最具代表性的特色年貨莫過于炸三鮮了。從過年前幾周一直...
02-04
春節(jié)期間,國產(chǎn)動畫電影《哪吒之魔童鬧海》(簡稱《哪吒2》)持續(xù)走紅。貓眼專業(yè)版數(shù)據(jù)顯示,截至2月5日中午11時52分,票房突破50億元,觀影人次達到1億,成為中國影史第6部觀影人次破1億...
02-05
下一站,回家!無論是綠皮車的溫暖情懷,還是高鐵的高效快捷,回家的路,永遠是最美的風(fēng)景 下一站,回家!無論是綠皮車的溫暖情懷,還...
01-21
1月10日,《2024中國大學(xué)、央企、城市海外網(wǎng)絡(luò)傳播力建設(shè)系列報告》發(fā)布會在北京師范大學(xué)舉辦。記者在會上了解到,2024年,我國部分中央企業(yè)通過將大語...
01-24
  我省近岸海域水質(zhì)穩(wěn)中向好,海洋生態(tài)環(huán)境質(zhì)量持續(xù)改善。日前,生態(tài)環(huán)境部公布了第三批美麗海灣優(yōu)秀案例...
02-11
2月11日,遼寧省盤錦市2024年第二批流通領(lǐng)域產(chǎn)品質(zhì)量監(jiān)督抽查情況公布。2024年,盤錦市市場監(jiān)督管理局對電...
02-13
  一場公交車小型化潮流,正在席卷全國部分城市。  “寶寶巴士”越來越多  2025年初,不少青島居民發(fā)現(xiàn),新的公交車“縮水”了。  以前那種“巨無霸”的公交車越來越...
01-21
會議現(xiàn)場 紅網(wǎng)時刻新聞1月21日訊(記者陳奧男 劉志雄)今天,2025年全省商務(wù)工作會議暨擴消費工作推進會在長沙召開。記者從會上獲悉,2025年湖南力爭社會消費品零售總額增長5.5%...
01-22
1月19日,由博納影業(yè)打造的軍事戰(zhàn)爭巨制《蛟龍行動》正式開啟預(yù)售,并將于1月29日大年初一全國上映。同時,電影《蛟龍行動》聯(lián)名款車型——猛士917蛟龍戰(zhàn)甲也將迎來銀幕首秀?;?..
01-25
1 月 24 日消息,如果你正在猶豫是否選擇電動汽車(EV)作為下一輛新車,安全性很可能是一個重要的考慮因素。與傳統(tǒng)的燃油車(ICE)相比,電動汽車究竟更安全還是更具風(fēng)險?澳大利...
01-25
  傳統(tǒng)文化的時代化表達讓古都西安的演藝市場迸發(fā)新活力,圖為演員在歷史舞臺劇《赳赳大秦》中...
01-22
  1、《掌心》采蓮最后的結(jié)局被禮宗旭的人殺死了,禮宗旭不僅害死了采蓮,還差點活埋了葉平安?! ?、在計劃敗露后,采蓮為了不讓證物落入禮宗旭的手中,不顧危險想要奪回證物...
02-15
返回

點擊右上角微信好友

朋友圈

點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“”按鈕

點擊右上角QQ

點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“”按鈕