6月13日,廣東時代傳媒集團(tuán)主辦的“2025ESG與高質(zhì)量發(fā)展創(chuàng)新論壇”在京舉行,論壇聚焦全球產(chǎn)業(yè)變革下的高質(zhì)量發(fā)展路徑,并揭曉了年度“ESG金羚優(yōu)秀實踐案例”。百度集團(tuán)成功入選“2025年度ESG典范企業(yè)”。
當(dāng)我們深入了解百度智能云智慧養(yǎng)老團(tuán)隊與AI手語數(shù)字人團(tuán)隊的實踐現(xiàn)場,能清晰看到一條以技術(shù)突破解決聽障人士的就醫(yī)場景、獨居老人生活問題等真實社會痛點的ESG 路徑。
圖源:AI制作
手語數(shù)字人:讓2700萬聽障者被“看見”
當(dāng)談及百度為什么要做手語數(shù)字人,“盲人的行動不便總能被注意到,但聽障者因外觀與普通人無異,常常被忽略需要幫助”。百度智能云曦靈手語數(shù)字人團(tuán)隊負(fù)責(zé)人魏琪告訴筆者。
據(jù)2006年第二次全國殘疾人抽樣調(diào)查,我國有2780萬聽力言語殘疾人,占?xì)埣踩丝倲?shù)的三分之一。
百度智能云曦靈手語數(shù)字人相關(guān)技術(shù)研發(fā)最早始于2021年。2022年,北京舉辦大型體育賽事冬奧會,全球矚目。當(dāng)時,為了讓聽障群體更好的觀看和實時理解賽事解說,百度智能云的數(shù)字人團(tuán)隊首次將3D數(shù)字人技術(shù)與手語翻譯結(jié)合,AI手語翻譯的直播吸引了超過1億人次觀看,百度智能云曦靈手語數(shù)字人是官方唯一合作伙伴。不過,由于手語動作與語速難以同步,當(dāng)時受限于技術(shù),專業(yè)術(shù)語翻譯準(zhǔn)確率不足,最終依賴大量人工校驗才完成服務(wù)。
賽后,感受到用戶需求,百度智能云曦靈手語數(shù)字人產(chǎn)品團(tuán)隊開始加快投入雙向手語翻譯機(jī)的研發(fā)及生產(chǎn)。2023年,百度推出了AI手語平臺,研發(fā)了針對線上場景的AI手語數(shù)字人和針對線下場景的雙向手語翻譯機(jī),這種一體機(jī)既能打出手語,也能翻譯手語,能夠在輸入和輸出兩個方面幫助聾人對外溝通交流。
但產(chǎn)品研發(fā)仍需繼續(xù)迭代。2023年,百度智能云曦靈手語數(shù)字人團(tuán)隊通過與手語專家和聾人群體的接觸和交流,了解到對于聽障人士而言,不同城市、不同地區(qū)之間的手語表達(dá)因方言存在區(qū)別,沒有絕對通用的手語詞典。有趣的是,如果把不同城市的聽障人士安排一起幾個小時后,大家很快就能無障礙交流,這背后可能存在聽障人士獨特或相近的交流習(xí)慣。
因此,做智能手語翻譯的關(guān)鍵難題是“手語翻譯不是簡單的手勢對應(yīng),它有聽障人士的語法邏輯,而聽障人士詞匯量遠(yuǎn)超現(xiàn)有語料庫覆蓋范圍,且實際生活詞匯量遠(yuǎn)超手語辭典中的詞匯量,需要更多的手語范本加入語料庫。除了補充詞匯,翻譯模型需要學(xué)會理解、拆分、組合,來對文本進(jìn)行手語翻譯?!?span style="display:none">jZx即熱新聞——關(guān)注每天科技社會生活新變化gihot.com
對于手語翻譯模型而言,許多伴隨社會發(fā)展新誕生的特定場景詞匯也需要學(xué)習(xí)和擴(kuò)充。以機(jī)場的“值機(jī)”為例,首先要讓翻譯模型理解“值機(jī)”,再了解可以如何組句子,最后才能進(jìn)行合理翻譯。
面對龐大的詞匯數(shù)據(jù)收集、錄入及校驗工作,百度智能云曦靈手語數(shù)字人團(tuán)隊在數(shù)據(jù)收集環(huán)節(jié)聯(lián)動了上百位聽障人士和手語專家,并和天津理工大學(xué)聾人工學(xué)院共同制定了面向人工智能應(yīng)用的自然手語標(biāo)注規(guī)范,建設(shè)了大規(guī)模自然手語翻譯語料庫。天津理工大學(xué)聾人工學(xué)院自1991年開創(chuàng)我國聾人高等教育的先河,素有“聾人小清華”美譽,也是世界四大聾人高等工科院校之一。
在語料庫打造方面,以前的手語數(shù)字人動作僵硬,就像“沒有感情的翻譯機(jī)器”,但真實的手語里,皺眉、撇嘴、點頭都是表達(dá)的一部分,是表達(dá)情感和增強交流效果的重要因素。
為此,團(tuán)隊請來了多位聽障人士和手語專家,查閱了整套《國家通用手語詞典》,進(jìn)行表情數(shù)據(jù)的收集、歸納、錄制并逐個精修,豐富手語數(shù)字人的理解和表達(dá)。
圖源:百度提供
AI浪潮帶來的技術(shù)革新,能夠讓手語數(shù)字人翻譯的精簡度和準(zhǔn)確度都有所提升。
此前,團(tuán)隊在走訪天津理工大學(xué)聾人工學(xué)院時,認(rèn)識了天津理工大學(xué)聾人工學(xué)院的學(xué)生明靜,明靜每次走進(jìn)醫(yī)院,都被護(hù)士或是分診臺導(dǎo)醫(yī)勸說回家?guī)细改冈賮?。每一件日常小事,對于聽障人士而言都困難重重。而當(dāng)明靜接觸手語數(shù)據(jù)的采集工作并體驗產(chǎn)品交互性測試后,她非常開心,“終于有人開始做這件事了”。
在這個探索過程中,百度的技術(shù)突破沉淀了多項專利,例如,虛擬數(shù)字人處理、數(shù)字人表情生成、驅(qū)動數(shù)字人的模型訓(xùn)練等專利。比如在手語數(shù)字人表情生成相關(guān)專利中,通過表情生成模型可以實現(xiàn)手語數(shù)字人在表達(dá)不同情感時擁有相應(yīng)的表情,如高興、悲傷、驚訝等,使手語數(shù)字人的表達(dá)更加生動、富有感染力。據(jù)了解,百度數(shù)字人相關(guān)專利申請量已經(jīng)超過1000件,這些專利為數(shù)字人技術(shù)在手語場景的應(yīng)用提供著更加堅實的技術(shù)保障,也是百度在數(shù)字人技術(shù)領(lǐng)域不斷探索的證明。
目前,百度智能云曦靈手語數(shù)字人已經(jīng)能夠識別語音、打出手語,在實時直播中用數(shù)字人形象進(jìn)行手語同步翻譯,通過百度數(shù)字人4D掃描技術(shù)訓(xùn)練的AI手語數(shù)字人,不僅能呈現(xiàn)出真實生動的面部表情,還可以如真人般流暢表達(dá)11000多個符合《國家通用手語詞典》的手語動作,助力聽障群體溝通。
魏琪在一次與聾人學(xué)生的線下交流中,詢問對方覺得手語數(shù)字人是否有用?對方回復(fù):“有用。”隨后又描述了自己的體驗感,以及相信“未來可以達(dá)到的效果”。
魏琪表示:“百度的團(tuán)隊在研發(fā)這個產(chǎn)品時,不單單考慮盈利,也會追求商業(yè)價值之外的社會意義。如果他沒有告訴我,我有時會以為做這件事的價值感是自己理想主義的幻想,但當(dāng)這名學(xué)生表示相信時,會帶給我繼續(xù)投入的信心?!?span style="display:none">jZx即熱新聞——關(guān)注每天科技社會生活新變化gihot.com
圖源:百度提供
智慧養(yǎng)老:幫助銀發(fā)群體跨越數(shù)字橋梁
除了聽障人士,銀發(fā)群體也是互聯(lián)網(wǎng)時代不可忽視的群體。2023年,工信部曾專門發(fā)文提出《促進(jìn)數(shù)字技術(shù)適老化高質(zhì)量發(fā)展工作方案》,其中提出要優(yōu)化數(shù)字化技術(shù)適老化服務(wù)用戶體驗。根據(jù)最新普查數(shù)據(jù),我國60歲及以上人口已經(jīng)超過3.1億人。
圖源:百度提供
在百度智能云居民服務(wù)團(tuán)隊的養(yǎng)老產(chǎn)研負(fù)責(zé)人孫宇慧看來,老年群體的數(shù)字困境遠(yuǎn)不止“把APP字體變大”這么簡單。孫宇慧告訴筆者,自從研發(fā)智慧養(yǎng)老產(chǎn)品,團(tuán)隊驚訝地發(fā)現(xiàn)一件事,全國各地老年大學(xué)都有手機(jī)課,重復(fù)教授智能手機(jī)基礎(chǔ)操作,但這門課每月的老人復(fù)報率超過50%。
“不是老人學(xué)不會,是現(xiàn)在的智能設(shè)備根本沒考慮他們的習(xí)慣。”孫宇慧表示。例如,早期互聯(lián)網(wǎng)產(chǎn)品的系統(tǒng)采用傳統(tǒng) NLP 技術(shù),要求精準(zhǔn)指令,可老人容易手抖,點不準(zhǔn)屏幕上的功能按鈕,此外,老年人對于年輕人習(xí)以為常的“左滑刪除”等產(chǎn)品使用邏輯也陌生。這意味著適老化改造需要更深層的突破。
為了了解更多的老年用戶使用習(xí)慣,獲取更真實的需求場景,孫宇慧沒有選擇坐在辦公室思考,而是選擇實地調(diào)研。2023年,他曾在山東淄博、天津河西區(qū)等地駐點兩三個月,反復(fù)上門傾聽了解老年人的使用體驗反饋,手把手的教學(xué)、記錄、調(diào)整產(chǎn)品需求。
通過反復(fù)調(diào)整產(chǎn)品設(shè)計,百度居民服務(wù)團(tuán)隊已打造了面向銀發(fā)經(jīng)濟(jì)、社區(qū)經(jīng)濟(jì)、基層服務(wù)和治理場景的產(chǎn)品矩陣,包含標(biāo)準(zhǔn)化的居民服務(wù)智慧終端、居民服務(wù)輕應(yīng)用、企業(yè)運營SaaS、政府監(jiān)管Saas等。
百度智慧養(yǎng)老AI系統(tǒng)研發(fā)負(fù)責(zé)人宋瑞東介紹:“該產(chǎn)品矩陣構(gòu)建于文心大模型(包括ERNIE 4.5、ERNIE Speed等大小模型)構(gòu)建的多智能體(Multi-Agent)架構(gòu),能夠?qū)崿F(xiàn)多個智能體間的自主協(xié)同,適應(yīng)老年人多樣化的使用場景,可覆蓋生活助理、健康監(jiān)測、安全預(yù)警、媒資娛樂、訂餐購物等復(fù)雜需求,實現(xiàn)跨場景、一體化的智慧服務(wù)體驗。
通俗來講,通過一整套覆蓋醫(yī)療、就餐、團(tuán)購、問答等不同場景的多個產(chǎn)品組成的智能體產(chǎn)品矩陣,搭載在百度的小度智能屏硬件等終端上,老人可以面對一個智慧終端產(chǎn)品,通過AI大模型的自然語言對話能力,通過語音對話可以輕松表達(dá)清楚自己的需求,從而在產(chǎn)品矩陣中自動調(diào)用相應(yīng)場景的智能體。
“例如,當(dāng)老人說:‘我家馬桶壞了,需要疏通馬桶。’管家智能體就會幫老人預(yù)約上門服務(wù)解決訴求。因此,產(chǎn)品矩陣是由多個智能體自主理解需求后調(diào)用相應(yīng)產(chǎn)品滿足老人各種各樣的任務(wù)?!彼稳饢|舉例道。
當(dāng)這套智能體產(chǎn)品矩陣要落地到硬件終端,還藏著不少“反常識”的調(diào)整。
孫宇慧以實際調(diào)研中的“下單購物頁面是否需要購物車”的場景舉例。通常購物APP都有購物車,但團(tuán)隊發(fā)現(xiàn),老年人習(xí)慣和需求場景具備特殊性。
“他們不會像年輕人一樣‘逛’購物平臺,而是通常有明確需求‘買雙布鞋’等情況下才去購物,加上考慮到防誘導(dǎo)等因素,老年人購物場景可能不需要購物車,看準(zhǔn)產(chǎn)品直接下單。而在食堂吃飯的場景中,就餐肯定需要一次點多個菜和主食,而點一個菜付款一次十分不便,這時候購物車就成了剛需?!睂O宇慧說道。
此外,百度的這套產(chǎn)品矩陣的記憶模塊還能通過大模型提煉總結(jié)出關(guān)鍵信息,形成用戶長期記憶,記錄老人健康狀況、飲食習(xí)慣、購買偏好等信息;在不同的場景下,Agent會根據(jù)老人的個性化特征,做出針對性的建議與回復(fù)。
而這些場景,不能單純靠邏輯推理,而老人用實際場景教會我們怎么做。宋瑞東認(rèn)為,智慧養(yǎng)老思考下研發(fā)的產(chǎn)品,是要讓產(chǎn)品從“聽不懂”到“會辦事”,圍繞老人的需求進(jìn)行升級。
為了相關(guān)技術(shù)創(chuàng)新,百度智能云已對相應(yīng)的智慧養(yǎng)老方案所涉及技術(shù)進(jìn)行專利布局,這套名為“養(yǎng)老服務(wù)管理方法”的專利技術(shù),聚焦老齡社會服務(wù)痛點,融合語音識別、物聯(lián)網(wǎng)與AI技術(shù),打造“零門檻”智慧養(yǎng)老體系。老年人可通過語音自然交互實現(xiàn)就餐、就醫(yī)、預(yù)警等服務(wù)調(diào)用,突破操作障礙。系統(tǒng)聯(lián)動感知設(shè)備,實現(xiàn)服務(wù)閉環(huán)與主動響應(yīng),顯著降低人工成本,重塑高效、安全、有溫度的養(yǎng)老體驗。
圖源:百度提供
目前,百度居民服務(wù)團(tuán)隊近兩年已服務(wù)超過100+客戶,覆蓋泰康保險、中國平安、全景醫(yī)學(xué)等行業(yè)巨頭。百度還積極參與并助力制定了由住建部、工信部牽頭的團(tuán)體標(biāo)準(zhǔn)《基于智能家居的智慧物業(yè)居家養(yǎng)老總體技術(shù)要求》,為大模型在居家養(yǎng)老行業(yè)應(yīng)用做出顯著貢獻(xiàn)。截至目前,已累計服務(wù)超過10萬用戶。在大模型智能體的加持下,用戶體驗實現(xiàn)質(zhì)的飛躍。
事實上,百度的ESG實踐并非局限于單一領(lǐng)域。在技術(shù)賦能社會的版圖上,AI手語數(shù)字人與智慧養(yǎng)老只是其中兩塊重要拼圖。
在人才培養(yǎng)與就業(yè)領(lǐng)域,百度2020 年提出的“5年內(nèi)培養(yǎng)500萬Al人才”計劃已在2024年提前完成。在Create2025百度AI開發(fā)者大會上,百度創(chuàng)始人李彥宏宣布,未來5年,百度將加大力度,再為社會培養(yǎng)1000萬AI人才。
此外,百度聯(lián)合武漢市總工會推出的“勞動者第二技能學(xué)習(xí)平臺”提供豐富的專家課程資源,為武漢308萬名職工和2.1萬個基層工會組織提供技能培訓(xùn),幫助傳統(tǒng)勞動者實現(xiàn)AI轉(zhuǎn)型。目前已在北京、廣州、武漢、南京等多個省市開放。
而在AI守護(hù)未成年人數(shù)字安全方面,2024年,百度清理了596億余條有害信息,通過設(shè)立專項審核小組,訓(xùn)練大模型精準(zhǔn)識別高風(fēng)險內(nèi)容,使涉及未成年人的有害信息量下降了74%,守護(hù)青少年的數(shù)字安全與自由。
技術(shù)投入的背后是人工智能領(lǐng)域持續(xù)的研發(fā)支撐。截至2024年底,百度AI全球?qū)@暾埑^2.7萬件;AI全領(lǐng)域中國專利申請超過2.2萬件,授權(quán)超過1.2萬件,連續(xù)7年AI專利申請量位居國內(nèi)第一。
這些實踐和成果,成為百度成功入選“2025年度ESG典范企業(yè)”的重要注腳。羚羊善于跳躍、長于奔跑,靈動而優(yōu)雅。它適應(yīng)性亦極強,棲居在草原、漫灘、沼澤甚至沙漠。硅谷亦有“瞪羚企業(yè)”一說,它們具有與“瞪羚”共同的特征——跑得快、跳得高、活力強?!敖鹆纭边@一概念正是借鑒了羚羊的特質(zhì),寓意著企業(yè)應(yīng)以“瞪羚”的韌性適應(yīng)環(huán)境(E)的新要求,以協(xié)同能力協(xié)調(diào)社會(S)的新需求,以敏捷性響應(yīng)治理(G)的新變化。
過去多年,百度推動智能云、智能交通等低碳方案落地,利用AI技術(shù)幫助聽障人士便利生活、輔助視障開發(fā)者開展技術(shù)研發(fā)、守護(hù)瀕危動物、提升老年人生活質(zhì)量,推動技能普及與AI人才培養(yǎng),通過AI賦能可持續(xù)發(fā)展,不斷嘗試“用科技技術(shù)讓復(fù)雜的世界更簡單”,用實際行動詮釋“技術(shù)向善”并持續(xù)創(chuàng)造更廣泛的社會價值。技術(shù)的研發(fā)應(yīng)用永無止境,而人類運用技術(shù)讓生活更美好的探索也將不斷向前。
(文中魏琪、孫宇慧為化名)
本文鏈接:http://jphkf.cn/news-2-3018-0.html打造2700萬聽障者的“翻譯官”與銀發(fā)族的“數(shù)字助手”,百度ESG實踐的技術(shù)溫度
聲明:本網(wǎng)頁內(nèi)容由互聯(lián)網(wǎng)博主自發(fā)貢獻(xiàn),不代表本站觀點,本站不承擔(dān)任何法律責(zé)任。天上不會到餡餅,請大家謹(jǐn)防詐騙!若有侵權(quán)等問題請及時與本網(wǎng)聯(lián)系,我們將在第一時間刪除處理。
點擊右上角微信好友
朋友圈
點擊瀏覽器下方“”分享微信好友Safari瀏覽器請點擊“
”按鈕
點擊右上角QQ
點擊瀏覽器下方“”分享QQ好友Safari瀏覽器請點擊“
”按鈕