盡管
計(jì)算機(jī)視覺驅(qū)動(dòng)的手語(yǔ)識(shí)別技術(shù)在聽障人士的各類溝通場(chǎng)景中已取得顯著成效,破解了傳統(tǒng)手語(yǔ)溝通的諸多痛點(diǎn),推動(dòng)了社會(huì)無(wú)障礙建設(shè)的推進(jìn),彰顯了“科技向善”的人文價(jià)值,但在實(shí)際應(yīng)用過(guò)程中,受技術(shù)限制、行業(yè)特點(diǎn)、用戶需求等因素影響,仍面臨諸多痛點(diǎn)與挑戰(zhàn),這些痛點(diǎn)直接影響了技術(shù)的落地效果、普及程度與應(yīng)用體驗(yàn),需要結(jié)合聽障人士的實(shí)際需求、技術(shù)發(fā)展趨勢(shì),針對(duì)性優(yōu)化完善,推動(dòng)手語(yǔ)識(shí)別技術(shù)的深度應(yīng)用與普及。
(一)痛點(diǎn)一:技術(shù)適配性不足,難以應(yīng)對(duì)復(fù)雜場(chǎng)景與多元需求
核心問(wèn)題:手語(yǔ)存在地域性差異、個(gè)體差異,且應(yīng)用場(chǎng)景復(fù)雜多樣,現(xiàn)有手語(yǔ)識(shí)別技術(shù)難以實(shí)現(xiàn)全面適配,部分場(chǎng)景下識(shí)別精度不足,影響溝通效果。例如,現(xiàn)有技術(shù)多針對(duì)中國(guó)手語(yǔ)進(jìn)行訓(xùn)練,對(duì)地方手語(yǔ)(如上海手語(yǔ)、廣東手語(yǔ))、小眾手語(yǔ)變體的適配性不足,導(dǎo)致使用地方手語(yǔ)的聽障人士無(wú)法便捷使用;不同聽障人士的手語(yǔ)動(dòng)作習(xí)慣、動(dòng)作幅度存在差異,部分聽障人士的手語(yǔ)動(dòng)作不夠標(biāo)準(zhǔn),導(dǎo)致識(shí)別精度下降;在光線昏暗、復(fù)雜背景、手部遮擋、遠(yuǎn)距離等復(fù)雜場(chǎng)景下,手語(yǔ)動(dòng)作捕捉的精度不足,識(shí)別誤差較大;對(duì)于連續(xù)手語(yǔ)識(shí)別,尤其是復(fù)雜的長(zhǎng)句子,容易出現(xiàn)動(dòng)作拆分錯(cuò)誤、含義解讀偏差等問(wèn)題,影響溝通的流暢性。
成因:現(xiàn)有算法模型的訓(xùn)練樣本不夠豐富,缺乏不同地區(qū)、不同變體、不同動(dòng)作習(xí)慣的手語(yǔ)樣本,模型的泛化能力不足;手部關(guān)鍵點(diǎn)檢測(cè)技術(shù)對(duì)細(xì)微動(dòng)作、不標(biāo)準(zhǔn)動(dòng)作的識(shí)別精度有待提升;圖像采集設(shè)備的適配性有限,難以應(yīng)對(duì)復(fù)雜場(chǎng)景的采集需求;連續(xù)手語(yǔ)動(dòng)作的序列分析算法不夠完善,難以準(zhǔn)確解析動(dòng)作之間的過(guò)渡關(guān)系與含義關(guān)聯(lián)。
優(yōu)化思路:① 豐富算法模型訓(xùn)練樣本:擴(kuò)大手語(yǔ)樣本庫(kù),涵蓋不同地區(qū)、不同變體、不同動(dòng)作習(xí)慣、不同年齡段的手語(yǔ)樣本,重點(diǎn)增加地方手語(yǔ)、小眾手語(yǔ)變體、不標(biāo)準(zhǔn)手語(yǔ)動(dòng)作的樣本,提升模型的泛化能力與適配性;同時(shí),增加復(fù)雜場(chǎng)景下的手語(yǔ)樣本,提升模型對(duì)復(fù)雜場(chǎng)景的適應(yīng)能力。② 優(yōu)化核心算法技術(shù):針對(duì)地方手語(yǔ)、小眾手語(yǔ)變體,優(yōu)化手語(yǔ)識(shí)別算法,實(shí)現(xiàn)多手語(yǔ)變體的精準(zhǔn)識(shí)別;優(yōu)化手部關(guān)鍵點(diǎn)檢測(cè)算法,提升對(duì)細(xì)微動(dòng)作、不標(biāo)準(zhǔn)動(dòng)作的識(shí)別精度,準(zhǔn)確捕捉手部關(guān)鍵點(diǎn)的運(yùn)動(dòng)軌跡;優(yōu)化連續(xù)手語(yǔ)序列分析算法,提升連續(xù)手語(yǔ)識(shí)別的精度與流暢性,減少動(dòng)作拆分錯(cuò)誤、含義解讀偏差等問(wèn)題。③ 升級(jí)采集設(shè)備:研發(fā)適配不同場(chǎng)景、不同人群的采集設(shè)備,例如,針對(duì)復(fù)雜戶外場(chǎng)景的抗干擾采集設(shè)備,針對(duì)不標(biāo)準(zhǔn)手語(yǔ)動(dòng)作的高精度采集設(shè)備,提升動(dòng)作捕捉的精度與穩(wěn)定性;同時(shí),優(yōu)化設(shè)備的光線適應(yīng)能力、抗遮擋能力,減少環(huán)境因素對(duì)識(shí)別效果的影響。
(二)痛點(diǎn)二:成本較高,普及難度大,部分聽障人士難以負(fù)擔(dān)
核心問(wèn)題:計(jì)算機(jī)視覺驅(qū)動(dòng)的手語(yǔ)識(shí)別技術(shù),需要投入大量的資金用于算法研發(fā)、設(shè)備生產(chǎn)、樣本采集等,導(dǎo)致相關(guān)產(chǎn)品與服務(wù)的成本較高,普及難度大,部分聽障人士(尤其是偏遠(yuǎn)地區(qū)、低收入家庭的聽障人士)難以負(fù)擔(dān)。例如,專業(yè)的手語(yǔ)識(shí)別設(shè)備(如桌面翻譯終端、專業(yè)采集設(shè)備)價(jià)格昂貴,一臺(tái)專業(yè)桌面手語(yǔ)翻譯終端的價(jià)格可達(dá)數(shù)千元,很多低收入家庭的聽障人士難以承擔(dān);特殊教育學(xué)校、基層殘疾人服務(wù)機(jī)構(gòu)等,由于資金有限,難以大規(guī)模引入手語(yǔ)識(shí)別設(shè)備,導(dǎo)致技術(shù)的覆蓋范圍有限;手語(yǔ)識(shí)別技術(shù)的研發(fā)投入較大,企業(yè)為了回收成本,往往會(huì)提高產(chǎn)品定價(jià),進(jìn)一步增加了聽障人士的使用成本與技術(shù)的普及難度。
成因:高精度采集設(shè)備、算法研發(fā)的成本較高;手語(yǔ)樣本采集、標(biāo)注的難度大、成本高,需要專業(yè)的手語(yǔ)翻譯人員參與,進(jìn)一步增加了技術(shù)研發(fā)成本;寵物行業(yè)的技術(shù)研發(fā)投入不足,缺乏規(guī)模化生產(chǎn),導(dǎo)致產(chǎn)品成本難以降低;部分聽障人士的收入水平較低,消費(fèi)能力有限,難以承擔(dān)高價(jià)的手語(yǔ)識(shí)別產(chǎn)品與服務(wù);政府的扶持力度不足,缺乏針對(duì)性的補(bǔ)貼政策,難以推動(dòng)技術(shù)的普及。
優(yōu)化思路:① 降低技術(shù)與產(chǎn)品成本:推動(dòng)采集設(shè)備、算法技術(shù)的國(guó)產(chǎn)化研發(fā),降低采購(gòu)與研發(fā)成本;擴(kuò)大生產(chǎn)規(guī)模,實(shí)現(xiàn)手語(yǔ)識(shí)別產(chǎn)品的規(guī)?;a(chǎn),降低單位產(chǎn)品成本;研發(fā)輕量化的技術(shù)與產(chǎn)品,簡(jiǎn)化功能、優(yōu)化結(jié)構(gòu),推出性價(jià)比高的手語(yǔ)識(shí)別產(chǎn)品(如低成本手機(jī)APP、簡(jiǎn)易手語(yǔ)翻譯終端),適配低收入聽障人士、基層機(jī)構(gòu)的需求;同時(shí),推動(dòng)技術(shù)的模塊化發(fā)展,降低產(chǎn)品的研發(fā)與生產(chǎn)難度,進(jìn)一步降低成本。② 加大政府扶持力度:政府出臺(tái)針對(duì)性的補(bǔ)貼政策,對(duì)低收入聽障人士購(gòu)買手語(yǔ)識(shí)別產(chǎn)品給予補(bǔ)貼,對(duì)特殊教育學(xué)校、基層殘疾人服務(wù)機(jī)構(gòu)引入手語(yǔ)識(shí)別設(shè)備給予資金支持;加大對(duì)技術(shù)研發(fā)的扶持力度,設(shè)立專項(xiàng)研發(fā)資金,鼓勵(lì)企業(yè)、科研機(jī)構(gòu)開展手語(yǔ)識(shí)別技術(shù)研發(fā),降低研發(fā)成本;推動(dòng)手語(yǔ)識(shí)別技術(shù)納入社會(huì)無(wú)障礙建設(shè)項(xiàng)目,擴(kuò)大技術(shù)的覆蓋范圍。③ 拓展公益化應(yīng)用模式:鼓勵(lì)企業(yè)、公益組織開展公益項(xiàng)目,向偏遠(yuǎn)地區(qū)、低收入家庭的聽障人士捐贈(zèng)手語(yǔ)識(shí)別產(chǎn)品,向基層機(jī)構(gòu)免費(fèi)提供手語(yǔ)識(shí)別服務(wù);搭建公益性質(zhì)的手語(yǔ)識(shí)別平臺(tái),讓聽障人士能夠免費(fèi)使用基礎(chǔ)的手語(yǔ)識(shí)別功能,降低聽障人士的使用成本。
(三)痛點(diǎn)三:手語(yǔ)詞匯覆蓋不足,難以滿足專業(yè)場(chǎng)景需求
核心問(wèn)題:現(xiàn)有手語(yǔ)識(shí)別技術(shù)的詞匯覆蓋范圍有限,主要集中在日常常用手語(yǔ)詞匯,對(duì)專業(yè)場(chǎng)景(如醫(yī)療、法律、政務(wù)、職業(yè)技能)的專業(yè)手語(yǔ)詞匯覆蓋不足,難以滿足聽障人士在專業(yè)場(chǎng)景下的溝通需求。例如,在醫(yī)療場(chǎng)景中,很多專業(yè)的病情描述、治療術(shù)語(yǔ)、藥物名稱等,沒(méi)有對(duì)應(yīng)的手語(yǔ)識(shí)別詞匯,導(dǎo)致聽障人士無(wú)法清晰表達(dá)自身的病情,醫(yī)護(hù)人員也無(wú)法準(zhǔn)確理解;在法律場(chǎng)景中,法律專業(yè)術(shù)語(yǔ)的手語(yǔ)識(shí)別缺失,導(dǎo)致聽障人士在參與法律訴訟、法律咨詢時(shí),無(wú)法與律師、法官有效溝通;在職業(yè)技能場(chǎng)景中,專業(yè)的技能術(shù)語(yǔ)、操作流程等,手語(yǔ)識(shí)別詞匯覆蓋不足,影響聽障人士的職業(yè)技能學(xué)習(xí)與職場(chǎng)溝通。
成因:專業(yè)手語(yǔ)詞匯的數(shù)量多、難度大,采集、標(biāo)注的難度較高,需要專業(yè)的手語(yǔ)翻譯人員與相關(guān)領(lǐng)域的專業(yè)人員共同參與,成本較高;企業(yè)、科研機(jī)構(gòu)的研發(fā)重點(diǎn)集中在日常常用手語(yǔ)詞匯,對(duì)專業(yè)場(chǎng)景的重視程度不足,投入的研發(fā)資源有限;不同專業(yè)場(chǎng)景的手語(yǔ)詞匯存在差異,且更新速度較快,難以實(shí)現(xiàn)全面覆蓋與及時(shí)更新。
優(yōu)化思路:① 擴(kuò)大手語(yǔ)詞匯覆蓋范圍:加大對(duì)專業(yè)場(chǎng)景手語(yǔ)詞匯的采集、標(biāo)注力度,聯(lián)合專業(yè)的手語(yǔ)翻譯人員、醫(yī)療、法律、政務(wù)、職業(yè)技能等領(lǐng)域的專業(yè)人員,采集、標(biāo)注專業(yè)手語(yǔ)詞匯,豐富手語(yǔ)樣本庫(kù),實(shí)現(xiàn)專業(yè)場(chǎng)景手語(yǔ)詞匯的全面覆蓋;同時(shí),建立手語(yǔ)詞匯更新機(jī)制,及時(shí)更新各類場(chǎng)景的手語(yǔ)詞匯,適應(yīng)場(chǎng)景需求的變化。② 針對(duì)性優(yōu)化專業(yè)場(chǎng)景算法:針對(duì)不同專業(yè)場(chǎng)景的特點(diǎn),優(yōu)化算法模型,提升專業(yè)手語(yǔ)詞匯的識(shí)別精度,例如,針對(duì)醫(yī)療場(chǎng)景,優(yōu)化醫(yī)療專業(yè)手語(yǔ)詞匯的識(shí)別算法,確保病情描述、治療術(shù)語(yǔ)等的精準(zhǔn)識(shí)別;針對(duì)法律場(chǎng)景,優(yōu)化法律專業(yè)手語(yǔ)詞匯的識(shí)別算法,助力聽障人士參與法律訴訟、法律咨詢。③ 加強(qiáng)跨領(lǐng)域合作:推動(dòng)
計(jì)算機(jī)視覺技術(shù)企業(yè)、科研機(jī)構(gòu)與醫(yī)療、法律、政務(wù)、教育等領(lǐng)域的機(jī)構(gòu)深度合作,結(jié)合不同領(lǐng)域的專業(yè)需求,研發(fā)針對(duì)性的手語(yǔ)識(shí)別產(chǎn)品與服務(wù),提升技術(shù)在專業(yè)場(chǎng)景的適配性與實(shí)用性。
(四)痛點(diǎn)四:技術(shù)應(yīng)用與聽障人士實(shí)際需求融合不夠深入
核心問(wèn)題:目前,部分手語(yǔ)識(shí)別技術(shù)的應(yīng)用,多停留在基礎(chǔ)的“手語(yǔ)轉(zhuǎn)文字/語(yǔ)音、文字/語(yǔ)音轉(zhuǎn)手語(yǔ)”層面,與聽障人士的實(shí)際需求、使用習(xí)慣融合不夠深入,技術(shù)的人文關(guān)懷不足,影響用戶體驗(yàn)。例如,部分手語(yǔ)識(shí)別產(chǎn)品的操作界面復(fù)雜,不符合聽障人士的使用習(xí)慣,老年聽障人士難以便捷操作;部分產(chǎn)品缺乏個(gè)性化適配,無(wú)法根據(jù)聽障人士的手語(yǔ)水平、動(dòng)作習(xí)慣,調(diào)整識(shí)別精度與轉(zhuǎn)化方式;部分產(chǎn)品的雙向轉(zhuǎn)化不夠自然,語(yǔ)音合成的語(yǔ)氣生硬、文字顯示不夠清晰,手語(yǔ)動(dòng)作展示不夠標(biāo)準(zhǔn),影響溝通體驗(yàn);對(duì)于聽障人士的緊急求助需求,技術(shù)的響應(yīng)速度不夠快,無(wú)法及時(shí)提供幫助。
成因:企業(yè)、科研機(jī)構(gòu)在研發(fā)過(guò)程中,缺乏對(duì)聽障人士實(shí)際需求、使用習(xí)慣的深度調(diào)研,技術(shù)研發(fā)與用戶需求脫節(jié);技術(shù)人員缺乏對(duì)聽障人士群體的了解,缺乏人文關(guān)懷意識(shí),產(chǎn)品設(shè)計(jì)未能充分考慮聽障人士的特殊性;缺乏有效的用戶反饋機(jī)制,無(wú)法及時(shí)了解聽障人士的使用體驗(yàn)與需求變化,難以對(duì)產(chǎn)品進(jìn)行優(yōu)化完善。
優(yōu)化思路:① 深化技術(shù)與用戶需求的融合:加強(qiáng)對(duì)聽障人士實(shí)際需求、使用習(xí)慣的深度調(diào)研,了解不同年齡段、不同手語(yǔ)水平、不同場(chǎng)景下聽障人士的溝通需求,研發(fā)針對(duì)性的產(chǎn)品與服務(wù);優(yōu)化產(chǎn)品的操作界面,簡(jiǎn)化操作流程,設(shè)計(jì)符合聽障人士使用習(xí)慣的界面(如加大字體、增加圖標(biāo)、簡(jiǎn)化步驟),方便老年聽障人士、手語(yǔ)水平較低的聽障人士使用;提供個(gè)性化適配功能,根據(jù)聽障人士的手語(yǔ)水平、動(dòng)作習(xí)慣,調(diào)整識(shí)別精度、轉(zhuǎn)化速度、語(yǔ)音語(yǔ)氣等,提升用戶體驗(yàn)。② 強(qiáng)化人文關(guān)懷設(shè)計(jì):在產(chǎn)品研發(fā)過(guò)程中,融入人文關(guān)懷理念,優(yōu)化雙向轉(zhuǎn)化效果,讓語(yǔ)音合成的語(yǔ)氣更自然、文字顯示更清晰、手語(yǔ)動(dòng)作展示更標(biāo)準(zhǔn);針對(duì)聽障人士的緊急求助需求,優(yōu)化技術(shù)響應(yīng)速度,縮短轉(zhuǎn)化延遲,建立快速求助通道,確保聽障人士在緊急情況下能夠快速獲得幫助;增加輔助功能,如手語(yǔ)學(xué)習(xí)、溝通記錄、字體放大等,滿足聽障人士的多元需求。③ 建立完善的用戶反饋機(jī)制:搭建用戶反饋平臺(tái),鼓勵(lì)聽障人士反饋產(chǎn)品的使用體驗(yàn)、存在的問(wèn)題與需求建議;及時(shí)收集用戶反饋,對(duì)產(chǎn)品進(jìn)行優(yōu)化完善,不斷提升產(chǎn)品的適配性與用戶體驗(yàn)。
(五)痛點(diǎn)五:手語(yǔ)普及度依然較低,技術(shù)的社會(huì)認(rèn)可度不足
核心問(wèn)題:盡管手語(yǔ)識(shí)別技術(shù)能夠打破手語(yǔ)普及度低帶來(lái)的溝通障礙,但目前手語(yǔ)的社會(huì)普及度依然極低,絕大多數(shù)健聽人士無(wú)法理解手語(yǔ),也缺乏學(xué)習(xí)手語(yǔ)的意愿;同時(shí),部分聽障人士、健聽人士對(duì)手語(yǔ)識(shí)別技術(shù)的安全性、精準(zhǔn)性存在疑慮,技術(shù)的社會(huì)認(rèn)可度不足,影響了技術(shù)的普及應(yīng)用。例如,部分健聽人士對(duì)手語(yǔ)識(shí)別技術(shù)不了解,不愿意使用手語(yǔ)識(shí)別設(shè)備與聽障人士溝通;部分聽障人士擔(dān)心手語(yǔ)識(shí)別技術(shù)的識(shí)別精度不足,無(wú)法準(zhǔn)確表達(dá)自身的需求,也擔(dān)心自身的手語(yǔ)動(dòng)作被泄露,存在隱私安全隱患;部分企業(yè)、機(jī)構(gòu)對(duì)手語(yǔ)識(shí)別技術(shù)的認(rèn)知不足,不愿意引入手語(yǔ)識(shí)別設(shè)備,缺乏對(duì)聽障人士的包容與支持。
成因:手語(yǔ)普及的宣傳力度不足,缺乏有效的宣傳渠道,導(dǎo)致健聽人士對(duì)手語(yǔ)的了解程度低;手語(yǔ)學(xué)習(xí)的門檻較高,缺乏便捷的學(xué)習(xí)渠道與工具,影響健聽人士的學(xué)習(xí)意愿;企業(yè)、機(jī)構(gòu)的宣傳與科普不足,未能讓聽障人士、健聽人士充分了解技術(shù)的優(yōu)勢(shì)、安全性與使用方法;傳統(tǒng)的溝通觀念影響較深,部分人對(duì)聽障人士存在歧視,缺乏包容意識(shí)。
優(yōu)化思路:① 加強(qiáng)手語(yǔ)普及宣傳:通過(guò)短視頻、直播、圖文、公益廣告等多種渠道,加強(qiáng)對(duì)手語(yǔ)的宣傳與科普,讓更多健聽人士了解手語(yǔ)、認(rèn)識(shí)手語(yǔ),提升手語(yǔ)的社會(huì)普及度;同時(shí),宣傳聽障人士的溝通困境,傳遞“平等、包容、無(wú)障礙”的理念,消除對(duì)聽障人士的歧視,營(yíng)造包容的社會(huì)氛圍。② 推動(dòng)手語(yǔ)學(xué)習(xí)普及:依托手語(yǔ)識(shí)別技術(shù),搭建便捷的手語(yǔ)學(xué)習(xí)平臺(tái)(如手機(jī)APP、線上課程),降低手語(yǔ)學(xué)習(xí)的門檻,讓健聽人士能夠便捷學(xué)習(xí)手語(yǔ);鼓勵(lì)學(xué)校、企業(yè)、社區(qū)開展手語(yǔ)學(xué)習(xí)活動(dòng),推動(dòng)手語(yǔ)走進(jìn)校園、走進(jìn)企業(yè)、走進(jìn)社區(qū),提升健聽人士的手語(yǔ)水平。③ 加強(qiáng)技術(shù)宣傳與科普:企業(yè)、機(jī)構(gòu)通過(guò)多種方式,加強(qiáng)對(duì)手語(yǔ)識(shí)別技術(shù)的宣傳與科普,講解技術(shù)的優(yōu)勢(shì)、安全性、使用方法,消除聽障人士、健聽人士的疑慮;展示技術(shù)的落地案例與實(shí)際成效,讓更多人了解技術(shù)的價(jià)值,提升技術(shù)的社會(huì)認(rèn)可度;鼓勵(lì)企業(yè)、機(jī)構(gòu)引入手語(yǔ)識(shí)別設(shè)備,樹立“平等、包容”的榜樣,推動(dòng)技術(shù)的普及應(yīng)用。