日本黄色一级经典视频|伊人久久精品视频|亚洲黄色色周成人视频九九九|av免费网址黄色小短片|黄色Av无码亚洲成年人|亚洲1区2区3区无码|真人黄片免费观看|无码一级小说欧美日免费三级|日韩中文字幕91在线看|精品久久久无码中文字幕边打电话

當(dāng)前位置:首頁 > 智能硬件 > 人工智能AI
[導(dǎo)讀] 從自動駕駛、無人機,到監(jiān)控安防,視覺 AI 技術(shù)的突破為人們生活帶來了巨大改變,在許多領(lǐng)域迎來爆發(fā)式發(fā)展,僅在國內(nèi)就涌現(xiàn)商湯、云從、曠視和依圖等四大視覺 AI 獨角獸。但若真要論能為使用者帶來多

自動駕駛、無人機,到監(jiān)控安防,視覺 AI 技術(shù)的突破為人們生活帶來了巨大改變,在許多領(lǐng)域迎來爆發(fā)式發(fā)展,僅在國內(nèi)就涌現(xiàn)商湯、云從、曠視和依圖等四大視覺 AI 獨角獸。但若真要論能為使用者帶來多大改變,恐怕很少有比得上這一項,那就是用視覺 AI 來打造盲人的眼睛。

無障礙人工智能成顯學(xué),各大科技巨頭亦相繼致力投入

AI for Accessibility、無障礙人工智能近來已在國際間成為一項顯學(xué)。如何將發(fā)展迅速的人工智能技術(shù),用來改善全世界約 10 億殘疾人士的生活,也是各大科技巨頭致力投入的方向之一。

以視障者來說,近日 Instagram 就新增一項輔助功能,用 AI 自動辨識照片內(nèi)容并以語音告知用戶。臉書 Messenger 也有無障礙機器人(Accessibility Bot),協(xié)助盲人辨識臉書朋友,甚至是朋友的臉部表情。華為 Mate 20 Pro 也有一個應(yīng)用程序 Facing Emotions,可以將七種最普遍的情緒轉(zhuǎn)化為相應(yīng)的聲音,可以大幅提升盲人與其他人的實時互動交流。

影像視覺 AI 并不是新的概念,其背后技術(shù)主要包含機器學(xué)習(xí)、深度學(xué)習(xí),再加上 3D 臉部辨識等。尤其是深度學(xué)習(xí)算法運用在訓(xùn)練 AI 來協(xié)助盲人辨識物體,可以發(fā)揮非常大的用處。

比方說,如果我們想要設(shè)計一個 AI 協(xié)助盲人分辨不同面額的紙鈔。做法就是將一張 10 元紙鈔,通過各種不同角度,包含正面、反面、整張、邊角、其中每一小片圖案,都展示給 AI 看,讓它學(xué)習(xí)什么是一張 10 元紙鈔。通過大量反覆學(xué)習(xí)后,視障者只要能讓手機鏡頭看到 10 元紙鈔的一小角,AI 就能將它分辨出來。

“這些小事,會讓你很確實地感覺到自己的獨立性。希望隨著人工智能的進(jìn)展,可以讓我們更容易感受環(huán)境,協(xié)助我們完成更多日常事務(wù)”,微軟視覺輔助應(yīng)用程序 Seeing AI 的項目主管、同時自身也是視障者的 Saqib Shaikh,近日接受專訪時這樣對小編說。

圖|微軟技術(shù)負(fù)責(zé)人( Tech Lead)Saqib Shaikh

Saqib Shaikh 在 7 歲時失去視力,此前不久,他才剛剛得到人生中的第一臺電腦。

所幸這并不是他與計算機科學(xué)之間的句點

而后他就讀視障學(xué)生小學(xué),一位老師看出了他的潛力,鼓勵他開始學(xué)習(xí)打字。此后他一路進(jìn)入大學(xué),主修計算機科學(xué),以班上頂尖的成績畢業(yè),并取得人工智能碩士學(xué)位。而后,他又加入微軟的人工智能團(tuán)隊,并在大約 3 年前通過微軟內(nèi)部的黑客松競賽,以 Seeing AI 這個項目脫穎而出,獲得資源將之打造為實際產(chǎn)品,現(xiàn)在已可在美國地區(qū)免費下載。

Seeing AI 用視覺 AI 幫助視障者“聽懂”世界

Seeing AI 這個是一款結(jié)合圖像辨識、語音說明及人性化使用介面的應(yīng)用程序,可以用手機上的攝像頭識別所有圖像,包含通過掃描條形碼來識別產(chǎn)品、辨識身旁其他人的年齡,性別和面部表情,還可以描述它在圖片中看到的內(nèi)容,并閱讀出菜單和文件。

同時,這款應(yīng)用程序也可以結(jié)合智能眼鏡,更好地協(xié)助用戶了解所處的周遭環(huán)境。

圖|Seeing AI 是一款結(jié)合圖像辨識、語音說明及人性化使用介面的應(yīng)用程序

Saqib Shaikh 指出,近年深度學(xué)習(xí)技術(shù)的成熟,是 Seeing AI 可以真正發(fā)揮用處的主要關(guān)鍵。通過深度學(xué)習(xí)訓(xùn)練,向系統(tǒng)展示大量照片,并教導(dǎo)它們照片中的內(nèi)容,AI 可以真正有效辨識出現(xiàn)實生活環(huán)境中的各種物體與人物。

但是,要落實到讓 AI 有效協(xié)助視障者在生活中能真正用上,還必須歸功于近年硬件技術(shù)的發(fā)展,在軟、硬件配合之下,讓視覺 AI 技術(shù)實用價值大大提升。尤其是邊緣運算風(fēng)潮興起,視覺信息可以在裝置終端就能完成運算,才能對使用者提供實時反饋,讓盲人能夠即時對互動對象做出適合的反應(yīng)。

實時反饋絕對是關(guān)鍵。Saqib Shaikh 說,想像一個情境,當(dāng)你在一個會議上進(jìn)行簡報。因為這是一個正式場合,因此所有人,包含旁邊的同事、上級主管,都只是安靜聽你說話,不會任意發(fā)出聲音。所以在你說話的同時,若無法用眼睛去觀察聽眾,你對于他們的反應(yīng)是毫無頭緒的,你甚至不知道應(yīng)不應(yīng)該繼續(xù)說下去,還是暫停下來詢問聽眾的想法。

這時候,如果有一個 AI 可以幫你辨識聽眾的反應(yīng),實時反饋你他們是不是看起來滿意、尤其是還能辨認(rèn)出特定人士,比方說直屬主管的表情和動作如何,這樣一個人工智能,將能夠大大地讓盲人突破限制,改善他們在日常工作中表現(xiàn)。

非監(jiān)督學(xué)習(xí)是視覺AI 下一步突破關(guān)鍵

今日我們所談的視覺 AI,其實多半仍局限于靜態(tài)圖像、單一圖像,但 Saqib Shaikh 想像中的 Seeing AI 2.0,將可以解讀一系列的圖像、可以掌握使用者的偏好

“就像當(dāng)我與妻子一起在街上走路時,她會告訴我有什么我沒看過的新東西、有什么有趣的事物。比方說,她會告訴我我們很喜歡的一間咖啡店關(guān)門了?!盨aqib Shaikh 說,“一個真正的人可以了解什么是你會感興趣、什么是你會覺得重要的事物?!?/p>

而 AI 若要能夠做到這一點,就不能只是一次辨識單一圖像,而是還要能綜合理解背后的情境,甚至是接續(xù)出現(xiàn)的新的信息。Saqib Shaikh 分析,這意味著后續(xù) Seeing AI 必須運用更多非監(jiān)督學(xué)習(xí)的技術(shù)來訓(xùn)練 AI,進(jìn)一步拓展 AI 對多變場景復(fù)雜信息的處理能力。

其實,Saqib Shaikh 早在求學(xué)期間意識到,為了讓身為盲人的自己表現(xiàn)更好,他必須做很多額外的努力來改變他所處的生活環(huán)境,包括不只是自己看書、而是要雇請其他人為他朗讀教科書的內(nèi)容等,才能讓自己與其他正常人站在更接近一點的比較基準(zhǔn)上。

當(dāng)時就有個朋友建議過他,與其只用嘴巴說要改變生活環(huán)境,不如實際做點什么真正的改變。這讓他早就思考過,從某種角度來講,殘疾者本人其實就是最好的創(chuàng)新者。因為,他們比任何人都了解殘疾者最迫切的需求是什么?愿意做什么嘗試?可以如何改變?

然而,在 Saqib Shaikh 進(jìn)入微軟工作的近乎前 10 年,他并未在工作上試圖突出任何作為一個盲人的特殊能力。相反的,他讓自己就像一名正常的工程師一樣,絕大多數(shù)時間都投入內(nèi)部的主流專案,如 Cortana 等。

“我想,起初我是想證明自己可以成為一個主流的工程師”,Saqib Shaikh 說,而轉(zhuǎn)捩點是出現(xiàn)在他于微軟工作的第10年?!肮ぷ鳚M 10 年后,我覺得我已經(jīng)達(dá)到了目標(biāo),證明了自己的能力,所以我可以開始運用自己的專業(yè)去幫助其他人?!?/p>

現(xiàn)在,他終于決定投入自己真正想做的事情,也就是用 AI 來改善殘疾人士的生活環(huán)境。就像他所說的,“我可以選擇用這一種與我自己最相關(guān)的方式,從個人經(jīng)驗來理解許多盲人的問題,并且用自己的專業(yè)來提供協(xié)助?!?/p>

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除( 郵箱:macysun@21ic.com )。
換一批
延伸閱讀

前 Amazon Robotics 高管出任全球生產(chǎn)戰(zhàn)略部負(fù)責(zé)人,助力公司擴張 休斯敦, April 01, 2026 (GLOBE NEWSWIRE) -- 具身 AI 領(lǐng)域新一代領(lǐng)軍企業(yè)?Persona AI 今...

關(guān)鍵字: VI RS AN AI

可持續(xù)發(fā)展與企業(yè)責(zé)任實踐再獲國際資本市場認(rèn)可 香港2026年3月31日 /美通社/ -- 全球領(lǐng)先的互聯(lián)網(wǎng)社區(qū)創(chuàng)建者 - 網(wǎng)龍網(wǎng)絡(luò)控股有限公司 ("網(wǎng)龍"...

關(guān)鍵字: MSC AI 可持續(xù)發(fā)展 網(wǎng)絡(luò)游戲

2026 年 3 月 31 日,華為投資控股有限公司正式發(fā)布 2025 年年度報告。

關(guān)鍵字: 華為 2025年年報 AI 云計算

當(dāng)?shù)貢r間 3 月 30 日,專注在軌 AI 數(shù)據(jù)中心建設(shè)的美國初創(chuàng)企業(yè) Starcloud 宣布完成 1.7 億美元融資,投后估值 11 億美元,正式躋身獨角獸行列。

關(guān)鍵字: 太空數(shù)據(jù)中心 Starcloud AI 數(shù)據(jù)中心

安森美將上海設(shè)立為大中華區(qū)總部,并公布任命中國區(qū)總經(jīng)理的計劃

關(guān)鍵字: 氮化鎵 人工智能 數(shù)據(jù)中心

加利福尼亞州庫比蒂諾2026年3月27日 /美通社/ -- 全球領(lǐng)先的AI驅(qū)動型網(wǎng)絡(luò)安全解決方案提供商Cyble宣布,在兩項業(yè)內(nèi)最具聲望的獎項評選中榮獲重要表彰。 該公司榮獲...

關(guān)鍵字: 信息安全 網(wǎng)絡(luò)安全 BLE AI

深圳2026年3月27日 /美通社/ -- 2026年3月27日,CFM | MemoryS 2026在深圳盛大啟幕,全球存儲產(chǎn)業(yè)鏈精英齊聚,共探AI時代存儲產(chǎn)業(yè)的變革與未來。江波龍董事長、總經(jīng)理蔡華波先生受邀出席并發(fā)表...

關(guān)鍵字: MEMORY AI SSD 集成

北京2026年3月29日 /美通社/ -- 3月26日至29日,中國醫(yī)學(xué)裝備大會暨醫(yī)學(xué)裝備展覽會(CCDLM)在重慶悅來國際會議中心舉行。作為體外診斷領(lǐng)域的代表企業(yè)之一,萬泰生物攜"智慧健康生態(tài)展"亮...

關(guān)鍵字: CCD LM 人工智能 自動化

交易總額最高可達(dá)約27.5億美元,包括1.15億美元首付款。 這項由人工智能驅(qū)動的合作包含一項全球獨家許可,涵蓋涉及多個治療領(lǐng)域的系列項目。 上海2026年3月30日 /美通社/ -- 由生成式人工智能(...

關(guān)鍵字: 人工智能 ARMA 自動化技術(shù) SI

香港2026年3月30日 /美通社/ -- 諾亞控股有限公司("NOAH"或"公司")(紐約證券交易所代碼:NOAH;香港交易所代碼:6686)與旗下全球資產(chǎn)配置平臺 Olive...

關(guān)鍵字: AI OUTLOOK MANAGEMENT SE
關(guān)閉