伯納德·穆勒 (Bernard Muller),斯科特·摩根基金會首席技術官。 由斯科特·摩根基金會提供

2017 年,當英國機器人專家 Peter Scott-Morgan 博士被診斷出患有 ALS 時,他被告知這種疾病將逐漸奪走他的聲音、他的動作,並最終奪走他在世界上的地位。但他拒絕接受“失去言語就意味著失去身份”的觀點。隨著身體虛弱,斯科特-摩根轉向技術,嘗試語音合成、凝視界面和基於化身的通信。他的公開轉變為他贏得了世界第一的稱號人類機器人,”但口號涵蓋了更深層次的雄心:重新定義殘疾和人工智能等技術如何共同發展。

2022 年他去世後,斯科特-摩根基金會 (SMF) 繼續他的使命。該組織開始將斯科特·摩根的設計尊嚴哲學轉化為現實世界的技術。其中一項工作是由基金會首席技術專家伯納德·穆勒 (Bernard Muller) 發起的,他因肌萎縮側索硬化症 (ALS) 完全癱瘓。 Muller 開始共同構建和開發 VoXAI。

“我用眼睛逐個字母地構建了 VoxAI。它很慢,這是一項持久的工作,但當你的需求是真實的時,你就會繼續前進,”穆勒通過 VoXAI 系統回應《觀察家報》。我使用人工智能代理作為我的“額外雙手”,將任務分解為小步驟,進行測試、完成,並讓自動化完成我的身體無法完成的事情。以前的工具不太智能,基本上僅限於輸入字母——有用,但功能不太強大。 ”

ALS 目前影響數万人 在美國和世界各地有數十萬人。隨著病情的進展,高達 95% 的患者最終會失去自然語言交流的能力。現有的解決方案仍然昂貴且不完善。高級增強和替代通信 (AAC) 設備(尤其是那些需要眼動追踪等專用硬件的設備)通常成本在 10,000 美元到 15,000 美元之間。幾十年來,這種障礙讓數百萬人幾乎無言以對,依賴於平息情感和抹去身份的系統。

VoXAI 上週在紐約人工智能峰會上亮相。這是以色列人工智能初創公司 D-ID、語音人工智能公司 ElevenLabs、Irisbond、聯想、Nvidia 和多家學術合作夥伴之間的合作。 D-ID 的實時頭像引擎將面部表情、微情緒和自然的嘴巴動作帶入生活。 Irisbond 的材料可以精確控制眼球追踪。 ElevenLabs 的語音合成重現了用戶患病前的聲音。 Nvidia GPU 提供近乎零延遲所需的實時 AI 性能。聯想提供強大的硬件環境,保持系統穩定且易於訪問。

D-ID 於 2017 年在以色列成立,最初因其隱私技術而獲得認可,並於 2019 年成為人工智能視頻創作領域的先驅。其係統現在為財富 500 強公司和公共組織的數字演示者、學習夥伴和互動化身提供支持。

D-ID 聯合創始人兼首席執行官吉爾·佩里 (Gil Perry) 告訴《觀察家報》:“談到殘疾問題時,最大的盲點是假設它太小或太小眾,無法實現商業相關。” “我們相信,富有表現力的實時數字存在正在成為通信基礎設施的新水平,而可訪問性是這一價值最明確和最緊迫的地方。”

“對於某些人來說,富有表現力的存在是一種福音,對於另一些人來說,這是生命線,”佩里補充道。 “醫療保健和輔助技術提供商需要一個可靠的表達水平化身,可以插入他們的系統,讓最重要的人感到真正的人性化溝通。”

帶有短信的屏幕帶有短信的屏幕
Muller 與 VoXAI 互動。 由斯科特·摩根基金會提供
Leah Stavenhagen 和她的 VoXAI 化身。Leah Stavenhagen 和她的 VoXAI 化身。
Leah Stavenhagen 和她的 VoXAI 化身。 由斯科特·摩根基金會提供

VoXAI 的核心基於一個簡單但具有變革性的想法:輔助技術不應簡單地代表用戶生成單詞。它應該幫助他們表達自己。

ALS 倡導者、VoXAI 早期試驗參與者 Leah Stavenhagen 表示,失去演講最困難的部分是隨之而來的隱形感。她最近開始使用該工具作為 Beta 測試人員,並在該平台在人工智能峰會上公開亮相時在舞台上展示了​​​​她的數字化身。

“當溝通每次回复需要 30 秒到幾分鐘的時間時,對話就不會等待。當你整理好想法時,話題已經轉移了,”他通過 VoXAI 系統回應《觀察家報》。 “人們不再問複雜的問題,而是開始談論‘你’而不是‘對你’。

為了進行交流,用戶通過眼球追踪設備與放置在他們面前的屏幕進行交互。當對話在他們周圍展開時,麥克風會記錄其他人所說的內容,人工智能會快速做出三種可能的回應。用戶只需移動眼睛即可選擇一個。一旦選擇,化身(顯示在用戶上方的屏幕或連接的設備上)立即以用戶自己的聲音做出響應,包括面部細節和情緒表達。化身通過不斷的互動、吸收偏好、社交線索和個人歷史來不斷學習。目標是保持許多人隨著疾病進展而失去的自我連續性。

“當有人第一次看到他們的化身或聽到他們的聲音時,通常會有一個認可的時刻,因為你正在回饋一些失去的東西,”斯科特摩根基金會首席執行官拉沃恩·羅伯茨告訴觀察家報。

輔助通信技術長期以來一直以高昂的價格來定義。 SMF 試圖通過提供免費的入門級 VoXAI 來升級此模型,每月訂閱 30 美元即可獲得高級功能。

“身份保存將成為一個獨立的類別。語音克隆現在已經存在,但我們正在朝著完整的數字身份邁進,你的聲音、你的表情、你的溝通模式都會被保存和保護,”羅伯茨說。 “環境人工智能係統能夠在沒有明確命令的情況下監聽和響應環境,這將改變護理、老年護理,並為行動不便的人們提供更多的獨立性。”

這項 ALS 技術由癱瘓者打造並為他們服務,賦予人工智能人類的聲音



來源連結