隨著與ChatGPT的開發(fā)機構(gòu)OpenAI的合作成果良好,微軟似乎越來越有自信,近日,微軟首席執(zhí)行官薩蒂亞·納德拉(Satya Nadella)在接受英國《金融時報》采訪時表示,語音助手“笨得像塊石頭”,“無論是Cortana、Alexa、谷歌助理(Google Assistant)還是Siri,所有這些都不起作用?!彼Q,新型人工智能將引領(lǐng)潮流。
十多年來,盡管科技巨頭一直在嘗試各類語音助手,但事實卻表明,蘋果的Siri、亞馬遜的Alexa以及谷歌助理都發(fā)展不順利,在中國,一批類似的產(chǎn)品也陷入了尷尬境地。《紐約時報》首席消費科技作者布萊恩·陳(Brian X. Chen)評論道,語音助手過去遇到了發(fā)展瓶頸,正因如此給了AI聊天機器人崛起的空間,讓微軟和OpenAI在人工智能競賽中遙遙領(lǐng)先。
那么,蘋果、亞馬遜和谷歌是如何輸?shù)暨@一輪人工智能競賽的?
(資料圖片僅供參考)
誤入歧途的語音助手
12年前一個雨天,蘋果公司(Apple)的高管們在一個擁擠的禮堂登臺發(fā)布iPhone 4s。這款手機看起來和之前的版本沒什么區(qū)別,但有一個新功能很快就引起了觀眾的熱議:語音助手Siri。
時任蘋果軟件主管的斯科特·福斯特爾(Scott Forstall)按下iPhone上的一個按鈕,召喚出了Siri,并向它提問。在他的要求下,Siri查看了巴黎的時間,定義了“有絲分裂”,并列出了14家評級較高的希臘餐廳,其中5家位于加州帕洛阿爾托。
“我在人工智能領(lǐng)域工作了很長時間,這仍然讓我大吃一驚。”福斯特爾當(dāng)時說。
如今,Siri早已成為被調(diào)侃為“人工智障”的對象。Siri的聯(lián)合創(chuàng)始人亞當(dāng)·切耶(Adam Cheyer)告訴《金融時報》,ChatGPT理解復(fù)雜指令的能力,讓現(xiàn)有的語音助理看起來相對愚蠢?!爸暗哪芰μ珜擂瘟?。”他說,“沒有人知道它們能做什么或不能做什么。它們不知道自己能說什么或不能說什么?!?/p>
其他語音助手的技術(shù)也一直停滯不前,成為被取笑的對象。亞馬遜搭載Alexa的智能音箱Echo甚至作為笑點出現(xiàn)在2018年《周六夜現(xiàn)場》(Saturday Night Live,美國脫口秀節(jié)目)的小品中,而最初,亞馬遜創(chuàng)始人杰夫·貝索斯(Jeff Bezos)曾經(jīng)在白板上興奮地勾勒出他對Alexa的愿景:網(wǎng)上購物,控制小工具,甚至給孩子們讀睡前故事。
事實上,Siri、Alexa和其他語音助手也曾在公眾中引發(fā)過類似ChatGPT的熱情,但在過去十年里,它們浪費了在人工智能競賽中的領(lǐng)先機會。
前員工表示,亞馬遜和谷歌錯誤地估計了語音助手的使用方式,導(dǎo)致他們投資了一些很少有回報的領(lǐng)域。當(dāng)這些嘗試失敗后,公司對這項技術(shù)的熱情就減弱了。
2014年,亞馬遜發(fā)布Echo,希望該產(chǎn)品能夠讓消費者通過與Alexa對話來下單,從而幫助其增加在線商店的銷量。但一位參與Alexa的前亞馬遜高管表示,雖然人們很享受Alexa回答天氣提示和設(shè)置鬧鐘的功能,但很少有人用Alexa訂購商品。
這位前高管表示,亞馬遜可能在制造新型硬件方面投資過度,比如現(xiàn)已停產(chǎn)的與Alexa兼容的鬧鐘和微波爐,這些產(chǎn)品的售價低于或等于成本。
此外,他表示,亞馬遜在創(chuàng)建一個讓人們輕松擴展Alexa功能的生態(tài)系統(tǒng)方面投資不足,雖然亞馬遜的商店也提供Alexa相關(guān)的第三方插件,但設(shè)置和使用十分困難,這與從應(yīng)用商店下載應(yīng)用程序的順暢體驗完全不同。
去年年底,亞馬遜負(fù)責(zé)Alexa的部門是該公司18000人裁員的主要目標(biāo),一些Alexa高管已經(jīng)離開了公司。
一位曾在“谷歌助理”工作的前經(jīng)理表示,亞馬遜在Alexa上的失敗可能導(dǎo)致谷歌誤入歧途。谷歌的工程師花了數(shù)年時間對其語音助手進(jìn)行試驗,以模仿Alexa的功能,包括設(shè)計智能揚聲器和聲控平板電腦屏幕,以控制恒溫器和電燈開關(guān)等家用電器。該公司后來將廣告整合到這些家居產(chǎn)品中,但這并沒有成為主要的收入來源。
隨著時間的推移,谷歌意識到大多數(shù)人只將語音助手用于數(shù)量有限的簡單任務(wù),例如啟動計時器和播放音樂。2020年,當(dāng)谷歌高管普拉巴卡·拉加萬(Prabhakar Raghavan)接管“谷歌助理”時,他的團隊將這個虛擬伴侶重新定位為Android智能手機的附屬功能。今年1月,當(dāng)谷歌的母公司解雇了12000名員工時,負(fù)責(zé)家庭設(shè)備操作系統(tǒng)的團隊失去了16%的工程師。6月,它將終止專門為其語音助理制作的第三方“對話操作”的訪問。
和ChatGPT基于不同技術(shù)
這些語音助理產(chǎn)品和類似ChatGPT的聊天機器人雖然功能類似,但本質(zhì)上基于不同類型的人工智能模型。聊天機器人由大型語言模型提供動力,這些模型是經(jīng)過訓(xùn)練的系統(tǒng),能夠根據(jù)從網(wǎng)絡(luò)上抓取的大量數(shù)據(jù)集識別和生成文本。
相比之下,Siri、Alexa和“谷歌助理”則通過所謂的指揮控制系統(tǒng)進(jìn)行工作。它們可以理解有限的問題和請求列表,比如“紐約市的天氣怎么樣?”或“打開臥室的燈”。如果用戶要求虛擬助手做一些代碼中沒有的事情,機器人會簡單地說它無法提供幫助。
這幾家公司都嘗試過將語音助手進(jìn)行升級,但該類技術(shù)的升級難度似乎遠(yuǎn)超生成式人工智能,曾參與Siri開發(fā)的蘋果前工程師約翰·伯基(John Burkey)說,Siri的設(shè)計很繁瑣,增加新功能也很費時間。2014年,他受命改進(jìn)Siri,但發(fā)現(xiàn)Siri的數(shù)據(jù)庫包含一個巨大的單詞列表,他說,這就形成了“一個大雪球”。如果有人想在Siri的數(shù)據(jù)庫中添加新詞,代碼會“越滾越多”。
因此,看似簡單的更新,比如向數(shù)據(jù)集中添加一些新短語,就需要重建整個數(shù)據(jù)庫,這可能需要長達(dá)六周的時間。添加更復(fù)雜的功能,比如新的搜索工具,可能需要將近一年的時間。他說,這意味著Siri不可能通過升級成為下一個ChatGPT。
相比之下,蘋果的處境還好一些,他們利用Siri吸引了消費者購買iphone。而亞馬遜和谷歌的前高管則表示,Alexa和“谷歌助理”依賴于與Siri類似的技術(shù),但這兩家公司很難通過這些語音助手產(chǎn)生有意義的收入。
在中國,市面上主要有小愛同學(xué)、小度、天貓精靈等主流的AI語音助手,被用在手機、電腦、電視、音箱等多種電子產(chǎn)品上,也是連接各種智能家居產(chǎn)品的中樞。但是,其用戶體驗卻備受詬病,比如識別度不高、數(shù)據(jù)庫不夠完善,很多產(chǎn)品在用戶家中處于半閑置狀態(tài)。
語音助手準(zhǔn)備如何“翻盤”?
根據(jù)布萊恩·陳的說法,盡管微軟現(xiàn)在在創(chuàng)新競賽中搶占了領(lǐng)先地位,但谷歌仍緊隨其后。秉著“打不過就加入”的原則,將生成式人工智能帶來的搜索引擎領(lǐng)域的技術(shù)進(jìn)步引入語音助手,可能只是時間問題。
一些人工智能專家也表示,在未來,聊天機器人和語音助手的技術(shù)將會融合。這意味著人們能夠通過語音控制聊天機器人,要求虛擬助手幫助他們完成工作,而不僅僅是查看天氣等簡單任務(wù)。
最近,這些大型科技公司都在競相對ChatGPT做出回應(yīng)。2月,蘋果在總部舉行了年度人工智能峰會,這是一個內(nèi)部活動,讓員工了解其大型語言模型和其他人工智能工具,兩名了解該項目的人士說,Siri團隊成員在內(nèi)的許多工程師每周都在測試語言生成功能。
科技媒體Techradar表示,蘋果雖然沒有發(fā)布新的語音助手,但這可能只是在等待時機,然后再出手奪回人工智能陣地。一些敏銳的用戶已經(jīng)在將ChatGPT嵌入Siri,用戶這種增強Siri功能的渴望也是蘋果可以利用的潛力。
此前,谷歌已經(jīng)發(fā)布了聊天機器人巴德(Bard),3月14日,谷歌表示它將很快發(fā)布生成式人工智能工具,幫助企業(yè)、政府和軟件開發(fā)人員構(gòu)建帶有嵌入式聊天機器人的應(yīng)用程序,并將底層技術(shù)整合到他們的系統(tǒng)中。
3月16日,百度開放大模型“文心一言”的測試。百度創(chuàng)始人、董事長兼CEO李彥宏表示,百度將在所有業(yè)務(wù)中全面集成文心一言,包括與語音助手小度進(jìn)行集成,升級小度智能設(shè)備和服務(wù)。
AI初創(chuàng)公司Perplexity的創(chuàng)始人Aravind Srinivas說:“這些產(chǎn)品過去從未有效,因為我們從未擁有人類層面的對話能力。”“現(xiàn)在我們做到了?!?/p>
Siri的聯(lián)合創(chuàng)始人切耶說,生成式人工智能有可能使語音助手回到最初的科幻軌道上?!拔掖_實認(rèn)為這與質(zhì)量有關(guān)?!彼f,“從根本上說,這項技術(shù)將實現(xiàn)上一代語音助理所沒有的廣度、靈活性和復(fù)雜性。我認(rèn)為會出現(xiàn)復(fù)興。”
標(biāo)簽: