KITT.AI聯(lián)合創(chuàng)始人、CTO陳果果先生現(xiàn)在演示了如何使用KITT.AI語音喚醒技術快速打造一個語音喚醒設備。根據(jù)陳果果先生演示,進入Snowboy的喚起詞庫并新建喚起詞“你好景鯤”后,接著只需要說三遍“你好景鯤”,即可完成喚起詞的訓練。在測試環(huán)節(jié),設備只會對喚起詞“你好景鯤”進行響應。
景鯤稱,喚醒萬物的核心三要素是要做好聽清、聽懂、滿足。聽懂是人工智能時代用數(shù)據(jù)和技術解決的關鍵問題。在這個時代,只有百度在中國市場是“唯一”具備聽清、聽懂、滿足的實力,打造一個開放賦能的生態(tài)系統(tǒng)。
1、“聽清”方面:百度的語音識別率做到了近場識別的準確率97%以上,但這些在AI時代還不夠。在AI時代,技術要與場景相結合。我們希望把語音放到真正的場景里面去解決問題,研發(fā)了麥克風陣列、回聲消除、語音喚醒、人像識別等技術。這些都是我們逐漸推進的世界先進技術,將被放到各種場景中實現(xiàn)用戶聽清的需求。
2、“聽懂”方面:數(shù)據(jù)多、介入深是打造對話系統(tǒng)的必然條件,具備這兩點才能做好一個真正可以對話的“聽懂”系統(tǒng)。百度是具備數(shù)據(jù)量最大的公司。百度擁有億級的多輪對話數(shù)據(jù)、十億級的知識圖譜數(shù)據(jù)。
3、聽懂并滿足“聽一首某某的歌”這樣的用戶需求還不夠,真正用戶想要的是更自然、更復雜的需求,比如“我要聽我手一杯品嘗你的美這首歌”,比如“想聽哥哥的歌”,只有把用戶在真實場景中表達的復雜請求做好,才能真正做出一個真正聽懂用戶需求的產(chǎn)品。
公開資料顯示,KITT.AI公司專注于語音喚醒和自然語音交互技術,此前還曾成功入選了CB Insights人工智能創(chuàng)業(yè)一百強。此外,Kitt.AI聯(lián)合創(chuàng)始人兼CEO姚旭晨本科畢業(yè)于南京大學,并在約翰霍普金斯大學獲得計算機科學博士學位!隨著KITT AI被百度全資收購,姚旭晨或許也將成為百度在人工智能領域中的一員大將。
留言與評論(共有 條評論) |