春節(jié)前夕,一項基于人工智能技術的公益活動在廣州市天河消防駐地開展。通過這項活動,消防員們只需用日常的語氣錄制十幾句話,就能夠獲得一份自己語音制作出的有聲故事集。
“對于我們來說,大年夜值守保安全是我們的職責。”廣州市天河區(qū)消防救援大隊代理指揮員老裴表示,由于春節(jié)期間不能回家,很希望能用其他方法陪伴孩子和家人。錄制音頻后,自己的聲音能在自己值守時陪伴孩子鼓勵孩子,在孩子背古詩、讀歷史、學英語的時候能感受到家長的期待和關愛。老裴錄制音頻后,由京東云言犀語音合成生成的英文故事就能以老裴的聲音播放,即便過年不回家,老裴也能成為孩子的英語啟蒙老師。
京東云言犀團隊研發(fā)人員介紹,目前依托言犀大模型,參與者只需錄制10句話樣本,即可在30分鐘內完成模型自動化訓練與部署,還原真人音色、音調、語氣。為了更逼真地模仿參與者,AI定制語音還支持廣東話、成都話等多種方言以及多種外語。
據介紹,大模型讓人工智能的訓練時間更短,模仿更真實。在訓練階段,機器通過學習捕捉每個人說話的特色,將真人采集的2—3分鐘語音,自動切分為10秒內短句,通過語音識別技術將語音轉化為對應文本,同時提取音頻的聲學特征頻譜,以此為目標值對基礎模型進行微調。在合成階段,輸入的故事文本被分段、切句,并被傳入訓練好的語音模型,通過語音合成技術,模型會依次反饋和播放語音,同時后端持續(xù)合成。
大模型不僅惟妙惟肖還原音色,還將豐富的情感注入到聲音中。相關技術人員介紹,通過風格遷移技術,京東云言犀支持文本重讀、語調修飾,還可調整合成音色的風格韻律,實現睡前故事的娓娓道來、帶貨主播的慷慨激昂、文學朗讀者的抑揚頓挫等不同場景的語氣語調,通過情感判斷模型以及知識庫語義挖掘,大模型還可在多輪交互的客服場景中精準識別用戶喜怒哀樂,給出匹配相應情緒的回答。
據了解,京東云言犀語音模型,訓練時融合近6億用戶每日超1000萬次的智能服務交互,每月累積超200萬小時通話語音,積累了3000萬個高質量問答知識點,覆蓋廣泛的知識圖譜。
京東云相關負責人介紹,幾年前,新聞主播、演員等群體能夠獲得自己的人工智能合成聲音,隨著技術的發(fā)展,普通公眾也可以擁有自己的合成聲音。目前,京東云言犀全自研的語音語義技術廣泛應用于零售智能外呼、多模態(tài)數字人、政務熱線等多個場景,例如支持全國首個12355青少年綜合服務智能平臺、不間斷服務蕪湖12345熱線,并助力搭建智慧養(yǎng)老平臺,為天津市河西區(qū)5000多位獨居老人每天呼出關懷電話。
除了消防員群體,這次活動還為極地科考者、電商客服等春節(jié)必須值守工作崗位的群體克隆音色并生成陪伴故事,讓他們的聲音“回家”過春節(jié)。
(圖片由活動主辦方提供)
春節(jié)前夕,一項基于人工智能技術的公益活動在廣州市天河消防駐地開展。通過這項活動,消防員們只需用日常的語氣錄制十幾句話,就能夠獲得一份自己語音制作出的有聲故事集。
“對于我們來說,大年夜值守保安全是我們的職責。”廣州市天河區(qū)消防救援大隊代理指揮員老裴表示,由于春節(jié)期間不能回家,很希望能用其他方法陪伴孩子和家人。錄制音頻后,自己的聲音能在自己值守時陪伴孩子鼓勵孩子,在孩子背古詩、讀歷史、學英語的時候能感受到家長的期待和關愛。老裴錄制音頻后,由京東云言犀語音合成生成的英文故事就能以老裴的聲音播放,即便過年不回家,老裴也能成為孩子的英語啟蒙老師。
京東云言犀團隊研發(fā)人員介紹,目前依托言犀大模型,參與者只需錄制10句話樣本,即可在30分鐘內完成模型自動化訓練與部署,還原真人音色、音調、語氣。為了更逼真地模仿參與者,AI定制語音還支持廣東話、成都話等多種方言以及多種外語。
據介紹,大模型讓人工智能的訓練時間更短,模仿更真實。在訓練階段,機器通過學習捕捉每個人說話的特色,將真人采集的2—3分鐘語音,自動切分為10秒內短句,通過語音識別技術將語音轉化為對應文本,同時提取音頻的聲學特征頻譜,以此為目標值對基礎模型進行微調。在合成階段,輸入的故事文本被分段、切句,并被傳入訓練好的語音模型,通過語音合成技術,模型會依次反饋和播放語音,同時后端持續(xù)合成。
大模型不僅惟妙惟肖還原音色,還將豐富的情感注入到聲音中。相關技術人員介紹,通過風格遷移技術,京東云言犀支持文本重讀、語調修飾,還可調整合成音色的風格韻律,實現睡前故事的娓娓道來、帶貨主播的慷慨激昂、文學朗讀者的抑揚頓挫等不同場景的語氣語調,通過情感判斷模型以及知識庫語義挖掘,大模型還可在多輪交互的客服場景中精準識別用戶喜怒哀樂,給出匹配相應情緒的回答。
據了解,京東云言犀語音模型,訓練時融合近6億用戶每日超1000萬次的智能服務交互,每月累積超200萬小時通話語音,積累了3000萬個高質量問答知識點,覆蓋廣泛的知識圖譜。
京東云相關負責人介紹,幾年前,新聞主播、演員等群體能夠獲得自己的人工智能合成聲音,隨著技術的發(fā)展,普通公眾也可以擁有自己的合成聲音。目前,京東云言犀全自研的語音語義技術廣泛應用于零售智能外呼、多模態(tài)數字人、政務熱線等多個場景,例如支持全國首個12355青少年綜合服務智能平臺、不間斷服務蕪湖12345熱線,并助力搭建智慧養(yǎng)老平臺,為天津市河西區(qū)5000多位獨居老人每天呼出關懷電話。
除了消防員群體,這次活動還為極地科考者、電商客服等春節(jié)必須值守工作崗位的群體克隆音色并生成陪伴故事,讓他們的聲音“回家”過春節(jié)。
(圖片由活動主辦方提供)
本文鏈接:人工智能定制語音助力值守者“回家”過春節(jié)http://m.lensthegame.com/show-2-2607-0.html
聲明:本網站為非營利性網站,本網頁內容由互聯網博主自發(fā)貢獻,不代表本站觀點,本站不承擔任何法律責任。天上不會到餡餅,請大家謹防詐騙!若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。