語音呼叫合成軟件
|
總體技術要求:
TTS系統(tǒng)支持熱備運行,,能夠實現(xiàn)故障切換,具備雙機負載均衡機制,。
功能性要求
支持中文普通話,、廣東話及新疆維語等風格語音播報,,具備多語種引擎架構,方便第三方開發(fā)商通過API或者MRCP進行調(diào)用,;
能夠進行中/英文混合文本的語音合成,,其中,中文語音合成為標準普通話,,合成語音連續(xù),、可懂、自然,,接近普通人說話標準,;
支持多字符集文本輸入,如GB2312,、GB18030,、GBK、Unicode和UTF-8等,;
支持SSML和S3ML標注文本與格式輸入,;
支持多種語音格式的輸出;
支持語音參數(shù)的調(diào)節(jié)控制,,包括:語速,、音量和語調(diào);
具有完善的管理平臺,,能夠監(jiān)控TTS服務器的運行情況,可以實時獲取系統(tǒng)運行壓力及并發(fā)數(shù)等,,對異常事件具有報警機制和必要的處理措施,;
系統(tǒng)必須提供自定義資源,使得合成引擎具有更好的個性化定制和優(yōu)化能力,,自定義詞庫允許用戶添加刪除中文和英文的詞組,,定義詞組的發(fā)音方式和音標,其中發(fā)音方式用以指定特定詞組發(fā)音方式,,比如指定某個英文詞組是否按照字母來朗讀,。而對音標的自定義可以糾正極少數(shù)多音字(詞)音標處理錯誤的現(xiàn)象;
支持背景音和穿插在合成語音中的錄音文件,;
支持文本過濾功能,,能夠對指定的文本,比如敏感詞語進行過濾處理,;
提供對合成效果優(yōu)化的解決方案,,能夠針對實際應用環(huán)境,提供合成效果優(yōu)化方案,;
支持Microsoft Windows/Unix/Linux操作系統(tǒng),;
必須能夠和主流IVR系統(tǒng)無縫集成,,且對第三方產(chǎn)品在其平臺上的嵌入具有較好的支持,必須要能夠得到較好的支持,;
語音合成系統(tǒng)可以多種不同的方式來完成文字到語音的轉換,,包括本地調(diào)用、網(wǎng)絡調(diào)用,、離線合成,;
支持多語種引擎的方便掛接和升級;
可通過標準的API和MRCP開發(fā)接口進行完整的系統(tǒng)功能開發(fā),,以及與現(xiàn)有語音系統(tǒng)的集成工作,,要求對如何與語音系統(tǒng)進行無縫銜接進行完整的闡述,提供切實可行的實施方案,。
效率性要求
合成效率:在90個并發(fā)請求的情況下,,對50個漢字進行動態(tài)合成的時間不超過1.5秒,最大響應時間小于6秒,。120個并發(fā)請求的情況下,,單筆合成時間不超過2秒;
容錯性和可靠性:支持服務器集群部署,,即使個別服務器失效,,也不會造成整個系統(tǒng)崩潰,停止服務,;
維護方便:可以關閉一臺TTS服務器進行維修,,而對整個系統(tǒng)的功能沒有影響;
可伸縮性:隨著呼叫量的增加,,可增加TTS服務器和應用的數(shù)量,,無須停止任何運行著的應用程序或關閉IVR系統(tǒng);
擴展能力:當應用系統(tǒng)需要擴容時,,客戶端服務器不需要做任何的修改,,只需要在網(wǎng)段內(nèi)添加一臺新的語音合成服務器,并且自動啟動服務,;
使用方便:在對業(yè)務系統(tǒng)進行更新時,,只需按照日常習慣進行文字的更新即可,不必進行特使的修改或編程即可得到比較理想的語音效果,。
|