AI模型自主訓練與優化支援利用「語音 + 逐字稿」資料進行聲學模型(Acoustic Model)與語言模型(Language Model)的深度訓練與微調。系統能針對特定對象的口音、說話節奏以及特定辦公環境的背景噪音(如機房、工廠或開放式會場)進行適應性學習,實現隨著數據累積而持續提升的辨識精準度。
即時會議語者聲紋辨識 語音辨識採用Azure的speech to text技術,並結合聲紋辨識深度學習模型與 WebSocket 技術,實現低延遲的即時語者判定。支援語者註冊功能,可即時提取語者聲紋特徵並建立專屬聲紋資料庫。