有没有好看的三级 支撑同期识别20多种方言本领成焦点!奇富科技亮相大家顶会
(原标题:支撑同期识别20多种方言本领成焦点!奇富科技亮相大家顶会)有没有好看的三级
近日,奇富科技受邀出席了在希腊举办的国外语音通讯与信号贬责顶级会议——INTERSPEECH 2024,并发表了题为Qifusion-Net: Layer-adapted Stream/Non-stream Model for End-to-End Multi-Accent Speech Recognition的主旨演讲,全面展示了其在语音识别本领领域的竖立,为中国语音本领走向全国、参与大家竞争开辟了新的标杆。 图1:奇富科技在INTERSPEECH 2024会议作念主旨演讲在现场,奇富科技先容了可同期支撑20多种方言的新一代奇富语音识别系统“QiFree”,这是国内金融行业内字错率最低的汉文语音识别系统。在汉文口音与方言语音识别领域的巨擘测试集KeSpeech的对比中,奇富科技凭借其在自动语音识别(Automatic Speech Recognition, ASR)领域的深厚积攒,杀青了方言口音分类准确率的显耀提高,达到了79.10%,远超KeSpeech的基线水平61.13%,这一数据直不雅响应了奇富科技在语音识别准确性上的不凡说明。同期,在臆测识别误差率的要害标的——CER(Character Error Rate, 字符误差率)上,奇富科技更所以8.08%的收获,远优于KeSpeech的10.38%,展现了其在汉文方言识别领域的高效与精确。 表1:奇富科技“QiFree”性能效果与KeSpeech Baseline对比奇富科技自研的汉文语音识别系统“QiFree”,松弛了单一模子只可识别特定单一方言的窘境,通过编削的层自符合交融结构,借助分享信息编码模块更高效的索要方言信息,杀青了即说即译,进一步增强了语音机器东谈主的及时交互智商。值得一提的是,“QiFree”不仅在平日话识别领域的CER上保捏率先地位,更在冀-鲁、江淮、胶-辽、兰-银等多个方言区域的识别性能上,比较过往最好收获杀青了稀奇15%的显耀提高。这一突破性效果获得了INTERSPEECH三位孤立审稿东谈主的高度招供,他们一致招供奇富科技论文《Qifusion-Net:基于特征交融的流式/非流式端到端多口音语音识别框架》所展现的系统框架编削性与识别性能的不凡说明,并一致授予其“ACCEPT”的评定。值得一提的是,在与国内一流公司的对比中,奇富科技相通展现出了压倒性的上风。即即是在濒临参数规模更大、考试数据量更丰富的敌手时,奇富科技仍是能以更低的CER(8.08% vs 15.61% vs 26.55%)脱颖而出,讲明了其本领架构的优胜性和算法优化的高效性。此外,与大家率先的语音识别系统(如Openai-whisper v2)比较,尽管后者在通用话语识别上具有显耀上风,但在汉文方言识别这一细分领域,奇富科技仍是保捏了显耀上风,这进一步印证了其在方言识别本领上的大家率先地位。 表2: 奇富科技“QiFree”要害标的与国表里一流科技公司对比据了解,INTERSPEECH动作大家语音科学界最负知名的年度会议之一,齐集了来自全国各地的顶尖学者、连系东谈主员及行业首长,共同研讨语音本领的最新进展、挑战与将来趋势。这一平台不仅代表了语音本领领域的最高学术水平,亦然新本领、新理念相通与碰撞的绝佳局面。而奇富科技在INTERSPEECH 2024上的再一次精彩亮相,不仅是对其多年来在语音识别本领领域深耕细作效果的一次全面展示,更是向全国宣告了中国企业在这一领域的浩大竞争力和无尽后劲。孙悦车震门