1月9日,云上曲率语音AI算法团队收到了由科大讯飞发起、中国信息协会联合主办的2022第五届科大讯飞AI开发者大赛寄来的奖杯,成功斩获多语种统一语音识别挑战赛冠军、多语种语音识别(受限系统)挑战赛冠军及多语种语音识别(非受限系统)挑战赛季军,同时获得9.5万元现金奖励。
这三项荣誉代表了云上曲率近一年在语音识别方面的阶段性研究成果,是对云上曲率研发成绩的认可与鼓励。
2022“iFLYTEK A.I.开发者大赛”
2022“iFLYTEK A.I.开发者大赛”是由科大讯飞发起,中国信息协会联合主办的人工智能创新算法与应用竞赛。大赛覆盖智能语音、视觉、图文识别等人工智能热门技术;涵盖元宇宙、生物与环保、医疗健康、企业数字化、智能家居等多领域;聚焦人工智能、新能源车及车联网、节能环保、新材料、智能家电、高端设备制造等十大新兴产业,联合58家权威出题方,设立108道专业赛题,共吸引32333支人工智能团队展开角逐。其中AI算法赛包含:计算机视觉、语音、自然语言处理、数据挖掘及光学字符识别5个方向。此次比赛语音算法相关赛道总共有12个,其中语音识别赛道3个。
随着经济全球化发展和国家“一带一路”倡议的提出,跨境国际合作和交流日益频繁,对多语种语音技术提出更专业、更多样化的需求。“多语种语音识别挑战赛”旨在加强多语种识别研究的交流、促进技术发展。在众多赛题中,“多语种统一语音识别挑战赛”尤为引人注目,不仅因为这些赛题对参赛团队的技术实力和创新能力有着较高的要求,也因为这些赛题的设置充分聚焦了近年来社会大众普遍关注的领域。云上曲率语音AI算法团队组队Funspeech,参加了全部语音识别赛道的3个比赛,在3个比赛中都取得了优异的成绩。
以多语种统一语音识别挑战赛为例,在过去几年,已成功举办包括方言挑战赛,多语种分类挑战赛、连续多语种分类挑战赛等,通过比赛的形式打磨了实用、高效的语音识别、语种分类技术。本届赛事聚焦斯瓦西里语、越南语、波斯语3个语种的语音识别任务,旨在攻克数据和专家资源稀缺的多语种语音语言关键技术。 经过初赛、复赛及答辩,云上曲率语音AI算法团队从全国参赛184个团队中脱颖而出,喜夺多语种统一语音识别挑战赛冠军。
云上曲率语音AI算法团队参赛初心
近年来, 随着中国移动互联网的高速发展,越来越多的企业扬帆出海,因此小语种语音识别的重要性日益提高。据统计,世界范围内,小于百万人群使用的小语种占据世界所有语种的80%(如下图),但同时小语种数据难以获取、标注成本高,因此低资源情况下如何提高小语种识别性能成为了世界性研究难题。
为了研究并解决此实际问题,云上曲率语音AI算法团队参与了语音识别相关的3个赛道:“多语种统一语音识别挑战赛”、“多语种语音识别(受限系统)挑战赛”和“多语种语音识别(非受限系统)挑战赛”。团队采用业内最先进的端到端建模方式搭建识别系统,针对训练数据量小的问题,在受限系统中采用了数据增强的方式扩充数据,同时采用多语种混合建模来提升每个建模单元的训练数据量;在非受限系统中采用爬取带字幕数据,然后通过模型加规则进行数据清洗的方式,得到更多高质量的训练数据。针对测试数据语种未知问题,采用模型分类和文本匹配的方式获取高精确语种标签。同时团队采用了bpe建模、单语种finetune、双向解码、增加解码beam宽度等方式,使模型性能进一步得到提升。
此次AI算法挑战赛,云上曲率语音AI算法团队不仅取得佳绩,同时在比赛中验证了优化方案的有效性,为进一步提升云上曲率语音识别产品性能打下了坚实的基础。
关于云上曲率
云上曲率(北京云上曲率科技有限公司)是一家领先的全球实时互动与人工智能解决方案服务商。我们以“成为全球多语言互动技术引领者”为使命,致力于为社交、游戏等泛娱乐领域客户提供一站式解决方案,产品涵盖实时互动、人工智能及内容安全三个部分,包括实时信令、即时通信、实时音频、实时视频;实时翻译、语音识别、语音翻译、实时语音翻译;多语言文本审核、图片审核、音频审核、视频审核等产品。
云上曲率自主研发了国内首个支持30多种语言的内容审核服务,覆盖私聊、群聊、签名、昵称、公开评论、弹幕、语音房、直播、头像等多个场景,助力业务规避海外内容风险,为C端用户提供更为融洽的社交环境,提升产品的粘性。
未来,云上曲率将积极拓展海外及国内市场,为更多的出海企业提供专业的实时互动与人工智能解决方案服务。