Menu
您的位置:首页 > 宏观产业 >

腾讯商世东:推动技术价值外溢 让听障人士“听得清”

新闻来源:网络整理  2023-03-31 19:31:39

3月3日全国爱耳日,天籁听未来行动合作体发布会正式举办。腾讯会议天籁实验室联合中国聋人协会、中国听力语言康复科学杂志社、中国听力医学发展基金会、中国老龄事业发展基金会、中国联通、腾讯公益、南方周末等机构和合作伙伴,共同倡议发起“天籁听未来行动合作体”,并公布了腾讯天籁行动在关注听障群体信息无障碍建设方面的系列举措和最新成果。

image.png

发布会上,腾讯会议天籁实验室主任商世东发表主题演讲。他指出,天籁实验室不仅为腾讯会议的2亿多用户提供清晰流畅的视频会议体验,还致力于推动技术价值外溢,用天籁音频AI技术改善听障人群的听觉体验,让AI技术惠及更广的人群,践行科技向善的愿景。

image.png

(腾讯会议天籁实验室主任商世东)

“去年今天,天籁行动联合社会机构发布的‘数字测听小程序’,希望提升全民爱耳护耳意识。”商世东表示,为了让更多人能够享受到便利、专业的听力测试,天籁实验室对去年的数字测听小程序进行了升级,将基于经典的噪声场景下的言语可懂度测试方法和中国“十二生肖”元素进行融合,联合华南理工大学、深圳大学以及国家耳鼻咽喉疾病临床医学研究中心等专业团队推出了“爱耳日十二生肖线上公益测听工具”,通过识别用户在不同噪声干扰下,识别生肖发音的准确率,对用户的听力水平进行评估,引导更多人关注和了解听力健康的重要性。

image.png

发布会上,商世东还介绍了与中国联通合作发布的“畅听王卡升级版”。基于腾讯天籁实验室专门为听障用户量身定做的个性化AI语音增强辅听算法,畅听王卡升级版不仅能够为用户提供经过降噪处理的“无障碍AI通话服务”,还可以将通话内容实时转化成文字显示在通话界面上,为听障用户提供听得清和看得清的通话体验。在该算法得到加持下,实现典型噪音场景下单一字节言语识别率提升66%,和实时字幕别准确率提高5.5-9.9个百分点。

image.png

商世东在演讲最后表示:未来天籁行动将持续保持“技术开放”原则,围绕听力测试、AI辅听和公益救助三个方向,为更多听障人士带来切实的帮助,助力信息无障碍环境的建设。

以下为商世东演讲全文:

尊敬的各位来宾,各位线上的网友,大家好!我代表腾讯会议天籁实验室向各位关注听力健康的朋友表示欢迎和感谢。

世界卫生组织2021年的报告显示全球有超过15亿人受到听力问题的困扰,在中国第二次全国残疾人抽样调查数据中,我国的听力残疾人达到2780万。随着老龄化的加深和更多的不健康的用耳方式这个数字还会不断地增加。由于交流的不便和信息的缺失,听障人士在学习、工作、生活中存在着诸多困难。

沟通上的障碍使得他们在参与社会生活,给家庭、社会带来的沉重的压力,或许他们经历的世界和我们略有不同,但他们和我们一起对人世间充满着热爱,期盼着能够更好地融入社会,活出自己的响亮和精彩。

自从2019年腾讯将科技向善确定为公司的新的愿景和使命之后,腾讯会议天籁实验室专注于音视频通讯技术的前瞻性研究,应用探索和落地。我们把天籁音频技术为腾讯会议2亿多用户创造了清晰流畅的语音体验基础之上,在践行腾讯科技向善理念牵引之下,从2020年开始,我们把经过广泛用户验证的音频技术成果走出我们的产业领域,在公益场景得到了更广泛的落地,让科技能够更好地服务于人群。

比如在去年我们与全球头部的奥地利人工耳蜗厂商美笛乐合作,推出了全球首个集成了听力测试+AI辅听+远程听力康复服务的平台——美讯听宝APP。有效地帮助听损人士提升单音节识别率达66%。帮助听障人群更好地掌握自己的听力状况,利用天籁AI语音音频技术改善听力,并且通过腾讯会议与远程服务的形式大大降低他们获得专家调试和康复指导的成本。基于美笛乐的听力学经验和腾讯天籁实验室积累的音频算法,经过美笛乐的主观实验显示,对听障且未佩戴听力助听设备的用户而言,提升单音节识别率66%,在负5到25DB的信噪比范围之下,新一代的AI语音增强方案可以有效地改善语音沟通的体验。

我们还与国内的最大的人工耳蜗厂商诺尔康合作,上市了搭载的AI天籁技术的第三代人工耳蜗产品,在诺尔康的设备上提高人工耳蜗语言清晰度和可懂度达40%。在诺尔康的实验数据显示,通过手机伴侣和人工耳蜗的联合解决方案后,语音识别率、信噪比和语音质量打分均有大幅度的改善,对听障人群的听觉体验有着非常积极的效果。目前诺尔康的人工耳蜗用户已经可以升级搭载了腾讯天籁音频技术的第三代新一代远航人工耳蜗系统。

除了面对听障人群,在帮助普通用户听力保护上,从2021年开始,在去年的全国爱耳日上,为了提升大众对听力健康的重视,我们结合互联网传播的特点,联合听力学专家推出了数字测听小程序,可以帮助普通用户简单快捷地评估自己的双耳听力。我们发现在远低于正常水平的区间段,20-30岁年轻群体的平均得分甚至低于40-50岁的中年区间群体,进一步的区间方差分析也体现了相同的趋势。经过和与会专家的探讨以及后续的样本调查。我们将这样的结果归功于部分年轻人的不健康用耳方式。20-30岁区间的年轻人属于90年代、00年代的群体,他们从小接触互联网以及长时间过度地接触电子设备,有可能导致他们的听力受到了不应该有的损伤。20-30岁区间的年轻人听力水平分化比较严重,从全年龄段的方差结果可以看得出来,年轻人相对于中年人的听力,年轻人的听力方差比中年人的听力方差还更加要高。

在今年爱耳日上,我们进一步升级了在线测听小程序,围绕着听力测试,联合华南理工大学、深圳大学以及国家耳鼻咽喉疾病临床医学研究中心等专业团队推出了融合了中国十二生肖元素的线上公益测听工具,这个工具基于噪声场景下的言语可懂度测试方法,可以帮助用户快速地初步评估和掌握自身的听力健康状况,帮助普通公众提升爱耳护耳意识。十二生肖听力小程序除了趣味性之外,我们经过对语音信号、十二生肖语音信号的信号进行进一步研究发现,他们在整个频域覆盖的广泛性和频域信号的多样性上均超过了去年的数字测听,相比去年的方法有了进一步改善,可以帮助用户更加全面地评估自身的听力状况。

除了听力测听小程序之外,由于听力可以带来言语发声的障碍,我们也一并发布了根据听力发声的小程序,通过对a、i、u这样原音字母的共振分布和它们基因分布进行测听,可以进行有效的评估,特别是针对老年人的发音障碍,帮助他们意识到自己的发音障碍,是否与听力受损也同样受到了影响。

我们联合中国联通发布的畅听王卡升级版,集成了腾讯会议旗下天籁实验室为听障用户打造的个性化语音增强辅听方案,让听障用户不仅听得清,而且看得清,该算法同时赋能畅听王卡的语音通话和实时字幕双场景,实现典型噪音场景之下单一字节言语识别率66%和实时字幕准确率提升5.5%-9.9%。经过天籁智能语音处理算法处理过的通话,不论是在听感还是在言语识别率上均有了大幅度的提升,可以很好地帮助听障用户在日常的沟通体验。

以上就是我的分享,腾讯天籁音频技术在助力无障碍,帮助听障用户上才迈出第一步,未来道路还很长,我们愿意把积累的更多的天籁音频技术在科技向善的牵引之下,更好地服务于广大用户,更好地改善他们的日常生活工作当中的听觉体验。

免责声明:凡本网注明 “来源:XXX(非中国房产新闻网)” 的作品,均转载自其它媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。

最新资讯

滚动播报

更多