每日经济新闻
首页公司

每经网首页 > 首页公司 > 正文

全球超4亿人听力受损 “听不清、听不真”困扰下,AI能做什么?

每日经济新闻 2021-03-12 14:39:02

◎越来越多科技公司也试图用AI技术来帮助听障者,打通听障人群与普通人的最后一公里

◎腾讯天籁实验室的AI降噪技术,应用于人工耳蜗,将语音清晰度和可懂度提升了40%

◎阿里达摩院将AI语音技术置入字幕机顶盒,实时同屏显示画面与辅助性字幕

每经记者 刘玲    每经编辑 文多    

“对于听障者来说,人生这张试卷,不管怎么填,都交不出满分答卷。”

2019年12月17日,千秋(化名)在豆瓣的文章中写下了这句话。她是一个听障者,在七岁那年的一场高烧后失去了听力。失去听力的她,犹如从地面坠入了“深海”。

千秋告诉《每日经济新闻》记者,七岁之前,她以很好的成绩进入了市里最好的小学;而七岁之后,她成为了班里的隐形人。本可以在人生试卷上取得不错成绩的她,却因为听力这个无法逾越的障碍,让“可能”变成了“奢望”。

像千秋这样的听力残疾患者,全球约有四五亿人,超过全世界人口的5%。随着科技的发展,以及语音学、电生理学、耳显微外科学等学科的发展,助听器和人工耳蜗逐渐广泛应用于临床,成为了听障者从“深海”上岸的救生圈。

不过,听障者现阶段的助听设备能力有限。例如在机场、商场等比较嘈杂的公共环境中,人工耳蜗依然面临着“听不清”的困扰;植入人工耳蜗的听障者仍然无法听到音乐……他们无法获得像普通人一样的听觉感受。

在AI技术迅猛发展的当下,越来越多科技公司也试图用AI技术来帮助听障者,打通听障人群与普通人的最后一公里。

例如腾讯天籁实验室的AI降噪技术,应用于人工耳蜗,将语音清晰度和可懂度提升了40%;阿里达摩院将AI语音技术置入字幕机顶盒,实时同屏显示画面与辅助性字幕;小米联合科大讯飞推出“小米闻声”的听力辅助工具等等。

图片来源:摄图网(创意图,图中人物与新闻所述内容无关)

“深海”之下的听障者

据世界卫生组织官网最新数据,全球大约有4.66亿人患有残疾性听力损失,其中儿童约为3400万。4.66亿人是什么概念?这个数字比美国人口总数还多,几乎超过全世界人口的5%。并且,预计到2050年残疾性听力损失人数将达到9亿。

而中国,是世界上听力残疾人数最多的国家。据第二次全国残疾人抽样调查结果显示,我国有听力残疾患者2780万人,每年新增听力残疾人逾30万;患听力障碍人士共达3480万人,居目前我国五大类的残疾人群之首。

在新生儿方面,据《中国出生缺陷防治报告(2012)》数据显示,中国0~6岁的儿童有超过80万人耳聋,每年约有3.5万先天性聋儿出生,位居我国出生缺陷前列。先天失聪,意味着学会说话都很难。

在千秋看来,自己还是有些幸运的。她戏谑道:“所幸在失聪前,我学了一口塑料川普,不至于陷入没话可说的境地。”

但是,能说话并不代表能沟通。大部分后天失聪患者会因为听力问题影响到语言的学习能力,分不清吐字发音的区别,使得口语表达不良,久而久之就形成了语言障碍。

英国临床生理学家协会注册听力学家、英国人工耳蜗协会会员李国平向《每日经济新闻》记者表示,听力有障碍的孩子,往往有多重的困难症,包括孤独症、学习困难症等,这有一部分是基因造成,另外一部分是未明原因,可能是环境,也可能是其他原因,还在研究。

不仅如此,听障者在逐渐失去语言能力的同时,似乎也失去了对生活选择的权利。小学毕业后,千秋被送进了特殊教育学校,那家特殊教育学校的教学水平不但跟主流学校相差甚大,给予的学习方向也很少。听障者要么学美术,大学考定点招生的学校;要么参加学校的舞蹈团,等着哪一天被北京残疾人舞蹈团选上。

千秋说,毕业后发现每场残疾人招聘会出现的工作大多是技工与服务员;找工作因为听力问题屡次被刷……千秋的这些遭遇,只是几千万听障人群的缩影。

“深海”之下的他们,很难触及普通人的工作和生活。

图片来源:腾讯提供

人工耳蜗“救生圈”

听障人士为什么听不见声音呢?这是因为耳朵要听到声音,需要借助内耳耳蜗中的毛细胞进行声——电转化。在我们耳蜗内,有3千多个内毛细胞,以及1万多个外毛细胞,它们在整个听觉系统中发挥着重要作用。没有它们,声音就无法顺利传递,我们也就无法听到声音。

虽然听毛细胞数量众多,但是它们却十分脆弱且珍贵,耳蜗内毛细胞属于不可再生的永久性细胞。当内耳毛细胞越来越少,听力就会越来越差,直至完全听不到。毛细胞无法再生,也就意味着听力损失也是不可逆的。

随着科学技术的发展,人工耳蜗和助听器这两种听力辅助设备逐渐广泛应用于临床。其中,助听器在听力大约损失60分贝左右效果最好;听力损失在90分贝以上感音性耳聋一般是用人工耳蜗植入,但是费用较高。

人工耳蜗辅助听力的原理,是用电子耳蜗代替内耳的毛细胞,起到声——电转化的作用。通过体外的言语处理器收集声音,体内的处理器进行编码处理,转化为电信号,再通过电极刺激听神经,继续后续的声音处理过程。

18岁那年(2011年),千秋的父母带她去做了人工耳蜗植入手术,花费了二十多万元。无声的状态下生活了11年的千秋,在人工耳蜗开机的瞬间,听见了外界涌入的各种声音。听得见了,但却听不懂了。因为听力问题影响到了她的语言学习能力,还需要进一步做康复训练。

人工耳蜗由于技术门槛高,研发周期长,长期以来被澳大利亚Cochlear公司、美国Advanced Bionics公司和奥地利MED-EL公司占据着国内超过90%的市场份额。千秋当时植入的人工耳蜗,便是奥地利MED-EL公司的产品。

彼时的中国,人工耳蜗行业才刚起步不久。刚好是在2011年,目前国内最大的人工耳蜗厂商之一——诺尔康电子神经科技有限公司(以下简称诺尔康),刚获得国家颁发的言语处理器注册证、植入体注册证书,才得以打破国外三巨头垄断的局面。目前,诺尔康与丹麦Oticon集团合计占据全球人工耳蜗5%的市场份额。

“现在人工耳蜗技术和助听器技术基本上已经把听障的范围极大缩小……人工耳蜗技术把从出生就在无声世界里的孩子们都抢救了过来。在听力方面,植入了人工耳蜗的孩子,很多和正常人差不多。”中国听力语言康复研究中心专家、《中国听力语言康复科学杂志》总编于丽玫告诉记者。

不过,于丽玫表示,虽然借助人工耳蜗和助听器的帮助,听障人士的交流不存在问题,但是和正常人还存在着“最后一公里”的差距。

于丽玫解释称,比如在嘈杂的公共环境中,人工耳蜗还面临着“听不清”的困扰;还有就是,人工耳蜗和助听器提供的是言语频率范围内的声音增进,并不是所有的频率都能涉及。听障者只能听到语言频率范围的声音,还不能够欣赏音乐,不能辨别高低音等等。

诺尔康总经理李楚曾给记者打过一个比方:目前全球人工耳蜗中电极数最多的有24个,耳蜗是蜗牛的形状,上面是低频,下面是高频,摊开就是一个钢琴键盘,正常人有3千个键盘,而人工耳蜗只有有24个,所以人工耳蜗“弹”出来的声音和正常耳朵听到的声音有很大的区别。

图片来源:摄图网

“AI能为他们做点什么?”

2019年初,任职杜比工程团队高级总监9年的商世东,加入了腾讯担任多媒体实验室音频技术中心高级总监,而后担任天籁实验室负责人。腾讯天籁实验室针对语音在嘈杂环境中的情况,把经典信号处理和机器学习技术融合在一起,加上声学场景分析技术,打造了一套降噪解决方案,并把技术应用在包括腾讯会议等多个产品里。

商世东告诉《每日经济新闻》记者,因为腾讯天籁实验室主要从事声音方面的研究,所以在做声音相关技术开发的时候,实验室会和腾讯内部多个无障碍项目做一些沟通和合作。“在这个过程中,我们接触到了听力障碍的人群,感受到了他们对声音的渴望。”

商世东和团队讨论了很多次,“我们应该为他们做点什么?”“AI能为他们做点什么?”

针对人工耳蜗的用户痛点,商世东和团队展开了深入调研,他们发现,“当电脑、手机可以达到主频是G赫兹的多核架构的时候,人工耳蜗由于尺寸限制,却往往只有几十兆赫兹的处理能力。在这样的局限条件下,高复杂度的噪声处理成为了业界的一个难点”。

于是,通过与诺尔康一起讨论在当前人工耳蜗软硬件条件局限下的解决方案,并经过长达半年的技术验证后,商世东和团队从架构上最终确定了“手机伴侣+人工耳蜗”的联合解决方案。

因为AI降噪的计算功耗要求比较高,还包括一些健康的约束,比如说佩戴的这些设备如果功耗过高的话,可能会影响健康。“所以功耗不能特别大,一些高复杂的计算模块是以手机伴侣APP的形式呈现。”腾讯天籁实验室专家肖玮向记者解释道。

诺尔康实验检测数据显示,天籁技术与人工耳蜗结合后,人工耳蜗的语音清晰度和可懂度提升了40%,语音平均识别率达到96.28%。经过AI降噪技术提升后的信号,传递到人工耳蜗后,极大改善了听障人士的听觉体验,让听障人士在“听得见”的基础上“听得清、听得真”。

实际上,除了腾讯天籁实验室,许多知名的互联网公司也在探索AI帮助听障人士的应用场景。

例如,阿里巴巴达摩院将AI语音技术置入字幕机顶盒,连接有线电视、电脑或手机后,便可以实时同屏显示画面与辅助性字幕,让听障群体得以无障碍收看春晚、新闻等直播节目。2020年春节前夕,字幕机顶盒入驻了全国上百个聋人家庭及社区。

微软推出的Microsoft Translator也是如此,能够将老师的口语转化为实时字幕,还能将翻译的文字结果保存在手机中,帮助学生们轻松学习;小米和“讯飞听见”合作打造的一款“小米闻声”的听力辅助工具,能够在相机录制有声视频自动生成字幕;腾讯优图实验室发布的“优图AI手语翻译机”,能快速把手语转换为文字……

腾讯天籁实验室专家肖玮向《每日经济新闻》记者解释到,言语的频率范围大概是300Hz~3.4kHz,人类能感受声音范围约为20Hz~20kHz,人工耳蜗可以响应的范围顶多到8kHz。因为受硬件的限制,太大的频率范围处理的确有很大的难度。

“我们的想法是一步一步来,还是想先把言语这部分的感知做得更好一点,让听障者听得更清。如果时机合适,而我们积累的一些音乐处理的技术对听障者有帮助的话,我们愿意与听力学界的朋友一起去突破这些难题。”肖玮补充道。

图片来源:摄图网

如何预防听力损失?

世卫组织数据显示,全球将近50%的12至35岁人群,即大约11亿年轻人由于长时间或过度娱乐噪声暴露,正面临着听力受损的风险。在老年人群中,一般来说,60岁以上的老人,40%~50%会有一定程度的听力下降;到了70岁,占比会增加10%;到100岁左右,至少90%的人都会出现听力下降。

“比如说在地铁上听耳机,一般地铁站的声音是80分贝左右,我们耳机的声音需要在80分贝的基础上上调20分贝才能听到音乐。这样的情况下,音乐就远远超出噪声的标准,声音一般达到90分贝以上就会使听力受损。”于丽玫告诉《每日经济新闻》记者。

前文中曾提到,声音需要借助内耳耳蜗中的听毛细胞进行声——电转化。于丽玫表示,人的听毛细胞只有1万多个,噪声刺激损伤了毛细胞之后,它就不再生了;毛细胞数量越来越少,听力就会越来越差。“就像我们日常生活当中看到的电灯一样,灯里面有很多灯线,灯线都坏掉的时候,灯就灭了。”

于丽玫强调,听力的损伤是悄无声息的。在听力损失刚发生时,人们在生活和社交方面只会受到轻微影响,很多人通常对自己的听力变化并不在意,大多认为是注意力不集中或上火导致的,很多人也有“人老了听力就应该不好”的想法。

实际上,这个时候是听力干预的最佳时机,但此阶段往往被99%的人忽视,进而导致一系列言语识别率下降等问题。

“一个人从有听力损失到听不见大概是十年的时间,有点像牙齿,刚开始出现问题的时候并没有在意,只有牙疼得满地打滚的时候才去见医生。听力也是,许多患者到听不见很多年了才去见医生。”李国平补充道。

记者了解到,长期从事听觉、听力学科研、教学以及临床工作的李国平,在2016年创立了英国2Hearing公司,希望能够以互联网的方式解决听力咨询和康复环节,目前公司研发了世界首例通过电话为汉语普通话使用者检测听力的筛查系统。

依托2Hearing的听力筛查系统,腾讯天籁联合中国听力语言康复研究中心、中国听力医学发展基金会等在2021年3月3日的全球爱耳日上,推出听力损失自测小工具——线上数字测听测试,人们足不出户即可初步判断自己的听力损失程度。

《每日经济新闻》记者在体验了“线上数字测听测试”小程序后了解到,该自测小工具是让测试者在不同的噪声水平上,感知自己的听力状态,每题答对后就会升级噪声,最后将测试结果分成ABC三个档位,来衡量不同年龄段的听力水平。

图片来源:手机截图

但记者也发现,在测试结果报告的下方写着,“数字测听是一种高效的,自我进行听力筛查的工具,不能代替临床诊断结论”。对此,肖玮向记者坦言,线上数字测听是通过这些数据的分析,唤醒大家对听力健康的关注。如果想进一步了解自己的听损情况,应该去专业医院做进一步检查。

写在最后:

今年是2021年,距离千秋植入人工耳蜗已经过去了近十年。她说,大学四年,工作五年多,如果拿友谊来说,跟人工耳蜗也差不多算是生死之交了。

人工耳蜗让千秋得以正常地听和说,大学毕业后,她进入一家公司做新媒体运营,经过一路打怪升级,一度晋升到了新媒体主编的位置。

2019年,她决定辞职,并开启了公益领域创业之路,先后成立了一家文化传媒公司和一家为残疾人社会工作服务的非盈利机构。目前,千秋正在做一个倡导聋健互融的社会创新公益项目——KNOW DEAF,她希望通过“科普倡导”、“榜样带动”、“成长课程”、“可持续性陪伴”等六个路径,让听障人士的未来“无限大”。

虽然科技的进步,在不断打通听障人群与健全人群的“最后一公里”,同时也提供了更多残障人士可以胜任的工作。但在她看来,听障群体的困境,不只是听力的障碍,还有内心的障碍。

千秋曾说:“对于听障者来说,人生这张试卷,不管怎么填,都交不出满分答卷。”但是,她希望通过这些公益项目,让更多听障的孩子,找到自己的光芒。

她说,“世界没有童话,但我们可以是自己的彼得潘”。

如需转载请与《每日经济新闻》报社联系。
未经《每日经济新闻》报社授权,严禁转载或镜像,违者必究。

读者热线:4008890008

特别提醒:如果我们使用了您的图片,请作者与本站联系索取稿酬。如您不希望作品出现在本站,可联系我们要求撤下您的作品。

听障者 人工智能 Ai 腾讯 人工耳蜗 诺尔康

欢迎关注每日经济新闻APP

每经经济新闻官方APP

0

0