招募引发的“风暴”:天猫精灵真的需要保护他们的方言!

2019-03-22 16:05 网络整理

尚俊网

聂再卿得知自己被任命为方言保护特设组数据库产品负责人,大吃一惊。这位科学家在微软亚洲研究所和阿里人工智能实验室工作,第一次感到“空白”。

他有很多问题要问,但实验室主任、实验室总经理陈丽娟只是兴奋地看着房间里的下属。”这是值得做的。我们必须这样做!”

这一切的原因是一个招聘广告。阿里正在寻找一个“语音模型”的智能扬声器天猫精灵。要求很简单:讲四川话,声音好,价格高达每小时700元。

招募引发的“风暴”:天猫精灵真的需要保护他们的方言!

这张招聘截图,从四川大学的微信息组开始,很快就传到了微博客上,在不到24小时的时间里,就两次冲向热门搜索列表。四川人开始挑衅周围的朋友们,激烈而激动,“发财的机会来了!”外面的网友们,带着“迷人的声音”,在天猫小精灵的官方微博下留言:江西话为什么不能有名字?

招募引发的“风暴”:天猫精灵真的需要保护他们的方言!

陈丽娟面前总结了各方的意见:方言语音优化投资巨大,到头来,只做四川方言,浅尝就成了“营销活动”;还是做得好如流水,真的做方言保护?商业公司做这样的投资值得吗?

很多意见都是有道理的。她以最快的速度作出决定,没有考虑到困难,她问自己,只要它值得“必须完成任务”,它是否值得做。一天后,一个专门的方言保护小组成立了。

在马来西亚,暨南大学教授Guo Xi对马来西亚的濒危汉语进行了实地调查,并被邀请担任该工作组的第一个顾问。此前,他曾建议使用科学技术手段来保护方言。他希望阿里可以使用1000万台智能语音终端作为方言采集工具,帮助保护方言。但他没想到会发生这种事。

“我的第一反应是,他们可能不知道有多困难,所以他们决定这么快。”Guo Xi说,调查,听和录音的方言发音需要专业的语言背景和培训。我问他们,你们团队有语言背景吗?你打算怎么办?有这么多数据,怎么筛选?令人惊讶的是,他没有得到答复,但他接受了邀请。”我想看看人工智能是否真的可行。这是语言学上的一场革命。”

学者们的怀疑并没有驱散陈丽娟的热情。”我们一直在做语音交流,但从来没有从文化的角度。它曾经只是我的一项技术。随着方言的加入,它可以成为一种生活。

除了陈丽娟,其他人也被“告知”方言保护工作组应该做什么。她起草了一份小组工作计划。一是建立以移动应用和智能扬声器为终端,语音交互为采样手段的全国动态方言数据信息网络,建立动态方言数据库。建立“语言保护关键绩效指标”,动态收集濒危语言。

此外,还有“逐步发展全国方言的语音识别和语音合成”、“开展学术合作,探索方言资源的保护性开发”等五项计划,每项计划都非常困难,每项计划可能需要几十年的时间。

这是一个雄心勃勃的计划。没有人确定,但他们都很自信。”先做好四川方言的准备,我们很快就会宣布更多的消息,”人工智能实验室客户体验总经理王万林说。没有回头箭。”如果我们想这样做,就必须坚持下去。”