详解Windows 11背后的技术创新( 三 )


在对端到端的 ASR 模型测试时 , 研究团队和产品团队就遇到了不同思维的相互碰撞 。 刘树杰介绍到 , 研究员们注重的是客观指标 , 会在大数据集上做客观指标的测试 , 而转化为产品后 , 产品经理更加注重的是使用者的主观感受 。 因此 , 当 Windows 11 在微软 Surface 以及各 PC 厂商的电脑上运行时 , ASR 模型也要做相应的优化和适配 。
开发过程中 , 微软亚洲研究院与 Azure 团队语音组和 Windows 产品部门紧密合作 , 反复沟通 , 通过不断迭代 , 使得 ASR 模型在多设备上的测试结果都达到了人类正常说话时的水平 。 尽管目前模型只支持美式英语的语音识别 , 但该模型具有跨语言通用性 , 后续只需利用不同语言的数据对模型展开训练 , 就能够实现跨语言的语音识别与操控 。
得益于深度学习的发展和充足的语料支持 , 自动语音识别 ASR 在大语种上取得了非常优异的性能 。 然而 , 世界上还有很多语言缺少语料数据 , 这些小语种、地方方言的使用人数较少 , 收集相应的语言数据会耗费大量的人力和资源 , 给相应 ASR 的实现造成了一定困难 。 为了解决这一问题 , 微软亚洲研究院提出了一种极低资源下语音识别的新方法 WavLM , 尤其是针对 ASR 的预训练模型 , 其各项指标一直在 SUPERB 评测数据集排行榜上位列第一(https://superbbenchmark.org/leaderboard) 。
详解Windows 11背后的技术创新
文章图片

一直以来 , 微软始终重视无障碍(Accessibility)方面的建设 , 目的是让产品、设备、服务和环境的设计更加方便地为残障人士所使用 。 下一步 , 微软亚洲研究院还将联合微软的产品团队将类似的技术扩展到更多的产品和应用场景中 , 打破沟通与使用障碍 , 予力每一人 。
焕然一新的桌面、简洁的设计、舒适的布局和灵活的体验 , 无一不彰显新一代操作系统 Windows 11 的高效与创新 。 无论是面向工作、学习、生活、游戏 , 还是艺术创作、编程开发 , Windows 11 都为用户提供了一个更适合的模式 。 面对混合办公新常态以及新的用户需求 , 微软亚洲研究院也会持续将最新的科研成果输出到微软的产品中 , 帮助更多用户提高生产力 , 激发创作灵感!
关注微软中国MSDN
敲黑板啦——你为“微软中国MSDN”点亮小星星了吗?
如果你是我们的真爱粉儿 , 也请帮忙多多点击【分享、点赞、在看】一键三连

特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。