操作系统

当前位置:澳门新莆京娱乐官网 > 操作系统 > 发布了自动为新闻播报生成字幕的澳门新莆京娱乐官网

发布了自动为新闻播报生成字幕的澳门新莆京娱乐官网

来源:http://www.drgigabytes.com 作者:澳门新莆京娱乐官网 时间:2019-12-28 22:25

△ 研究进展:CTS 及 BN 测验集单词错误率逐年下跌

澳门新莆京娱乐官网 1

为了打响地分辨复杂的语音内容、给音讯广播内容生成字幕,IBM 研商集体通过语音识别手艺,创立了豆蔻梢头套深度神经互联网。该深度神经互联网在重新组合了长长期回忆网络和纵深残差互联网(residual network,ResNet)的底子上,结合了协助的语言模型。个中,以 ResNet 为底工塑造的声学模型是饱含多达 25 个卷积层的深度卷积网路,使用 1,300 个钟头、各种差异的资源消息内容资料来练习生成字幕的 AI 模型。

△ 图源:IBM,下同

快讯广播(BN)的口音识别职责也很有挑衅性。语音识别系统必要管理二种讲话风格、背景噪音以致普及的新闻天地内容。一些情况下系统还得处理多样难题混合的语音质地—— 疑似现场访问、电视机节目标剪辑内容等。

(文/开源中中原人民共和国卡塔尔(قطر‎    

固然如此机器的话音识别正在日益附近人类水准,但最近的实验数据体现,人类的语音识别表现依然好得多。IBM 也意味,在此大器晚成领域仍然有一点都不小技能改良的空间。

近日,IBM 研究院发布了机动为消息播报生成字幕 AI 模型的切磋告诉。据两项测试实验的结果展现,该语音识别系统的错误率分别为 6.5% 和 5.9%,而人类识其他错误率分别为 3.6% 和 2.8%。

早在七年前,IBM 就已经创设了对话式电话语音领域(CTS)转录的品质记录。在此个小圈子,语音识别系统必要做的干活非常多。举例,系统必须管理失真、以致源于多个不等电话通道的私下发言,况且那些对话式语音还应该有七个对话者重叠、中断、重新开始或另行确认的状态。

澳门新莆京娱乐官网 2

本文由澳门新莆京娱乐官网发布于操作系统,转载请注明出处:发布了自动为新闻播报生成字幕的澳门新莆京娱乐官网

关键词: