贵德| 柏乡| 乌兰浩特| 南部| 哈密| 敦化| 武隆| 合作| 蒙山| 石渠| 瓯海| 凭祥| 关岭| 定州| 巴林右旗| 海南| 襄汾| 潞西| 闻喜| 定陶| 马尾| 黄平| 巴东| 谢家集| 鄂州| 左权| 曲阳| 丽江| 乡城| 泾川| 泗洪| 山西| 江夏| 南海镇| 阿克苏| 滑县| 托里| 普陀| 呈贡| 茌平| 突泉| 平原| 邯郸| 辽源| 得荣| 新建| 栾城| 巴林右旗| 电白| 靖宇| 屯留| 施甸| 新宾| 招远| 新田| 南安| 江津| 镇宁| 霍城| 澄城| 辽中| 德保| 马尾| 盘锦| 庆云| 碾子山| 微山| 吴江| 眉山| 林甸| 盈江| 石台| 寒亭| 衢江| 宝丰| 浚县| 陵水| 红岗| 政和| 阿拉善左旗| 兴山| 吐鲁番| 潮州| 临汾| 苏尼特右旗| 邵阳县| 赣县| 福山| 井研| 甘泉| 安国| 沙洋| 清镇| 汉阴| 龙泉| 大方| 龙江| 洮南| 安福| 宜宾市| 化州| 全椒| 海安| 乐业| 洛川| 永靖| 沿滩| 仪陇| 大方| 侯马| 阜新蒙古族自治县| 丹阳| 大丰| 驻马店| 勃利| 乌兰| 科尔沁左翼后旗| 天祝| 开原| 长岛| 庐江| 垣曲| 扶绥| 晋城| 陈仓| 德阳| 苏州| 澜沧| 安义| 夹江| 永定| 萝北| 北辰| 澄城| 衡山| 麻山| 瓦房店| 阿克苏| 代县| 保德| 乌鲁木齐| 卫辉| 广德| 石家庄| 零陵| 咸阳| 梓潼| 瑞昌| 古田| 恒山| 阿鲁科尔沁旗| 桂平| 宁县| 任丘| 镇远| 定结| 宁南| 崇明| 黄埔| 乐安| 眉县| 宜昌| 旬邑| 南城| 黄冈| 梧州| 高雄县| 遵化| 巴楚| 大方| 吉安县| 宜宾县| 玛多| 巴中| 五家渠| 五寨| 青浦| 东平| 博白| 巨野| 广昌| 磐石| 屯留| 道县| 赣榆| 开封市| 彭阳| 奇台| 剑川| 磁县| 维西| 定南| 阿瓦提| 铜鼓| 辽阳县| 奉贤| 横峰| 抚松| 井陉矿| 鸡东| 偃师| 澎湖| 邗江| 沂南| 大冶| 讷河| 全南| 亚东| 张家港| 简阳| 德保| 镇康| 盐都| 邛崃| 汕尾| 呼玛| 伊川| 贾汪| 布拖| 德昌| 建水| 贵南| 巩留| 株洲县| 上海| 龙口| 德钦| 惠山| 楚州| 石阡| 湘乡| 白朗| 梅里斯| 延寿| 滨州| 察哈尔右翼前旗| 遂溪| 商都| 灵川| 大洼| 武夷山| 荔浦| 桑植| 昂仁| 原阳| 淳化| 洪泽| 洛宁| 鄂州| 汪清| 澜沧| 乐清| 曲松| 庄浪| 濠江| 曲水| 抚松| 平陆| 禄劝| 花都| 大荔| 十堰| 元谋| 云林| 澳门博彩官网
首页| 滚动| 国内| 国际| 军事| 社会| 财经| 产经| 房产| 金融| 证券| 汽车| I T| 能源| 港澳| 台湾| 华人| 侨网| 经纬
English| 图片| 视频| 直播| 娱乐| 体育| 文化| 健康| 生活| 葡萄酒| 微视界| 演出| 专题| 理论| 新媒体| 供稿

百度发布即时翻译“神器” 突破自然语言处理重大难关

2018-12-17 15:14 来源:中国新闻网 参与互动 
标签:碾压 澳门百家乐 南城镇

  中新网10月24日电 人工智能领域,两种语言的“即时互译”是一项难以攻克的技术问题,其主要原因在于源语言和目标语言之间存在较大的词序和语序差异。近日,百度研发了具备预测能力和可控延迟的即时机器翻译系统,可实现两种语言之间的高质量、低延迟翻译。这是自然语言处理方面的重大技术突破,将对机器即时笔译和口译的发展起到极大地推动作用。

  机器同传利用语音识别技术自动识别演讲者的讲话内容,将语音转化为文字,然后调用机器翻译引擎,将文字翻译为目标语言,显示在大屏幕或者通过语音合成播放出来。相比人类译员,机器最大的优势是不会因为疲倦而导致译出率下降,能将所有“听到”的句子全部翻译出来,这使得机器的“译出率”可以达到100%,远高于人类译员的60%-70%。同时,在价格上也占有优势。

  在机器同传领域,百度联合语音技术、机器翻译技术,从语音识别、翻译质量、时延、融合领域知识等方面推出了“一揽子”解决方案。

  在语音识别方面,区别于传统的上下文相关建模技术,百度提出了上下文无关音素组合的中英文混合建模单元,包含1749个上下文无关中文音节和1868个上下文无关英文音节。该方法具有泛化性能好、对噪声鲁棒、中英文混合识别等特点。

  在翻译质量方面,提出了“语音容错”的对抗训练翻译模型,根据语音识别模型常犯的错误,在训练数据中有针对性的加入噪声数据,使得模型在接受到错误的语音识别结果时,也能够在译文中纠正过来。比如,语音识别系统将“大堂”错误的识别为“大唐”,这一对噪声词将被自动收录到训练数据中,并将源语言句子“我们在酒店大堂见面吧”替换为“我们在酒店大唐见面吧”,而保持目标语言翻译不变“Let's meet at the lobby of the hotel”,同时将这两个中文句子用于训练,进而获得具有更强的容错能力模型。

  为了降低时延提升翻译质量,人类译员通常对演讲内容进行合理预测,百度开发人员从人类译员身上获得启示,研发了“wait-k words”模型,可以根据历史信息,直接预测翻译中目标语言词汇。该模型在翻译质量和翻译延迟之间做出了很好的平衡,用户可通过根据实际需求设定延迟时间(例如延迟1(k=1)词或延迟5(k=5)词)。比如,法语和西班牙语这种较为接近的语言,延迟可设置在比较低的水平;但是,对于英语和汉语这种差异较大的语言,以及英语和德语这种词序不同的语言,延迟应当设置为较高水平,以便于更好的应对差异。

  在同声传译时,经常会遇到不同领域的专业知识,这就要求同传人员在短时间内吸收大量相关领域的内容,这对他们也是极大地挑战。基于此,百度模仿人类同传的准备过程,提出了快速融合领域知识策略。该策略依托百度海量的互联网大数据,训练得到的具有通用翻译能力的模型;当它接到某一个领域的同传翻译任务时,系统会收集该领域数据并在通用模型的基础上进行增强训练,得到相应领域增的强模型;最后对该领域术语库进行强制解码,使专业术语翻译得准确可靠,且提升翻译效率。

  作为对外开放和商业国际化的需求之一,同声传译被广泛应用于政府间的峰会、多边谈判和其他商业场合,但是同传人员稀缺也成为了当前的棘手问题。为了解决全球范围内同传译员人数少、费用高等难题,越来越多开发者专注于机器同传的研发,百度也希望通过研发高质量机器同传技术和系统解决即时翻译难题。

  虽然机器同传有了新的突破,但它与经验丰富的同传人员相比,依然存在一定差距。百度翻译技术负责人表示,同传的目的并不在于取代人类译员,而是为了降低同传成本,让同传的应用范围更加广泛,也希望世界各地的人在AI的助力下早日实现“无障碍”交流。

【编辑:陈海峰】
本网站所刊载信息,不代表中新社和中新网观点。 刊用本网站稿件,务经书面授权。
未经授权禁止转载、摘编、复制及建立镜像,违者将依法追究法律责任。
[京ICP证040655号] [京公网安备:110102003042-1] [京ICP备05004340号-1] 总机:86-10-87826688

Copyright ©1999- 2018 chinanews.com. All Rights Reserved

永福镇 巴润扎根呼都 平湖村 白家湾乡 毛道乡
台南市 吕布屯 周岗乡 乐塘区 鱼龙乡
葡京娱乐网 葡京网址 威尼斯人网上真人赌场 新濠天地网上赌场 美高梅娱乐官方
澳门威尼斯人官网 澳门葡京平台 澳门官方赌场 澳门最大的赌场 澳门葡京娱乐官网
威尼斯人网址 澳门大发888赌场 mg冰上曲棍球网站 澳门银河场网址 信誉赌场
澳门威尼斯人注册 澳门威尼斯人平台 澳门巴黎人平台 澳门威尼斯人备用网址 赌场游戏