新华网 > > 正文

对话百度王海峰:机器能翻译,还需要学外语吗?

2016年01月16日 09:46:47 来源: 新华社

  作者:王健

  北五环外的北京郊区,刚建成的百度科技园成了这里的新地标。五座办公大楼,由天桥彼此连接形成环状,阳光照射下的蓝色玻璃幕墙,颇具几分“未来感”。

  作为中国互联网企业三巨头之一,百度公司近年来积极布局人工智能领域。2016年初,中国举办国家科学技术奖励大会,这家公司的机器翻译项目获得了国家科技进步二等奖,中国最高级别的科技奖项花落互联网企业实属罕见。

  “意料之中。”提起获奖,该项目的负责人王海峰显得颇为淡定。

  ↑王海峰获奖照片。 百度提供图片

  “百度翻译在科研水平和应用价值两方面都有很大优势,在国际上处于领先水平,符合国家科技进步奖的标准。”他说。

  2010年,刚刚加入百度的王海峰着手研发机器翻译。“当时,我预料这个领域的研究一定会有重大突破。一是因为社会对于机器翻译的需求日益旺盛,更重要的是,百度可以为这项研究提供互联网大数据和大计算平台的强大支持,”他说,“项目从起步到上线只用了一年多时间,现在百度翻译已经可以支持27种语言之间的翻译,在全球拥有5亿用户,每天响应约1亿次的翻译需求。”

  耳听为虚,眼见为实。王海峰随手就拿起自己的手机,“来,我演示给你看。”

  他一边说一边打开百度翻译APP,输入了“喜大普奔”四个字,百度翻译APP一句话的英文译文,形象、准确地解释了这个网络词汇所表达的意思。

  ↑ 百度翻译APP手机界面

  王海峰又对着手机录入语音“请问附近有餐厅吗?”,然后让百度翻译APP的语音翻译功能分别翻译成英语、韩语、以及广东话,也都翻译得挺不错。

  “还可以自动识别图片来翻译。”他一边说,一边用手机拍了一张写着中文的纸,然后选取其中的一句话,手机屏幕上马上就出现了这句话的翻译,“点击这里,还可以用语音将翻译结果读出来。”

  “我自己已经是一个机器翻译的直接受益者,”王海峰说,机器翻译技术对于生活的改变,已经在逐步深入,“比如前段时间我去葡萄牙出差,我一句葡萄牙语也不会,但是通过手机上的百度翻译,旅途中基本没有遇到过语言障碍。”

  在研发过程中,王海峰带领团队不断分析用户的需求。“我们通过对访问量的监测,发现周末访问量会上涨,周日尤其多,我们分析可能是很多中小学生在写作业时会用到我们的产品,”他说,“另外,电子商务领域的应用也很多,比如很多网店通过我们的翻译软件把他们的产品简介翻译成外语,这会帮他们节省一大笔翻译的开支。”

  ↑ 王海峰在自己的办公室里。 百度提供图片

  根据王海峰和团队的设想,百度翻译还会推出更多中国方言和少数民族语言,来满足更多用户的需求。

  “开发语言对于我们来说不是难事,我们平均花11天就能上线一种新语言。”他说。

  这么高的效率,岂不是需要建立一个庞大的多语种技术人才团队?

  “其实我们的核心翻译引擎工程师只有不到十个人,研发过程中并不依赖外语能力,我们开发的大部分语言我们自己一点都不懂。”王海峰说,“这就是机器翻译的魅力:对于需要翻译的语言,我们只需要自动挖掘网上存在的双语数据,然后机器从这些数据中自动进行学习,就能得到用于自动翻译的模型了。而且,我们的翻译系统可以通过学习用户的反馈数据,不断提升翻译能力。”

  机器,怎么会有这样的能力?

  王海峰介绍说,百度研发的深度学习与多种主流翻译模型相融合的在线翻译系统以及基于“枢轴语言”的技术,处于业内领先水平,在国际上获得了广泛认可。基于深度学习的在线翻译系统借助计算机模拟的海量神经元来“理解语言,生成译文”。基于枢轴语言的技术,则使得缺乏互联网数据的小语种之间通过英文、中文等数据丰富的大语种作为“枢轴”来进行翻译,从而使得小语种的翻译成为可能。

  成功背后,是多年的积累和失败的尝试。王海峰回忆:“早期,我们用互联网上大量双语句对对系统进行训练,发现结果不尽如人意。 比如一句简单的英文‘how old are you’,最后被翻译成了’怎么老是你’,原来互联网上错误的翻译的信息规模比我们想象的要大,于是我们就开始研究怎样对网上数据进行过滤和筛选。”

  谈机器翻译,当然不能不提到谷歌翻译。与谷歌翻译相比,百度翻译有何独特性?

  “百度翻译的优势在于一是技术上融合了深度学习模型和多种主流翻译模型,并与搜索技术相结合,在口语、诗词、文言文翻译、中文相关的翻译质量等方面有明显优势。同时,翻译的时效性也非常好,我们的翻译系统对时下的网络语言的翻译也很精通。”王海峰回答。

  ↑ 百度推出的多语种翻译机器人“小度”与海外嘉宾互动。

  说起来,王海峰与机器翻译结缘,有20多年了。除了百度技术副总裁的身份,他还曾有另一个头衔——百度基础技术首席科学家。1993年,还是哈尔滨工业大学计算机系大四学生的王海峰因为“感觉很神奇”而选择了智能翻译作为自己毕业设计的课题,从此就进入了这个领域。

  有没有可能,将来有一天,机器翻译会取代人工翻译?

  “应该不会,”王海峰肯定地说,“它不仅不会威胁到翻译人员的生存,反而会给他们带来工作上的便利,据我所知,很多翻译人员的手机里也安装了我们的产品。机器翻译和人工翻译各有优势,一个机器翻译系统可以同时掌握几十种语言的翻译能力,也可以擅长多个领域的翻译,这是翻译人员们所不具备的。但同时,优秀的翻译人员可以将语言的细微之处翻译出精妙的美感来,这也是机器翻译系统无能为力的。所以说二者互补,彼此不能相互替代。”

  尽管获了奖,但王海峰没有放慢继续探索和突破的脚步,“曾经的我们与国外先进水平有差距,经过这些年的 不懈努力,赶上了这些差距。如今我们可以自信的说我们已经达到世界领先水平,但这也意味着我们要承担起引领创新、引领突破的责任。”

  也正因如此,对于技术的不断追求,成为了百度科技园内的一种文化现象。百度翻译研发团队的工程师何中军告诉记者,这里的技术人员,会像带手机一样随身携带笔记本电脑,“有时连上厕所都会带着”。

  “我们搞研发的,一刻离了电脑就会不踏实,因为随时都有可能冒出一个亟需解决的技术难题。”他说。

  在与记者交谈的过程中,王海峰偶尔将目光投向窗外,那是一片还在施工中的工地,楼宇骨架已拔地而起,但高高耸立的脚手架与隐隐传来的轰鸣声时时提醒着我们:一切都还在继续……

  (图中未标明图片均来自网络。) (作者:王健)

【纠错】 [责任编辑: 薛涛 ]
新华炫闻客户端下载

相关稿件

010020020110000000000000011100001286346821