首页 时政 国际 港澳 台湾 财经 法治 社会 纪检 体育 科技 军事 文娱 图片 视频 论坛 博客 微博
新华网 > > 正文

硅谷“编形金刚”:不仅会中文,还是翻译大师

2015年05月05日 16:37:53 来源: 《中国传媒科技》杂志

    机器人记者在中国——访硅新社机器人记者创始团队

    硅新社是硅谷华人成立的一家侧重于科技、财经新闻的中文媒体,顾问团队包括新华社美国资深记者、《中国日报》资深记者和斯坦福大学访问学者。硅新社的内容以短新闻、图片新闻为主,适合移动互联网时代用户的阅读特点。机器人新闻是硅新社的重点项目。

    “欢迎小编机器人@编形金刚 加入我们!希望你能写出更好更有价值的文章!”3月10日,海外媒体硅谷新闻社的新浪官方微博(@硅新社)上发布了这样一条信息。随后,一条条由“编形金刚”自动编写的“美国融资快讯”被发出。这预示着,硅谷机器人记者“编形金刚“正式登陆中国。

    机器人记者的出现,是时下传媒界的热点话题。《中国传媒科技》杂志3月刊专门就此予以专题报道,在业学两界引发了较大反响。本期,记者专访“编形金刚”的创始团队,就硅谷机器人记者的能量全面解读。

    据介绍,编形金刚由硅新社与硅谷几位技术大牛合作开发,知识产权归硅新社所有。硅新社已先后在新浪微博、腾讯微信推出“美国融资快讯”,以及在Twitter上推出英文版融资快讯Funding News,内容均由编形金刚(英文名:NewsWribot)独立编写。

    目前,硅新社已经拿到中国著名投资机构的天使投资,正在为A轮投资做准备。而“美国融资快讯”还只是用来向投资人做展示的雏形,关于编形金刚的潜能和成长计划,硅新社团队早有设计,更多极富想象力的产品和应用会在资金和人员到位后,结合需求逐步开发。

    编形金刚的特技:懂中文,会翻译

    “机器人记者一般会用到的技术涉及数据挖掘、人工智能、机器学习,而编形金刚还运用了机器翻译技术。”硅新社团队里有多名中国成员,包括编形金刚的创始人在内。会写中文、懂中英文翻译是编形金刚的特殊技能,这使它目前在美国乃至全世界的“机器人记者圈”都与众不同。

    “因为我们的数据源是美国的英文数据,编形金刚需要把它翻译成中文,所以在微博上发布的信息,有的时候语句可能不太通顺。我们的技术会逐渐让翻译更加流畅、准确。另外,因为微博有140字的限制,编形金刚除了翻译,还需要掌握话题归纳和提炼的技艺,比如从一篇一千字的文章里找出20个字……”

    “美国对机器人记者的开发有比较长的时间,这些机器人做的都是英文报道,英文里面有一些单数、复数、语法的问题,所以在生成新闻时也有相应的技术在里面。我们在Twitter上也发布英文信息,不用翻译,就比较简单。”

    编形金刚的语言优势能够创造怎样的价值?硅新社团队举例说:“中国有很多科技媒体,他们的消息很多是来自外媒,然后翻译成稿。所以外媒上有的内容,他们才能翻译,没有的内容就翻译不到。而我们的信息不是来自外媒,而是直接从美国证监会(SEC)的数据库提取,这种做法在美国来说也是新的。”

    可见,面对中国市场,编形金刚的潜能和商业价值有非常大的空间。

    编形金刚的潜能:文图音视四项全能,舆情分析的利器

    除了从文字数据中挖掘信息,机器人挖掘的数据源类型可以更多样,包括视频、图片、声音、甚至地理位置等等。据介绍,硅新社团队已和乐视开展合作,正在与乐视体育讨论版权许可,获得授权后,机器人就可以把乐视体育网站上的视频内容,做成短文的形式发布,免去了人工整理写作的麻烦。再比如专访,“假设我们在优酷、土豆上看到一些李开复的采访视频,可以用机器人把问题及回答抓取过来,进行浓缩剪辑,就能快递地自动生成一篇文字专访稿。”

    而除了“写稿”,图像、声音、视频采集编辑也是机器人记者即将练就的本领。“比如在某场大会上,我们在会场中的不同位置安装近景、远景等五个镜头,机器人可以根据声音来源或人脸识别等自动拍照、录像,这样至少可以生成图片新闻。再比如,在一场足球比赛中,很多体育记者会躲在球门后面等着抓拍射门镜头,这也可以用机器人来代替,或许会比人更加精准地抓拍到精彩画面。另外机器人的应用扩展到声音方面也是有可能的,以后它会越来越智能化。”

    除此之外,在深度的数据挖掘、多数据源的信息融合方面,机器人将发挥很大的作用。“比如图片的分析。我们经常会在报纸上看到某某公众人物的照片,得知他去了哪些地方、会见了谁等信息。而从信息挖掘的角度可以挖掘到更深层次的信息,比如这位公众人物在最近六个月中,和谁走得比较近,或者谁消失了,为什么消失……类似这种非浅层信息,需要从很多的数据源中深度挖掘,这件事由人来做就比较累,而机器人操作起来就比较轻松。因为人脸识别,特别是对照片的识别,相对来说是比较容易的,但目前还没有实际应用案例。”

    在舆情分析上,机器人也可成为一把好手。硅新社团队告诉记者,美国中央情报局CIA旗下风险投资公司 I-Q-Tel投资了芝加哥的人工智能数据公司Narrative Science,在本·拉登被海豹突击队击毙之后,CIA就通过机器人数据挖掘与分析检测当地民众在网上的舆论及情绪,以预测中东某国暴乱的可能性。“在中国也可以用机器人来做舆情及行业情报分析,比如在一些特定人员涉嫌犯罪被抓之前,网络上已经开始传播相关信息,机器人就可以抓取、挖掘这些信息加以分析。”

    机器人记者“编形金刚”在中国的“适应力”相当强,完全可以实现对敏感信息、违反法律法规的内容进行筛选和分析。比如目前新浪微博就有这一技术的应用,自动进行敏感词检索和屏蔽。

    硅新社团队还介绍了一个更有意思的应用,即对历史信息的挖掘。比如,机器人可以从图片数据库里面,找到在天安门广场上同一个地点、不同人、不同时期拍摄的100张照片,看在过去的历史长河中,这个场景是怎么发生变化的,会像看电影一样。

   1 2 下一页  

[责任编辑: 高海英 ]
新华炫闻客户端下载
010020111200000000000000011199861342119231