新华网 > > 正文

虚拟现实交互技术应用来袭 "黑科技"就怕不萌不酷

2016年07月25日 15:12:08 来源: 北京晨报

  最近大热的口袋妖怪(Pokemon Go)游戏使用了增强现实技术。

  1972年,当一个孤独的程序员对着电脑敲下第一句“hello world”开始,人类与人工智能的沟通与对话,便从未停止。如今,机器不仅可以听懂我们的话语,能够回答“刘德华的老婆的爸爸是谁”这样典型的逻辑推理问题,还能实时地把文字翻译成语言,并且能够根据上下文语义挑选正确的同音字,实现自动纠错。

  机器谱写出的音乐同样性感,最奇妙的是,它还能理解画作的感情,蓝色代表忧郁,红色代表热情,画作中的蒙娜丽莎看似微笑,却有些伤感,搭配的音乐或许也会有淡淡的忧伤。

  能搞定“熊孩子”的儿童陪伴机器人不仅要有耐心,还得有超高智商,这样才能够让家人在户外疯狂狩猎“宠物小精灵”时,告诉它什么才是真正的“黑科技”。

  一个更加性感的时代已经来临,“黑科技”,欢迎你来到地球。

  故事1

  口袋妖怪萌宠大于智能

  AR和LBS证明了自己的应用价值

  最近一段时间,一款名为《口袋妖怪GO》(Pokemon Go)的游戏让全球玩家陷入了一种疯狂。游戏中的探索真实世界和抓宠的功能让纽约时代广场前聚集大量玩家。因为使用了目前最流行的AR(增强现实)和LBS(地理定位)技术,《口袋妖怪GO》也被冠以“黑科技”游戏。

  《口袋妖怪GO》的黑科技到底有多酷炫?或许,会卖萌才是最关键的因素。西山居世游运营总监赵强对北京晨报记者表示,Pokemon Go所使用的AR+LBS技术已经出现了几十年,这款游戏之所以火爆,并非采用了很多高深莫测的“黑科技”,最主要的原因,还是其开发公司任天堂20年来对口袋妖怪这一IP的持续培养,让它在全世界范围内具有广泛的用户基础。

  当然,AR和LBS技术也的确为这一游戏IP起到锦上添花的作用。赵强表示,AR技术被称为增强现实,是一种可以实时地计算摄影机影像的位置及角度,并将虚拟图像、视频和3D模型与现实世界叠加在一起进行交互的计算机技术,“这种技术早在1990年就被提出,1998年开始由Sportvision公司用于实况橄榄球直播。”

  而LBS和游戏的结合更加不是新鲜事,自上世纪90年代该技术出现后,2000年的《寻宝游戏》可以让玩家通过真实GPS坐标寻找秘密宝藏。2004年,《I Love Bees》通过将玩家派送到各个GPS坐标的玩法同样采用了该技术。

  “《Pokemon Go》让AR与LBS技术突然火起来,不是因为它是什么黑科技,而是此前受到的关注太少。现在它们终于证明了自己的应用价值。”(记者 韩元佳)

  故事2

  360机器人陪伴孩子

  大白离我们只有899元的距离

  “大白”正在走进我们的生活,它离我们只有899元的距离。

  上周,360儿童机器人巴迪正式推出。在人工智能“黑科技”的快速推进下,曾经科幻电影里的机器人场景正飞入寻常百姓家。

  别看它外表呆萌可爱,这是个会思考的儿童陪伴机器人。360智能家庭总裁邓邱伟介绍了里面的黑科技:采用语音控制技术,精准的语义分析让其能够快速准确理解孩子的意图;独有的K故事功能,即使父母不在身边,孩子也能通过巴迪机器人听到爸爸妈妈讲的故事。此外,父母还可以通过360儿童机器人与孩子视频通话,也能随时监控家中场景,当孩子在机器人前停留时,机器人会自动抓拍小视频,保留孩子的精彩瞬间。

  邓邱伟说,人工智能是其中最核心的技术。听上去简单的对话,背后有丰富的数据支持和语音唤醒、语音识别、语意理解的支持。360还联合国内知名儿童内容厂商,为儿童机器人量身定制了海量优质的儿童早教资源。“把我们所拥有的资源全部整合起来。”

  “我们想让人们真正把它用起来,至于未来的盈利模式有很大的想象空间。”在邓邱伟的设想中,巴迪就是一个可爱的大白,很体贴、很温馨,能够解决小朋友的问题。(记者 焦立坤)

  故事3

  百度AI能识图作曲

  “科技和艺术的跨界很性感”

  欣赏徐悲鸿的《奔马图》时搭配激情澎湃的音乐,品味梵高的《星夜》时是舒缓又寂静的音符。如今,机器已经可以学会理解画作的情绪,并谱写出适宜的音符。日前,百度在“AI科技与艺术之夜”活动上展现了人工智能谱曲,并将多位艺术大师的画作用音乐的形式表现,实现了视觉呈现向听觉表达的转化。

  百度此次展示的人工智能看图谱曲技术,是通过其全球最大规模的神经网络和深度学习算法由机器自主学习实现。百度神经网络在“看到”图像后,首先对图像进行分析解读,为图像打上若干具象化的标签。例如提取图片中出现的高山、天空、宠物等物体,以及色调想要表达的意境。然后通过搜索挖掘相关的音乐信息,对音乐拆分重组,再合成与图片内容相匹配的音乐旋律,最终拼接成完整的曲子。

  “科技和艺术的跨界很性感。百度一直尝试用技术解决各种问题,人工智能识图作曲技术,实现了所阅即所乐。”百度项目负责人对北京晨报记者表示。目前,全球范围内能够实现人工智能自动谱曲的仅有百度和谷歌,而百度尝试将图像所体现的情感“移情”转变为带有声音信息的技术则更为复杂。

  人工智能识图作曲并不是一项停留在实验室中的作品。百度项目负责人告诉北京晨报记者,通过这种方式可以让神经网络更好地理解人的意图,更好地为人类服务。例如对于视障人士来说,这项技术可以帮助他们更好地理解眼前的作品。对于一些特殊人群,这项技术或许也可以应用于心理疾病等辅助治疗等方面。

  多年以来,百度给外界的印象一直都是高科技公司。但近年来包括无人车、张国荣语音合成、尼泊尔古迹修复、度秘等贴近生活的技术展示,让外界对这家科技公司的印象有所转变,因此其中不少技术也被网友称为“黑科技”。(记者 韩元佳)

  故事4

  搜狗突破语音识别最后3%

  “语音识别是有大脑的”

  在日前召开的极客公园创新者峰会上,搜狗展示了最新的语音识别技术,现场将搜狗公司CEO王小川的现场发言实时翻译成滚动字幕,准确率高达97%以上。此外,王小川还现场演示了最新推出的语音修改功能,能够听懂自然语言纠错信息并进行修改,例如“弓长张改成立早章”,“女字旁的她”等复杂口令。“这项技术解决了语音识别准确率最后3%的差距。”王小川表示。

  搜狗语音交互技术中心负责人王砚峰告诉北京晨报记者,支撑这些技术背后的,一方面是语音识别本身的能力,另一方面,就是强大的语义理解能力。“市场上的语音识别功能只有耳朵没有大脑,只能听到有什么样的字,却听不懂其中的意思。”

  王砚峰表示,搜狗语音识别有“大脑”,这个“大脑”就是语义理解引擎,将语音识别和对内容的理解绑定在一起,做到真正理解用户的语义。机器对“弓长张”与“立早章”的理解,背后是搜狗庞大的汉字知识库加海量用户文字表达数据,以及搜狗的深度学习技术在海量用户数据上的信息挖掘能力。

  王砚峰认为,交互技术的发展和更智能的搜索体验将会是引领未来的“黑科技”,也是搜狗一直努力的方向。(记者 韩元佳)

【纠错】 [责任编辑: 高海英 ]
新华炫闻客户端下载

相关稿件

010020111200000000000000011199861355384721