首页 | 新闻中心 | 国际 | 财经 | 体育 | 台湾 | 法治 | 军事 | 科技 | 教育 | IT | 文娱 | 论坛 | 视频 | 音乐
您的位置: 首页 >> IT频道 >> 互联网 >> 产业资讯

意义互联网与本体论
www.XINHUANET.com  2004年09月20日 13:37:32  来源:互联网周刊

    昔惠能至曹溪,说“不是风动,不是幡动,仁者心动”,遂名重广东。我看用这句话来套如今的互联网,倒是正合适。第一代互联网—信息高速公路意义上的互联网,属于“风动”,是技术这种物质力量推动下的互联网;第二代互联网—电子商务意义上的互联网,属于“幡动”,是商务这种社会力量推动下的互联网;第三代互联网—语义网意义上的互联网,属于“心动”,是思维这种精神力量推动下的互联网。

    而意义互联网,又将经历语形网、语义网和语用网这样三个不断提升的阶段。在第三代互联网中,以搜索引擎为代表的人工智能技术,将为人类建立新的基础设施—语义网络基础设施,其地位不亚于信息高速公路和软件操作系统。

    近日Google成功上市,有些朋友认为我不久前贬低它是失策,这是不了解我的未来学立场,我是在整个第三代互联网的尺度中来评价它的,这与它现在的辉煌并不矛盾。其实我今天对Google的评价仍然不高。虽然它取得了一些成绩,但还远远没有达到我七年前转述的关于“全球大脑”(GLOBAL BRAIN)的预言:“随着符号语言的来到……上亿人的心智联成了一个单一的智能网络”,也没有达到我五年前对搜索引擎期待的水平。

    我把Google视为第三代互联网第一阶段的一个先锋,以我历来的未来学立场,就是说它有可能马上要过时,除非它有实质的改进。从技术分析角度看,Google所在的当前阶段,是语形网阶段,这一阶段的最大特点,也是历史局限,就是“望文生义”。这里的“文”,就是语形,“义”就是语义。当前搜索引擎的特点是根据语形搜索直接得出语义,还达不到语义网要求的“无中生有”,即以原文中没有出现的语形概括实际语义。比如说,“无需远行,无需久等”,语义上可能说的是互联网,但语形上并没有出现“互联网”这三个字。可不可以用“互联网”这个主题词把它找出来呢?现在除非原文中正好有互联网三个字,否则难以找到。

    我观察人们的反应,发觉大多数人对两年以上的预测,是不关心的;五年以上的预测,可能要招骂,理由通常是:我现在没看见,所以你胡说;十年后才会实际显现的思想,肯定要惹起众怒。所以我在这里不讲语用网,换个度数低一点的望远镜,预测一下马上就要到来的语义网的商机和原理。如果要以首富为目标,现在起步有点晚了,所以这个预言不算太超前。我认为这个机会大概还能出个像丁磊这样的人物。

    下边要谈的Ontology,是一个非常抽象的问题,它是语义网的核心问题,也就是说,它是一个“后Google”问题。本文对象主要是未婚青年。我估摸着,能够通过语义网成为中国首富的,多半还得是未婚青年。因为结婚生子,思想早就过时了,看这种前卫文章甚不适合。

    我们IT人经常割断与近百年主流思想发展的联系,在方法论上做从猿向人进化的无用功,Ontology就是一例。如果我对一个搜索引擎专家说,你那里费了半天劲仍然没有上升到的境界,人家哲学家六十年前早就研究透了,他会觉得讨厌:别跟我谈哲学,那都是虚的。但真到了所谓特别务实的领域,他们却怎么也看不透Google的弱点,找不到技术使劲的方向。对年轻人来说,超越老大哥的一条捷径,就是向国际一流的思想家借劲。

    Ontology是本体论的意思。但对语义网来说,它是一个特指的人工智能术语。符号的本体,是指向语义的,是针对语形而言的。这里我们先不考虑语用学上更先进的说法。

    按Tim Berners-Lee, James Hendler 和Ora Lassila的说法,语义网包括三个关键,一是XML(Extensible Markup Language),二是RDF(Resource Description Framework),三就是Ontology。Ontology直接的意思是一份正式定义名词之间关系的文档或文件,一般Web上的Ontology包括分类和一套推理规则。

    这只是技术人员的一种概括,实际上对于Ontology,我们真的需要从它的本义—本体论的高度,来加以认识,否则还是会知其然而不知其所以然,到了复杂的商业环境中就晕头转向。

    作为超越Google的关键,Ontology的问题,目前还没有IT人能讲明白。但哲学界早就研究了好几代。第一个值得我们高度重视的,是六十年前的维特根斯坦,作为分析逻辑的代表人物、《逻辑哲学论》和《哲学研究》两本世界名著的作者,他已经把第三代互联网第二阶段(语义网阶段)最难的“哥德巴赫猜想”提前攻克下来了。维特根斯坦第一次提出了本文间性(Intertextuality,又为本文际性)的概念,我认为它可以作为意义互联网的核心概念。第一代互联网的Internet,对应硬件基础设施,第二代互联网的Intersubjectivity(主体间性),对应协同商务,第三代互联网“inter”的对象不一样:第一代定位于外界客体(net)的交互;第二代定位于社会主体(subject)的交互;第三代定位于思维符号(text)的交互。

    如果我们看到Intertextuality,以为不过是词语之间的互联,意义互联就是语形互联,意义互联网就是用搜索引擎把不同的词,像卖大白菜似的归大堆,连一块儿,那就大错了。维特根斯坦的思想,超越了Google所对应的哲学思想。Google可能没有自觉的哲学思想,只不过其行为无意识地对应着,比如说,罗素的思想。以往的哲学家由于本质主义的立场所限,把语言对应于概念;映射到搜索引擎上,就相当于认为,只要从语形上和统计上进行积累,就自然而然可以提高搜索的意义命中率。我与中科院计算所的专家共同分析Google后认为,Google作为全球最领先的搜索引擎,也不过处在语形分析略带语义分析的过渡期,它比百度局限于完全的语形分析领先了半步,但他们共同的致命弱点在于,他们片面依赖数学算法,而忽略了更有效的语义算法,微软显然已经对更前沿的动向有了比他们都好的感觉。

    Google们想不通的是一个什么关键问题呢?其实这正是苦恼了维特根斯坦大半生的问题。维特根斯坦后期的《哲学研究》与早期的《逻辑哲学论》相比,发生了一个大转变。早期跟罗素看法一致,热衷于语言逻辑本质论,他宣称“逻辑统治着世界,世界的界限也是逻辑的界限”。众所周知,逻各斯(Logos)在希腊文中具有言语、理性的意义。这种说法无异于说语形之外没有意义存在。我们可以用它来对应百度的技术水平。

    但维特根斯坦之所以成为伟大的哲学天才,在于他后期忽然顿悟世界上有概念不能尽的意义,翻译成IT语言就是:搜索引擎光凭语形搜索,一定会出大量语义不符的垃圾,或遗漏大量语义相同而语形不同的结果。因为概念是理性的,在理性之外,还有先于本质的存在、先于概念的潜意识、先于语形的各种隐喻,而这种语义才是Ontology所在。此前人们广泛地认为语形就是本体,黑格尔逻辑学就犯了这个错误;而阿尔都塞用症候阅读比较彻底地解决了这个问题。因此,inter显然就不光是一个词与另一个词的关联,而是一个词的语形冰山与它下面的语义潜流之间的交互关联,其语义潜流是语形最初被提出时实际对应的深层语义,是语言的本体,它在后学中还包括了被阐释阅读后生成的意义。

    基于这种认识,维特根斯坦提出了著名的“语言游戏说”,主张“把语言从它们的形而上学的用途带回到它的日常用途中来”。在研究水平不太高的那个时代,他把这概括为理想语言与日常语言的关系,有点类似于艺术美与生活美的关系,主张“回到粗糙的地面上”,很像车尔尼雪夫斯基的“美就是生活”的说法。这是语言哲学的第一个后现代转变,它的要点包括:第一,意义大于指称,也就是语义大于语形,强调语言的丰富性、灵活性和社会性,翻译成IT语言就是一个词具有多种语义,搜索引擎要解决一词对多义的问题;第二,整体先于微观,主张“意义和结论产生在一个整体论结构中,而不产生在一个与思想或世界的原子关系中”,Google和百度的算法基础,在这里实际上从根本上做了一个清算结论,甚至下一代搜索引擎必须补充数学算法中所缺乏的语义结构这一点,也从本体论的高度提到了;第三,语境决定真理,上面说的intertextuality与语境(context)是一致的,本文间性离不开上下文关系,尤其是在意义的循环中,对话者互为语境,这就涉及到更高级的语用问题了。

    自维特根斯坦之后,关于意义的Ontology成为哲学的中心话题。符号学、阐释学、传播学群星灿烂、精采纷呈。德里达、巴尔特、利奥塔师承维特根斯坦,而胜过了他,伽达默尔也全面超过了他。维特根斯坦的思想已变成小儿科了。但问题是,IT人连六十年前维特根斯坦的水平都还达不到,最起码的思想疙瘩还没解开,还卡在Google的思路中,谈更先进的思想又有什么用呢?所以我们还是从简单基础的地方补起。

    最后,我们简单地从语用分析角度,概括一下从语义本体出发设计互联网所带来的独特前景:

    后现代主义认为,意义存在于个体(此在),而不是像语形系统(相当于意义的货币系统)那样,存在于个体之外。每一个此在,都有一个由记忆构成的语用“语料库”,它由内容和结构组成。作为Ontology的呈现,这种结构为个性化的价值评估提供了标准。至于这种结构的实现,当然有赖于技术人员的贡献,但前提是明确地找到了价值的方向。一切从个体以外寻求意义的作法,只能找到浮在面上的普遍意义,永远找不到回到事物本身的本体论意义。语义网基础设施的作用,就在于能够提供一种Ontology,可以从工业化的逻辑外壳中,解码出个性化的意义。Ontology所实现的语义结构化的意义在于,使我们的思维符号,从思想的“模拟信号”(Google做的,不过是意义的“模拟信号交换”),转变成思想的“数字信号”,从而真正实现另一种不同意义上的互联网—人类大脑的互联(GLOBAL BRAIN)。

    当语义互联网的基础设施突破后,互联网应用将借助广泛的知识代理,在另一个境界展开。在语义互联网中,每个知识都是个人知识,语形表现的只是显性知识,而语义则是知识与个人知识的汇总。因为人只有在直接交流时才可能获得彼此的个人知识(如师徒相传),当人进行社会性的言说和交换时,他必须以牺牲个人知识(具体劳动价值)为代价,提供可间接交流的知识(一般社会价值)。不过当语义互联网出现后,人们可以通过Ontology,保留回溯意义的权利。这样,当人们阅读(解码)之时,可以症候式地补充上各自的个人知识,使意义重新获得圆满。

    这样就出现了一个最重大的变化。价值的确定,必须是语义和语境的,这意味着离开了个性化终端的意义是不存在的。正如在工业化社会使用价值(产品)的交换要服从于社会化的价值(服务)的交换,在信息化社会中,服务的交换又必须依赖于只存在于终端的意义(体验)的交换。在历时的交换中,必须经过当下感觉与个人回忆的“编码-解码”这一循环;在同时的交换中,它必须是intertextuality式的意义循环。按这个要求,未来的交换,前提是世界的网格化,目的是在网格的每个节点,储存和释放编码能力和解码能力,也就是说,由节点提供动力,提供个人知识管理的语料库,通过意义的传播和循环,形成适应个性化定价的价值分流系统。这个世界将继蒸汽机发明之后,第一次不再由社会提供动力系统,而是由全球智能网络每个节点上的个人提供历史前进的动力。

    回首22世纪,退向未来,我们的后代会用意念鼠标指点Ontology这个词说,这就是语义的蒸汽机。 


(责任编辑:李燕博)
  相关新闻/图片:
发表评论: 用户名 密码 匿名

 查看评论
  请注意:
· 遵守国家有关法律、法规,尊重网上道德,承担一切因您的行为而直接或间接引起的法律责任。
· 新华网拥有管理笔名和留言的一切权利。

 频道精选

新华网版权与免责声明:

 
凡本网注明"稿件来源:新华网"的所有文字、图片和音视频稿件,版权均属新华社和新华网所有,任何媒体、网站或个人未经本网协议授权不得转载、链接、转贴或以其他方式复制发表。已经本网协议授权的媒体、网站,在下载使用时必须注明"稿件来源:新华网",违者本网将依法追究责任。
本网未注明"稿件来源:新华网"的文/图等稿件均为转载稿,本网转载出于传递更多信息之目的,并不意味着赞同其观点或证实其内容的真实性。如其他媒体、网站或个人从本网下载使用,必须保留本网注明的"稿件来源",并自负版权等法律责任。如擅自篡改为"稿件来源:新华网",本网将依法追究责任。如对稿件内容有疑议,请及时与我们联系。
如本网转载稿涉及版权等问题,请作者在两周内速来电或来函与新华网联系。
新 华 网 检 索
国内新闻排行
1 十六届四中全会闭幕 决定加强党执政能力
2 江泽民辞军委主席职 胡锦涛接任 视频
3 劳动保障部长郑斯林:我国退休年龄目前不延长
4 贪污多少判死刑? 江苏高法统一标准引起争议
5 国家大剧院与故宫风格是否相融 安德鲁答问
国际新闻排行
1 东突“流亡政府”在美成立 凸显美国反恐双重标准
2 鲍威尔顾问被捕 美媒体影射台湾施“美人计”
3 中国如何对待日本的“常任梦”?
4 美国前高官凯泽涉嫌充当台湾间谍被逮捕
5 安南认为伊拉克战争非法 华盛顿让安南闭嘴
最新图片

揭开原始印第安部落的神秘面纱[组图]
新华网友评论
- 责编点题"一刀切"英语教育演还要吗
- 高校BBS无意间听到最真实的美丽
- 编读往来网友肯定言论新版并提意见
- 反腐“决战”算个什么专家命题?
- 请给我一张完税证明
- 陈水扁又在耍什么新花招?