政's profileLoy Lee's ShelterBlogListsGuestbook Tools Help

Blog


    2/12/2009

    语义网学习笔记—什么是语义网?

      大部分的文献都将语义网解释为“Web of data”,这是远远不够的,现在的WWW已经包含Web of data了—物理连接、数据组织、具理解性。必须要明确的是,构成这张“网”的是用数据之间的对应现实世界的关系,包括明确的和隐含的。

      语义网并不是什么新一带的高速智能互联网,而是Web内容的进化—为了未来更完善的“全球数据库”而在自己的数据中作出少量的修改。

      在《A Semantic Web Primer》中,作者曾经自信的论述到与语义网的发展只不过是工业的采用过程,所有的技术都是现成的,但是随着论述的展开,难处还是接踵而来的,首先是语义网的层次结构,见下图:

    语义网层图

      最底的两层都是被广泛接受的,毕竟他们俩的岁数都比语义网理论要长,从RDF网上就开始出现了各种的问题。(各种语言将会在后面展开)

    1. RDF(Resource Description Framework)表达力不足,表达混乱;
    2. OWL (Web Ontology Language)实为RDF的补充扩展,导致多处地方表达重叠;
    3. Logic野心太大,不仅想与OWL结合,更想构成新的编程语言(基于描述逻辑+霍恩逻辑)。
    4. Trust在共享与保密之间十分尴尬。

      结果现在语义网发展不是层式发展的,而是多个模块并发发展的,此其一。

      第二是致命伤:本体配对(Ontology-mapping),这个以后再说。

      总之语义网的发展并不是“大家都用了就行”的问题,其中所涉及的新问题都是相当棘手的,这也是为什么到今时今日,推销人员都只会用Web 2.0来游说客户,而这个Web 3.0(也就是语义网)就放在一边,因为单个网页按照标准改造语义网是没有用的,它的强大力量在于“关系”,也就是共享。

    2/9/2009

    语义网学习笔记—什么是语义

    写在最前  

      占用此处以作毕业论文的草稿处。



      要了解什么是语义网,必须对“语义”(Semantic)有深刻的理解。我认为,语义是对于单个概念的关系总和,例如,但从字面上“桌子”是不具有任何的可理解的语义的,情况就像你对着一个陌生的单词不知道它的意思,但是,“桌子能够承托东西”,“桌子是平的和硬的”,“桌子有饭桌等书桌等等”……一系列与桌子有关的描述将桌子与其他的概念联系在一起,形成了对“桌子”这一概念的理解,即我们“明白”了什么是“桌子”。只不过,在日常中人们很少回溯这一过程,普遍认为这是一种人类独有的高级意识。从这种机制出发,不难发现,机器也能“明白”概念,应用上面的例子,对于“桌子”这一个概念,可通过以下形式将关系组织起来:

    桌子—承托—东西
    桌子—形状—平
    桌子—质感—硬
    桌子—包含—饭桌,书桌 (可理解为子类)
    …………

      当然,机器不需要像人类那样以知识的总和去解析某一个概念,它们仅需要在特定的领域,例如,“桌子”在“家具行业”中的关系就足以让机器“明白”“桌子”是什么了。这里一个很有趣的保留,部分的文献都强调着在语义网中,我们仅仅是让数据变得可操作(processable),而不是可理解(understandable),因为可理解已经达到人工智能的水平,语义网的智能程度远不及人工智能。但是从上面的解释来说,两者其实是一致的,至少在机制上如此。

      所以,语义并不是什么高级的东西,只不过足够的关系,加上处理的共有机制(例如汉语基本语法,数据组织形式),形成了一张数据的网,概念的网。