扫码订阅 程序之心

目录

知识图谱基本概念

从 2012 年 Google 提出”知识图谱“至今,知识图谱技术已经随着大数据和人工智能的发展有了极大的进展。狭义的知识图谱特指一类知识表示,本质上是一种大规模语义网络。广义的知识图谱是大数据时代知识工程一系列技术的总称,在一定程度程度上指代大数据知识工程这一新兴学科。

知识图谱的狭义概念

知识图谱是一种大规模语义网络,包括实体(entity)、概念(concept)及其之间的各种语义关系。

理解知识图谱的概念,需要掌握两个要点:

  • 语义网络,这是知识图谱的本质;
  • 大规模的,这是知识图谱与传统语义网络的根本区别。

语义网络是一种以图形化的(Graphic)形式通过点和边表示知识的方式,其基本组成元素是点和边。语义网络的点可以是实体、概念和值。

  1. 实体:实体有时也会被称作对象(Object)或实例(Instance)。
  2. 概念:概念又被称为类别(Type)、类(Category或Class)等。
  3. 值:每个实体都有一定的属性值。

知识图谱中的边可以分为属性(Property)和关系(Relation)两类。关系可以认为是一类特殊的属性,当实体的某个属性值也是一个实体时,这个属性实质上就是关系。

语义网络中的边按照其两端节点的类型可以分为概念之间的子类(subclassof)关系、实体与概念之间的实例(instanceOf)关系,以及实体之间的各种属性关系。

知识图谱与传统语义网络的区别:

  1. 规模巨大:知识图谱具有巨大的规模。
  2. 语义丰富:知识图谱富含各类语义关系,语义关系的建模多样。
  3. 质量精良:大数据多源特性使得我们可以通过多个来源验证简单事实。
  4. 结构友好:知识图谱通常可以表示为三元组,这是典型的图结构。三元组可以借助RDF(Resource Description Framework)进行表示。

知识图谱构建与应用独特挑战:

  1. 高质量模式缺失。提示知识图谱的规模往往会导致质量下降。
  2. 封闭世界假设不再成立。在应用中缺失的知识未必为假。
  3. 大规模自动化知识获取成为前提。

知识图谱与本体的区别:本体刻画人们认知一个领域的基本框架,而知识图谱富含的是实例以及关系实例。

知识图谱的广义概念

知识图谱作为一种技术体系,指代大数据时代知识工程的一系列代表技术的总和。

© 2016 - 2024 chengxuzhixin.com All Rights Reserved.

浙ICP备2021034854号-1    浙公网安备 33011002016107号