知识图谱(Mapping Knowledge Domain)也被称为科学知识图谱,是显示知识发展进程与结构关系的一系列图形,它以科学知识为计量研究对象。知识图谱可视化描述了人类随时间拥有的知识资源及其载体,绘制、挖掘、分析和显示了学科技术知识以及它们之间的相互联系,在组织内创造知识共享的环境,以促进科学技术研究的合作和深入。它是引文分析和可视化技术相结合的产物,用可视化的图谱形象地展示了学科的核心结构、发展历史、前沿领域和整体知识架构,揭示了知识领域的动态发展规律。
知识图谱用于构建的本体库数据源可以来源于结构化数据、半结构化数据和非结构化数据,以及现有的一些通用知识图谱库等。
1)结构化数据。其主要是指关系数据库中的表、excel表以及其它具有结构的数据。
2)半结构化数据。其主要指介于结构化数据和无结构化数据之间,通常的XML、HTML等相关网页属于半结构化数据。半结构化数据主要来源于维基百科、百度百科等。
3)无结构化数据。其主要指纯文本资料、图像和声音等数据。
Protege软件是斯坦福大学医学院生物信息研究中心基于Java语言开发的本体编辑和知识获取软件。这个软件主要用于语义网中本体的构建,是语义网中本体构建的核心开发工具。相比与其他的本体构建工具而言,Protégé最大的好处在于支持中文,在插件上,用Graphviz可实现中文关系的显示。为了方便大家,灵玖软件工程团队在吸收protege原版的基础上,对protege汉化后又对webprotege进行了汉化,并成功上线,使大家可以在线进行知识图谱语义本体的自动构建。成功升级的protege汉化版和webprotege汉化版都将对外免费使用。
知识图谱语义本体已经成为当今在大数据应用领域共同关注的前沿课题,目前被广泛应用于自然科学与人文科学领域。相比较以往的可视化技术存在一系列缺点,新兴的知识图谱可将某个学科领域或者知识单元间错综复杂的交互关系用节点与链接等现代可视化大数据技术进行处理与展示,使人们可以清晰直观的了解某个学科或者领域发展进程中的知识结构、研究趋势等。运用知识图谱能够有效的从众多数据中获取知识,也是目前人们从浩如烟海的数据中获取知识的一种有效方法。
灵玖软件作为大数据搜索挖掘分析技术领域的领导者,在技术方面不断精进,拥有完整的大数据技术链条,protege的汉化开发并成功实践运用,标志着灵玖软件在知识图谱语义本体建设方面取得重大进展。
此外,知识图谱的构建是多学科的结合,需要知识库、自然语言处理、机器学习和数据挖掘等方面的知识融合。有很多开放性问题需要学术界和产业界一起解决。我们有理由相信学术界在上述方面的突破将会极大地促进知识图谱的发展。