什么是知识图谱?
知识图谱(knowledgegraph)起源于知识工程和语义网络,最开始主要是各类知识库和专家系统,直到年Google面向互联网的大规模信息数据,提出了知识图谱的概念,宣告了知识图谱的诞生。
知识图谱简单讲就是把知识用有向结构图的方式组织起来的产物。知识其实就是归纳好的经验,是概念及其之间关系的集合,所以人的经验在结构化的表达之后是可以被机器学习理解的。而随着图数据处理技术的发展,大量的信息甚至是隐含的信息可以被储存在知识图谱这样的复杂图结构中。于是,知识图谱应运而生。
中文文献检索来源CNKI,英文文献检索来源WOS核心库,数据截至年,年未结束,暂不列入统计。
中文知识图谱研究起步稍晚,中英文文献近年增长势头都很快。
知识图谱能做什么?
知识图谱因为其网格化的结构、整合能力强,可以打破数据的孤岛状态,更加适用于跨领域、跨空间、跨场景使用;可以发展为整个智能工厂的智能核心,同时驱动设计和工艺两个方面。
工艺方面,相比于以往的数据分析模型,知识图谱更倾向于根据知识去推理,可以算作是定性分析,这使其能够很好的与定量分析的数据分析模型推理互补,基于知识的推理能够让基于数据的推理更加有目的性,而不是只靠数据说话。数据在很多时候因为取样的问题会有误导性,而数据分析不能很好地去除这种误导性,这个时候基于知识的推理可以更加合理的引导数据分析,纠正被误导或者完全无头绪的分析方向。当然,知识图谱也可以从数据分析的反馈中获取知识,从而使得知识图谱更加完整。
设计方面,知识图谱也可以发挥作用。知识图谱可以将设计开发过程中涉及到的相关领域知识整合起来,这些知识可以用于帮助机理模型建立时参数的选择和补充,可以有针对性地抽取数据,用于机理模型参数优化。同样的,机理模型优化后的结果,可以反馈给知识图谱转化为有用的知识,进一步补充完善知识图谱。
以往的专家系统和知识库等工具维护成本高,对专业领域知识的表述五花八门,不够标准。随着自然语言识别和机器学习等领域的快速发展,知识图谱正在逐步克服过去的这些问题。知识图谱维护成本低,同时知识的表示更加标准化,将人的经验转化为机器可理解的知识不再是跨越鸿沟。我们可以看下知识图谱的主要关键词,从中我们能看到一些技术端倪。
主要关键词
因为人工智能的发展,机器从非结构化的文本和资料中能更容易地提取概念和关系;也因为信息处理技术的发展,让机器自发利用现有知识进行推理计算也成为可能。当然我们也不要忽略人的监督,我们依然可以用传统的方式,用专业人员的积累去更正、补充、完善知识图谱。
简单的说,知识图谱更像是整个智能工厂的复杂脑图,这个“脑图”不但易于查询,方便检索,还能够通过自动或人工的方式去完善演化,它可以驾驭已有知识,更能创新知识。它可以打破工厂内部各部分的壁垒,还可以打破行业内各个企业之间的壁垒,甚至打破行业间的知识壁垒,为智能工厂源源不断地输出“知识”,这里的“知识”是指机器能理解的知识。这些知识并不完全是机器自动获取学习的,而是可以依赖于化工行业的专业知识建立起来的,也会因此遵循着化工行业的规律,不像数据分析出来的结论那样冷冰冰的只认数据。你可以说它更符合人的直觉,但是同时它也能像机器一样自动高效的学习演化,利用机器所具备的优势,打破人的局限。诚然,知识图谱依然有不足,但是随着对现有问题的逐步解决,能够打破知识孤岛的知识图谱,还是有希望产生一些意想不到的效果。
化工领域的应用展望
虽然知识图谱技术在化工领域并不普及,但是根据我们对目前相关文献的分析,可以说知识图谱的应用场景比较广泛,这也符合知识图谱的特点和用途。
行业分布
我们统计了中英文文献所涉及的行业领域,发现以下几个特点:
01中文文献中知识图谱更多是用于研究各领域研究热点;
02英文知识图谱文献的涉及领域比较广泛且均衡地分布在理论,科技,工程各个方面;
03尤其是智能制造各个领域都有运用知识图谱技术的研究;
04化工行业相关中英文研究都占比不大,还处于起步阶段。
虽然在化工领域知识图谱的文献数量不多,但越来越多的文献已经开始