数据结构论坛

注册

 

发新话题 回复该主题

一文读懂知识图谱的商业应用进程及技术背景 [复制链接]

1#

雷锋网按:本文作者林锦周,澳银资本TMT负责人。

知识图谱(KnowledgeGraph/Vault,以下简称KG)本质上是语义网络,是一种基于图的数据结构,由节点(Point)和边(Edge)组成。在知识图谱里,每个节点表示现实世界中存在的“实体”,每条边为实体与实体之间的“关系”。知识图谱是关系的最有效的表示方式。通俗地讲,知识图谱就是把所有不同种类的信息(HeterogeneousInformation)连接在一起而得到的一个关系网络。知识图谱提供了从“关系”的角度去分析问题的能力

KG应用篇

在知识图谱应用这一块我shi会通过介绍名人知识图谱的聚类、知识图谱在搜索引擎、聊天机器人、金融科技领域等的商业应用。

进一步形象的解释这个定义,人物、作品、地点、数值、身高等都可以作为知识图谱中的节点,我们称这些节点为实体。实体可以由若干个属性表示,节点关系这类可以有妻子、女儿、哥哥、偶像、同门等关系属性。通过实体的属性可以将不同的实体建立关联关系,例如/p>

但这里面很多做知识图谱网络的公司都出过问题,比如同时在电影和音乐知识图谱内,电影数据源里有刘德华,音乐数据源里也有刘德华,这两其实是一个人,但是知识图谱目前的聚类分布效果并不好,经常容易出现两个刘德华。从不同数据源构建图谱的时候,必须有自动化的算法将各处的刘德华聚类,这里面最难也最需要抓紧解决的是如何将来自不同数据源的相同实体聚类。这方面谷歌走过弯路,但现在Googlenow的崛起也证明了谷歌正在从搜索引擎往谷歌知识图谱转型。

知识图谱最早被应用于搜索引擎领域。

自从年Google推出自己第一版知识图谱以来,它在学术界和工业界掀起了一股热潮。各大互联网企业在之后的短短一年内纷纷推出了自己的知识图谱产品以作为回应。比如在国内,互联网巨头百度和搜狗分别推出”知心“和”知立方”来改进其搜索质量。旨在通过语义把碎片化的数据关联起来,让用户能直接搜索到事务(Things),而不是文本字符串(Strings)。在搜索引擎中引入知识图谱大幅的提升和优化了搜索体验。不同于基于关键词搜索的传统搜索引擎,知识图谱可用来更好地查询复杂的关联信息,从语义层面理解用户意图,改进搜索质量。比如在Google的搜索框里输入BillGates的时候,搜索结果页面的右侧还会出现BillGates相关的信息比如出生年月,家庭情况等等。对于稍微复杂的搜索语句比如”WhoisthewifeofBillGates“,Google能准确返回他的妻子MelindaGates。这就说明搜索引擎通过知识图谱真正理解了用户的意图。

近年来,随着人工智能的再次兴起,知识图谱又被广泛的应用于聊天机器人和问答系统中,用于辅助深度理解人类的语言和支持推理,并提升人机问答的用户体验等。典型的如IBM的Watson,苹果的Siri,GoogleAllo,AmazonEcho,百度度秘,公子小白等。

知识图谱也被广泛用于各种问答交互场景中。Watson背后依托DBpedia和Yago等百科知识库和WordNet等语言学知识。类似地,Alexa也依托其早年收购的TrueKnowledge公司所积累的知识库;Siri则利用DBpedia和可计算的知识服务引擎WolframAlpha;狗尾草公司推出的虚拟美少女机器人琥珀虚颜则用到了首个中文链接知识库Zhishi.me。伴随着机器人和IoT设备的智能化浪潮,智能厨房、智能驾驶和智能家居等应用层出不穷。无独有偶,百度推出的DuerOS和Siri的进化版Viv背后也都有海量知识库的支撑。

小冰是微软中国团队推出的娱乐聊天机器人。她的人设是一位16岁的少女。小冰是一个基于搜索的回复检索系统。通过各种基于深度学习的语义匹配算法,从海量的问答对语料中返回最佳的回复(Messageresponse而非Answer)。小冰也会不定期推出新的技能供大家使用,这些技能往往包含了微软团队在图像理解、语音和自然语言理解方面的各种小应用尝试。更值得一提的是:微软针对日本、北美和欧洲等市场陆续推出了具有不同人设的少女如Rinna、Tay和Zo,她们往往可以方便的通过

分享 转发
TOP
发新话题 回复该主题