学府红枣信息门户网 首页 >  科技  > 产品经理的知识图谱应用

产品经理的知识图谱应用

发布时间:2019-11-03 20:20:06 来源:网络

知识地图对产品经理的工作有很大帮助,可以建立一个更系统的设计过程。其应用核心在于对业务的深刻理解。

知识地图的概念最早是由谷歌提出的。为了提高搜索引擎返回答案的质量,通过构建知识地图,找到用户查询文本背后的语义信息,从而返回更准确的信息。

让我们以李小龙为例。没有知识地图,当用户搜索“谁是李小龙的儿子”时,他们只能通过关键词搜索来分析包含“李小龙”和“儿子”等关键词的页面。

然而,通过知识地图搜索,我们可以准确地搜索到准确的答案。我们以搜狗搜索为例(见图1.1-1):

图1.1-1搜狗搜索结果

当搜索“谁是李小龙的儿子”时,我们将首先从语义上识别文本,并识别实体“李小龙”和关系“儿子”。然后我们将通过关系图(见图1.1-2)准确地找出实体的方向和关系,最后完成准确的检索。

借助知识地图,搜索引擎通过背后的语义分析返回更准确和结构化的数据。

图1.1-2李小龙关系图

追溯源头,知识地图起源于20世纪60年代的语义网络。

语义网络是以网络形式表达人类知识结构的一种形式。它由节点和节点之间的弧组成。节点代表概念(事件、事物),弧线代表它们的关系。

语义网络是知识表达的早期形式。这是一个有标记的有向图。每个节点代表对象、概念、对象等。知识和点之间的联系。

“谁是谁,什么”的方向性关系类似于语义网络。在知识地图领域,它由一些相互关联的实体和属性组成。

因此,知识地图本质上是一个语义网络和基于图形的数据结构。

因此,从数据的角度来看,知识地图通过处理、提取和整合结构化数据、非结构化数据和半结构化数据,转化为三重“实体-关系-实体”(见图1.1-3),然后聚集大量知识,实现快速响应。

从应用层面来看,知识地图用于描述现实世界中存在的实体及其关系。

图1.1-3三重案例

从不同的角度,基于图1.1-3的例子,让我们来看看不同技术中对知识地图的理解。

从互联网的角度来看,就像文本之间的超链接一样,数据之间的语义链接是通过地图建立的。例如,张三的妻子是李四,她支持通过图形数据检索实体和实体之间的关系。

从自然语言处理的角度来看,如何从非结构化数据和半结构化数据中提取数据并从中提取语义。例如,我们拿到了张三的简历,上面说他的出生地是河北。通过抽取规则得到“张三”和“河北”两个实体以及“出生地”的关系,并存储在机构中。

从人工智能的角度来看,如何利用知识地图来辅助理解人类语言,并查询相应的关系和机器推理。

我们理解知识地图的概念,那么知识地图是如何存储知识数据以及如何呈现的呢?作为产品经理,理解知识地图的表示和存储对我们有什么意义?这些问题将在本章中解释和回答。

1.2.1知识地图的表示

知识地图的表达是指计算机如何表达现实世界中包含的知识数据。

知识地图本质上是语义网络的知识库,因此我们可以简单地将知识地图表示为多关系图,基于向量空间学习的分布式知识表示。

我们知道图形是由点和边组成的。在知识地图中,“实体”用于表示地图中的点,“关系”用于形成不同点之间的连接,例如,在图1.1-3中,圆圈表示实体,点之间的连接称为关系。

实体是现实世界中的事物,如人名、地点、公司、药品、专业知识的概念、某些场景中的年龄和性别等。可以被视为实体。这种关系是不同实体之间的真正联系。例如,李四是张三的妻子,张三的籍贯是河北等。妻子和出生地都是真实世界的关系。

在现实世界的社交网络中,我们可以找到很多实体,这些实体可以用作实体数据,而不是这样那样的人、这样那样的公司、这样那样的人员号码以及这样那样的公司的注册地址。实体之间的关系是不一样的,例如,人和工作之间的关系是不一样的,但是工作会随着人们的工作年限和努力而改变。因此,一个人和他/她的工作之间的关系可以包括以前和现在职位之间的关系。案例见图1.2-1。

图1.2-1企业信用查询应用的企业关系图谱

从图1.2-1中,我们可以看到以下“实体-关系-实体”:

因此,我们可以从图中知道某某人和某某企业是实体。股权参与、总经理、董事长和监事是相关的。

知识地图的核心是通过知识地图处理表达的实体之间的关系三元组。此外,实体的一些属性可以通过属性映射来表达,例如某人的出生日期,例如某人的姓,例如某人的介绍等。

因此,知识地图作为一个整体以图形数据的形式表达了实体与实体相关属性值之间的关系。

1.2.2知识地图的存储

通过知识地图的表示,可以直观地看到知识地图中包含的知识数据,这对理解知识地图的存储有很好的促进作用。

知识地图主要以两种方式存储:

因为rdf以三元组存储数据,neo4j是否包含属性信息,所以图形数据库通常使用属性图作为基本表示,而二级数据库通常使用。因此,实体和关系可以包含属性,并且可以更容易地表达真实的业务场景。

知识地图通常有三种原始数据类型:

从上述数据中提取实体、关系、属性和属性值。

作为后台产品经理,关系数据库并不陌生。有些人可能会问,根据图1.1-3,效果不一定可以通过知识地图来实现,也可以通过关系地图来实现,例如为人员建立基本信息表,在用户之间建立家庭关系,以及查询,如图1.2-2所示。

图1.2-2二维表关系的表示

那么,知识地图和关系数据库的数据存储方法有什么区别呢?

事实上,关系数据存储和图形数据存储之间的角色不是一个或另一个。它们相互协调使用,并根据不同的业务场景使用。

在图形数据的多关系建模中,关系数据库是不同表之间的关系。如果关系太多,关系数据库就不太友好。在地图数据库中,人们可以把自己的籍贯和职业划分成一个关系。

不仅如此,如果我们把身份证号码作为一个实体,那么名字、前一个名字等等都可以区分为一个关系,这对于关系数据库来说是很难做到的。

因此。图形数据库更适合于通过实体分析找到更强大的业务关系。例如,我们可以把原籍地的地址分成几个关系,比如现在的居住地、以前的居住地、出生地等等。事实上,同一个实体(河北)可以划分出三种关系来满足不同的业务场景。

因此,知识地图更注重关系,更注重时间变化的一些隐藏关系和动态关系。当然,多关系查询图数据的性能更好。

关系数据库是数据的记录,它更适合一些业务流程数据,如订单销售数据、合同数据、结算数据等。并且能够记录、反映和分析基本的业务需求和场景。

图形数据更多的是根据业务需求来辅助业务。例如,订单销售数据记录了用户购买的产品,这一事实可用于通过统计功能进行一些业务分析。

但是,如果我们做一些个性化的推荐工作,我们可以通过图形数据在用户信息和一些产品特征之间建立一种关系,这可以为客户提供个性化的推荐方案——也就是说,图形数据存储可以帮助系统实现推理功能。

例如,姚明是一名篮球运动员。我们知道篮球运动员的特征之一是他们的高个子。当您询问系统姚明的身高时,系统可以通过姚明和篮球动员以及篮球运动员的属性之间的关系来推断姚明的身高——这也是应用图形数据库来存储数据的最重要的功能之一。

1.2.3理解知识地图表示和存储对产品经理的重要性

产品经理理解知识地图的表示和存储的最重要的意义是根据业务需求定义实体、关系、属性和属性值。

作为后台产品经理,我们都知道在设计产品功能时,我们需要设计四个基本对象:

其中,场地设计是我们背景设计中最基本、最核心的部分。

首先,我们的设计背景系统显示的表单信息来自于领域设计,业务流程中体现的业务信息载体是领域设计,规则设计中相关的规则控制对象也是领域,因此领域设计是背景产品设计中最基础、最核心的工作。

字段维度包括以下维度:

当我们设计任何函数时,数据的设计总是第一步。

知识地图也是如此。我们需要指定存储哪些实体、建立哪些关系、哪些是属性以及哪些是属性值。

例如,在反欺诈系统中,如果发现两个不同的用户拥有相同的移动电话号码或居住地址,并且两者没有任何家庭关系,我们认为这是具有欺诈行为的用户(因为平均用户和移动电话号码是一对多,移动电话号码对用户是一对一的,并且一个移动电话号码不太可能被两个用户使用)。

此时,我们将把电话号码、姓名、身份证号码和地区作为实体,然后建立联系方式、会员身份信息、住所、家庭关系等相关关系。我们将通过电话号码和姓名的联系信息一目了然。

因此,地图的使用离不开产品经理对业务的深入理解。在深入理解的前提下,地图数据的基本存储方法如实体、关系、属性等。被正确识别。对于发展业务的理解,开发设计也有同样的促进作用。

因此,理解知识地图的存储和表示可以更好地帮助产品经理定义知识地图、实体、关系、属性和属性值。

我们知道什么是知识地图和知识地图的数据组织。

然后让我们简单描述一下如何构建知识地图,以及如何理解如何构建知识地图可以帮助我们的产品经理。

1.3.1知识地图的逻辑结构

在我们理解知识地图构建的过程之前,让我们先理解它的逻辑架构。

知识地图逻辑上分为模式层和数据层:

1.3.2知识映射流程

知识地图的构建是后续应用的基础。知识地图决定了本体库,因此有必要构建知识地图数据。具体构建过程包括三个阶段:信息提取、知识融合和知识处理。

1)信息提取

从各种数据源进行实体识别和关系识别,提取实体、关系、属性以及实体间的关系和属性值,完成本体的知识表达。有关详细信息,请参考上述知识库的表达式部分。

对于知识地图,我们知道数据源中有结构化数据、非结构化数据和半结构化数据。

通常有三种类型的数据通道:

信息提取是知识地图构建的第一步。关键是如何从数据源中自动提取实体、关系、属性和其他机构技术。

实体提取,也称为实体识别,是从文本中自动识别命名实体。它是信息抽取最基本的部分。

关系抽取是识别语义并抽取实体之间的关系。这是信息抽取最关键的部分,也是形成网络知识结构的基础。

关系识别应用于各种算法模型和机器学习方法。属性提取实现了实体属性的完整轮廓。

2)知识融合

主要是新知识的融合、整合、区分同义、近义、消除歧义、矛盾。

例如,一些实体数据在显示世界中具有各种表达式,例如公司的注册名称、公司的简称等。这些知识应该是同义的,一些特定的称谓可能对应于多个不同的实体。

知识融合包括两个部分:实体链接和知识融合。

3)知识处理

一些知识需要进行质量评估,而另一些需要人工干预和筛选、数据校正,然后将正确的数据添加到知识库中以确保质量。

知识处理主要包括本体构建、知识推理和质量评价。

我们可以通过从数据源中提取信息,识别实体和关系,融合相关异常数据来构建本体库。

然而,本体库建立后,原型就建立了,这种关系可能存在一些缺陷。这时,我们可以利用推理技术来完成进一步知识的发现。例如,甲是乙的配偶,乙住在丙市,如果我们不从数据中提取甲和丙的关系,那么我们可以通过配偶关系推断甲也住在丙市。

质量评价是量化知识的可信度,丢弃可信度低的知识。在治疗过程中,人的参与也非常重要。

1.3.3理解知识映射对产品经理的重要性

在知识地图构建过程中,将综合运用知识地图存储技术、相似算法模型、深度学习等技术方法。技术人员只需要参与吗?

不完全是。

相反,他需要产品经理和技术人员之间更深入的合作和沟通,产品经理的参与在整个地图集的构建中是不可或缺的。产品经理在一些地图的制作中仍然起着主导作用。

当你计划建立一个知识地图时,仅仅依靠技术人员是不够的。产品经理需要定义业务,了解业务所需的地图数据,指出地图中有哪些实体,地图中有哪些属性,以及实体之间存在哪些关系。这些都是由产品经理定义的。

此外,从构建地图的角度来看,产品经理和技术人员之间需要更深入的沟通与合作,产品更需要了解技术的应用过程。如业务数据的提供、数据范围的划分以及图集提取后的验证。

施工过程的每一步都需要产品经理和技术人员之间的沟通,因此人工智能产品经理了解技术、了解技术应用、参与技术应用过程是非常重要的。

通过了解支持地图集是什么,知识地图集是如何表达的,以及在知识地图集的构建过程之后,如何设计一个完整的知识地图集?

该方法主要包括以下步骤:

许多人认为知识地图的构建主要取决于算法和开发,但最重要的是对业务需求的理解和地图数据的设计。

就像我们设计后台产品一样,数据库表设计尤其重要。数据库表设计的数据项与对业务的深入理解密切相关。

因此,设计知识地图与我们的产品经理设计的其他产品相同:了解业务和设计数据字段。

图2-1学习李文哲对知识图谱的理解

从上图中我们知道,构建知识地图最重要的是业务理解和地图数据设计,这正是产品经理需要领导的设计工作。

因此,下面将着重于定义业务需求、数据收集和处理以及图形数据的设计。

在知识地图中定义业务需求主要包括两个方面:

1)应该解决什么问题

这与作为前端和后端产品经理是一样的。我们可以通过理解业务流程、整理数据字段和实现原型交互来实现我们的业务需求。知识地图也是如此,它也有高级应用程序,如问答机器人和个性化推荐等。,通过某种应用介质实现需求的输入和输出。

2)有必要使用知识地图来解决这个问题吗?

这个问题的答案是,在设计我们的需求时,我们可以使用哪种数据存储来解决我们的业务需求。事实上,有时当我们完成业务需求时,我们可以用关系数据库来完成,所以我们不需要知识地图。

我们可以使用知识地图来满足什么样的需求?

要解决这个问题,我们需要深入了解数据存储方法。目前,数据存储的设计主要是关系数据库和知识地图数据存储。因此,了解需求所需的数据以及数据的使用方式是决定是否使用知识地图的最佳方式。

与关系数据库相比,知识地图最重要的功能是应用数据之间的多种关系。通用知识地图数据存储方法解决了多关系、关系间深度搜索、关系查询实时性要求、数据多样化和数据孤岛等问题。

当然,除了知识地图之外,我们知道知识地图还具有推理功能,所以在处理推理需求时也可以考虑知识地图。

2.1.1关系要求

关系需求意味着当需求被设计成查询数据之间的多种关系并应用多种关系时,可以考虑知识映射。

那么,什么样的关系可以通过知识地图传递呢?以下提供了两个可供参考的想法:

1)某个数据与多个实体有关系

某个数据和多个实体之间的关系是指某个数据和多个实体之间的关系,因此可以通过搜索这些数据找到相关实体的数据。

例如,我们将一个年龄数据制作成一个实体,该实体是30岁,张三的年龄是30岁,某个产品的试用范围是10-50岁。如果我们通过这个人的年龄来寻找这个产品,我们可以建立两个实体之间的关系,一个是这个人的年龄关系,另一个是这个产品的适用年龄关系,所以我们可以很快找到它。

2)多个实体之间的多种关系来查找实体

实体的多实体多关系搜索是指当一个实体和另一个实体具有多个关系时,通过多个关系搜索另一个实体。

例如,人与人之间有三个实体和两种关系,即出生地和年龄。某个产品、销售区域和适用年龄也是三个实体之间的两种关系。根据人的出生地、年龄实体数据和关系,可以相应地找到该销售区域的某个产品和适用年龄。

因此,我们可以发现知识地图可以解决数据间多关系和深层关系的实体查询。

2.1.2推理要求

知识地图不仅基于关系检索,而且其核心目的是推理和发现地图中的隐藏关系,而不是发现新知识。

1)通过实体之间的关系推断相关关系

通过多个实体之间的关系,我们可以推断出其他的关系,比如张三和李四是夫妻关系,王武是张三的首领,王武住在甲市,我们可以推断出李四也住在甲市

2)通过实体之间的关系推断相关属性

通过多个实体与实体属性值之间的关系,可以推断出实体的属性值。这背后的推理类似于通过实体之间的关系推断关系。也可以从实体之间的关系推断另一个实体的属性。

人工智能涉及到许多推理方法,包括基于逻辑的推理和基于深度学习的推理——这就是基于图谱的推理,即基于关系和属性因素的推理。

定义业务需求需要根据业务需求找到相关数据。

我们介绍了在知识地图构建过程中可用于信息提取的数据。在这里,我们重点关注在收集数据时如何与我们的技术同事合作。

2.2.1结构化数据

结构化数据是知识地图中最可靠的数据。它通常来自我们的业务系统生成的数据,如一些用户档案数据、销售数据、合同数据、资源数据、财务数据等。

所有结构化的关系数据都可以与业务需求相结合,以确定它们是否需要添加到知识地图中。我们如何向我们的技术同事提供这些数据?

这很简单。我们可以只使用excel表格,只告诉需要写入地图集的结构化数据。

2.2.2半结构化数据

半结构化数据有两个考虑因素:

2.2.3非结构化数据

非结构化数据主要是一些文档、文件等。,如一些合同文件、文章、pdf文件等。,这要求产品经理明确定义从这些文档中提取哪些知识和提取规则,通过算法识别、提取、培训等将它们提取到结构化数据中。,然后将它们包含在知识地图中。

一旦我们得到数据,我们将开始设计知识地图。知识地图的设计不仅需要对业务有深刻的理解,还需要考虑地图的实用性和高效性。

设计知识图主要是设计知识图的三元组,即哪些数据是实体,哪些数据是属性,实体之间存在什么关系。这需要在设计过程中有深刻的理解,并且应该根据业务需求进行设计。

这里提到一点:实体是数据而不是类,例如,产品不是实体,特定的产品名称是实体;属性也是如此,它们是特定的值。例如,性别不是属性,男人和女人是属性值。只有关系是一种,例如,一个人的年龄,年龄就是一种关系。

此外,知识地图设计的艺术性还体现在实体和属性在不同的业务需求下可以有不同的定义。

根据业务需求,某些实体可以用作属性,而其他实体可以用作实体。例如,如果不需要与其他实体的关系,年龄数据可以用作属性。如果需要创建关系,它必须是一个实体。

在设计地图时,我们还应该掌握哪些数据是多余的和不必要的。因此,作为一名产品经理,在设计知识地图时,最重要的是这三者的设计。

这篇文章最初由@罗飞发表,每个人都是产品经理。未经允许禁止复制。

主题地图来自unsplash,基于cc0协议。


快乐赛车app

上一篇:Stifel下调Aurora Cannabis评级为卖出

下一篇:马云正式卸任“后马云时代”的阿里江湖再无“风清扬”

新闻图片

新闻排行