达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

基于语义理解的达观知识图谱的实际落地案例

达观知识图谱介绍

知识图谱是一种描述真实客观实体之间关系的语义网络,该概念由互联网公司google在2012年5月为了增强用户搜索质量和体验首先提出。知识图谱通过实体-关系-实体(如达观数据 – 研发 – 知识图谱)或实体 – 属性 – 属性值(如达观数据 – 公司地址 – 上海)的三元组集合的形式,记录实体之间的相互关系和实体所具有的属性,可以通过可视化的方式一目了然的查看图谱中的所有知识。

据艾瑞咨询近日发布的知识图谱行业研究报告中指出,2019年国内涵盖大数据分析预测、领域知识图谱及NLP应用的大数据智能市场规模约为106.6亿元,预计2023年将突破300亿元,年复合增长率为30.8%,可见知识图谱相关技术具有广阔的市场前景。

pic_001

达观知识图谱

达观知识图谱平台基于大数据分布式平台,支持亿级以上的知识存储,同时结合达观智能文本处理和理解技术,快速从非结构文档中抽取结构化信息构建各领域行业知识图谱,并提供丰富的知识图谱的应用,如智能问答、关系路径分析、预警分析等。达观知识图谱在金融、政务、零售等各个领域都有广泛的应用,主要应用方向有行业知识库、智能问答搜索、风险监控预警、研判、推荐、数据中台等。

举个例子,我们在搜索引擎中搜索问题:“中国2018年GDP是多少”,下图中搜索结果即为搜索引擎根据其所构建的知识图谱所得出的问题答案,知识图谱中存储了世界上各个国家和其历年GDP等数据,通过理解问题的意图和语义,从图谱查询找出相关数据,以图表等丰富样式进行展现,极大的提高答案获取的效率。

pic_002

搜索引擎中的智能问答

核心技术:信息智能抽取 + 基于知识图谱的问答

信息智能抽取

达观知识图谱同时从多源异构数据构建知识图谱。结构化数据包括MySQL、Oracle等各种数据库以及Excel等文件类型,通过映射式配置的方式直接将结构化数据导入到图谱中;非结构化数据包括word、pdf、txt、html等各种类型数据,达观智能图谱通过文档智能解析 + 信息智能抽取的方式提出实体和关系信息,从而构建知识图谱。


在现实各行业中,很多实际业务中的数据都是一些文本、文档等非结构化的资料,为了能从这些繁杂的资料中将重要信息通过机器自动找出来,则必须要通过自然语言处理中智能抽取的技术,抽取出业务相关知识再用来构建成图谱。达观的文本自动化抽取技术能够支持常见公开文档类型(如财务报表、招股说明书、商业合同等)和企业内部(自定义)文档类型的信息抽取。

pic_003

达观知识图谱-抽取式构建

基于知识图谱的问答

基于知识图谱的应用方向有很多,最典型和核心的是把知识图谱打造成一个行业专家系统,用户在使用时直接提问问题而得到准确答案。达观智能问答专家系统,能够在准确识别用户问题意图的基础上,在图谱中找到相应的答案,支持对实体、属性、关系等各种数据的问答,且能对知识进行溯源。

pic_004

基于知识图谱的达观智能问答系统

达观知识图谱落地案例

基于知识图谱的某大型银行网点渠道规划

基于数据的生产变革和业务模式创新正驱动着全球范围内经济社会各个领域的数字化、智能化转型。银行业因与数据的高度相关性,成为人工智能最先应用的行业之一,而知识图谱作为人工智能技术的重要研究方向与组成部分,正在快速渗透到银行业务应用层面,并日益成为银行金融科技的“底层支撑”。通过构建网点、人员、业务等知识图谱,实现了网点分时间段业务量自动预测、设备资源配置优化推荐、网点人员运营能力评估等落地场景。

pic_005

银行网点和人员知识图谱构建与应用

基于知识图谱的研报智能语义搜索

证券投资市场作为反映国民经济的重要晴雨表,汇集了大量的专业机构和个人投资者,券商作为市场内的专业研究机构,对各家上市公司做出了大量的研究分析工作,用以辅助投资者的投资决策。
这些研究成果一般以研究报告的形式展现,如何从这些大量的、复杂的文档中更高效的抽象出易于投资者获取和理解的知识,变得尤其重要。通过构建研报知识图谱,并结合智能搜索和问答技术,投资者可轻松获取所感兴趣的上市公司在专业机构研究中的投资观点。

pic_006

非结构化文档智能抽取构建图谱

结语

达观知识图谱,充分融合了在非结构化文本智能抽取和基于知识图谱的应用技术优势,打造了一套完备的涵盖数据源处理、知识抽取、图谱设计、图谱构建、图谱应用落地等的系统平台,极大的提高了客户在知识图谱应用的落地效率和业务效果。随着知识图谱、人工智能、自然语言处理等相关技术的快速发展,知识图谱在各行业的应用会越来越广泛。