达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

达观医疗器械知识图谱-心血管器械企业加速创新的“黑科技”

近年来,在心血管和结构性心脏病领域,高新医疗器械的临床应用显得越来越迫切,然而,现阶段国内相关心血管医疗器械的研究国内传统医疗器械企业在实际产品创新和功能优化的过程中。

lQDPDhrqq6JgX1HNA-jNCS6wzbWoDqcbT5wBrboTk4A4AA_2350_1000.jpg_720x720q90g

针对于现有专业领域知识和经验的管理问题还处于半封闭状态,出于安全性和知识产权等方面的因素考虑,传统医疗器械厂商在进行医疗产品文档管理中设置了非常严格的访问权限,仅限小部分人员可以查阅,这就势必导致很多可以应用在相通领域的关键性技术和知识无法在企业内部得到充分的复用和传承,从而在一定程度上减缓了医疗器械生产企业产品创新迭代和快速发展的进程。例如,心脉和冠脉部门在涉及到同一类型导丝产品问题时,由于信息知识不对齐,问题处理的效率会大幅度降低。

达观数据作为业内首个利用知识图谱技术赋能医疗领域产品数据图谱化应用服务的人工智能企业,基于对医疗产品应用场景的深入理解,借助达观渊海知识图谱为基础,运用自然语言处理技术从企业的医疗产品相关的技术、工艺、性能、材料、部件等文档数据中,将其中有价值的数据知识和历史经验提取出来,然后通过有效的组织构建成医疗器械产品知识图谱,进一步辅助企业通过图谱探索和智能问答等方式快速定位已经沉淀在图谱中的关键技术、工艺、性能等知识内容,从而更好的实现对相关经验和知识的复用,从长远可以进一步促进了企业内部在某些共通领域产品体系技术知识和经验的共享和传承。

30
1心血管器械产品文档的结构化处理

首先,在图谱构建前达观会根据企业提供的医疗产品文档进行结构化处理,主要包括产品数据的对接和采集,文本的解析和标注,以及智能抽取和结构化三部分,主要介绍如何从企业提供医疗产品样例数据中获取关键性数据,然后对文档数据进行解析和标注,再通过技术手段进行文本抽取和结构化数据处理的过程和方法。
lQDPDhrqqpMs4XjNA83NAqKwxywPEtBGBcgBrbhWuIAjAA_674_973.jpg_720x720q90g
支持对文档或图片等非结构化和半结构化数据批量或单个接入。支持多种非结构化数据格式,此外,还支持采用达观自研的OCR技术识别扫描件中的文字,识别准确性达到人眼识别的精准度要求。
其次,产品提供的文档解析和标注工具,主要负责对产品文档的文字和表格进行识别,并对关键信息进行标注用于后续的模型训练和信息抽取。
随后,产品提供的信息抽取和结构化工具,主要负责根据业务需求调用已构建好的模型进行文本的抽取,并对抽取结果进行结构化处理,再通过工具将结构化以后的数据导入到图谱。
实际使用情况下,样例数据达到一定数量规模以后,文档信息抽取可以完全无须人工干预同时抽取的准确率也会达到实际业务场景使用的要求,大量减少人工运营的工作量。
2心血管器械产品知识图谱模式设计和构建

达观的知识图谱构建平台提供了一套可视化工具来帮助心血管器械企业的产品专家和达观图谱技术专家一起来梳理和设计图谱模式,其中图谱模式设计通常需要两个步骤的工作。第一步,需要知识图谱工程师和企业业务专家协同梳理业务知识,结合企业自身的业务逻辑形成知识体系;第二步,以业务知识体系为基础,根据业务需求和功能设计,由知识图谱专家和业务专家讨论、抽象出实体类型及其属性和关系类型及其属性,设计知识图谱模式。
lQDPDhrqqpMs4TvNAkbNBFOwZt5Hi5Y6W7sBrbhWrAASAA_1107_582.jpg_720x720q90g
3心血管器械产品知识图谱全景探索

图谱全景探索是图谱数据图谱化的典型前端应用服务,通过对现有心血管器械产品数据,迅速梳理信息,结合NLP和文本抽取技术,精准提取数据及内在关系,展示图谱数据关系,辅助人员快速查询产品相关的技术、工艺、材料、部件等信息。
图谱全景探索支持在可视化的界面对心血管器械产品进行查阅,展示图谱中关系的不断扩展,以及不同产品之间可能的关联关系等,在具体产品功能上支持结构化展示查询、节点排列布局调整、节点间关系层数展示、多图谱管理、节点知识卡片展示等功能。
4心血管器械产品文档知识溯源

基于图谱技术的产品文档知识溯源功能,可以查询指定图谱实体节点知识点的源文档内容,例如某一项产品技术、工艺来源于哪一类具体的文档,支持实体的多文本溯源。
以某心脉血管支架产品为例,点选工艺-导丝原材料清洗,展示属性信息和关联资料,并溯源对应工艺流程图,可以快速定位该知识原始的文档,进一步提升对相关文档资料的阅读效率和质量。
5基于知识图谱推理技术的智能问答服务

基于知识图谱推理技术的智能问答服务提供基于心血管器械产品关键技术、部件、工艺、材料以及性能要求等信息维度的搜索问答服务,支持以自然语言处理方式提问,对问题进行语义理解和解析,并对知识图谱进行查询、推理得出答案,采用实体识别、实体链接、意图识别、知识检索、答案生成与排序等技术,获取最优问答结果,同时,问答结果支持可解释和可追溯性,支持精确和模糊搜索、中英文多语言检索和搜索结果展示。
总体而言,达观数据主要充分利用了自然语言处理和知识图谱技术帮助心血管器械企业如何在产品研发和创新过程中更好的使用好已经沉淀在企业内部的知识和经验,从实际应用效果反馈可见,基于知识图谱技术的心血管器械产品知识图谱平台对企业日常心血管产品知识和经验的有效应用和管理有深远的价值意义:
lQDPDhrqqpMs4T3NAkbNBB6wTc7h4a1dLm8BrbhWsEAaAA_1054_582.jpg_720x720q90g
一方面,通过图谱可视化探索和文档溯源,辅助企业培养了企业业务人员的全局思维,提升不同职能间的沟通效率,加快对医疗产品全面知识的学习和理解,提升了团队效率,另一方面通过基于知识推理技术的智能问答实现了在共通领域下共性知识的参考、复用和标准化,不仅有效促进了企业内部医疗产品经验和知识的积累,而且充分利用知识辅助企业提升了医疗产品创新的效率和质量,进而缩短了产品研发的周期和时间,整体上提升医疗器械企业行业竞争力。