达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

福特中国携手达观首创汽车概念图谱,大大提升知识管理和应用效率

 

传统汽车知识问答场景中,通常采用问答对或者搜索的方案,但问答对存在维护成本高、知识无法细粒度沉淀,检索匹配关键词问答精度不足,用户体验差等痛点,无法很好的适用于C端自然场景下的流畅交互。

达观数据近期与福特中国车联网研发团队共同完成汽车知识问答技术新升级,首次引入概念图谱,并结合语义泛化模型,成功落地汽车车载问答场景中,以汽车使用手册为内置基础知识,流畅回复用户使用问题,精准给出使用指导。除了KBQA(基于知识图谱的问答)的技术升级外针对同步采用多层级问答策略,KBQA、阅读理解问答、信息检索问答相结合,从而确保方案的完备性及稳定性。

 

概念图谱对概念和知识重新组织

知识问答(KBQA)的前提都是构建图谱,通常垂直领域一般构建实体图谱,每个实体表示具体的事物,概念图谱与实体图谱不同,他的实体是由一个个概念组成的,相应的概念和概念之间存在一定的语义关系。对于制度、手册类的场景,层次分明但很难提炼具体实例的场景比较适合构建概念图谱。

概念图谱是将隐形的知识体系化、鲜明化,更好地捕捉到用户搜索的隐含意图,从而达到更精准反馈用户想要知识的目的。如下是将汽车使用手册拆分成分类层、原始概念、组合概念、意图层,实现知识最小粒度拆分的同时,满足复杂组合的意图解析。最后通过达观自然语言处理技术将手册进行知识结构化,并构建知识图谱。

图:概念知识图谱组合表示

图:汽车概念图谱

 

知识问答精准获取图谱答案

在知识问答处理过程中,根据用户输入问句,解析原子级最小颗粒度的概念,逐层推理出最可能的组合概念,也就是用户的真实意图,从而实现更加精准的意图分析。与此同时,由于自然对话场景中,基本是口语化、短文本的描述,因此语义泛化至关重要,我们选择目前工业领域落地成熟的融合检索的SimBERT模型,可以准确高效实现语义相似度计算,理解口语化背后的意图,从而实现更加精准的回复及相关的推荐。

图:手册常识问答助手

 

达观数据致力于提供适合场景的优质知识图谱解决方案,深耕知识图谱相关应用,在知识结构化和应用领域拥有很多案例积累与技术自研探索,不同场景适配不同的组合方案,满足自然场景下的多源化需求,帮助企业实现知识沉淀的同时,助力企业数据应用聚变式科技再创新

最后,特别感谢福特中国车联网研发团队产品经理卫星娜、研发经理彭飞、技术专家蒋彪在项目设计和研发过程中的大力支持。