第二十一届中国计算语言学大会(The 21st China National Conference on Computational Linguistics, CCL 2022) 将于2022年10月14-16日在江西省南昌市举行。由中国中文信息学会计算语言学专业委员会负责组织。CCL作为中国中文信息学会(CIPS)的旗舰会议,经过三十年的发展被广泛认为是最权威的,全国最具影响力、规模最大的NLP会议。CCL着重于中国境内各类语言的计算处理,为传播计算语言学最新的学术和技术成果提供了广泛的交流平台。
达观数据作为一家专注于文本智能处理技术的国家高新技术企业,先后举办了五次自然语言处理相关竞赛,目前已累计16000+选手参赛,获得业界专家、技术媒体、科研院校等广泛支持。
2022年达观数据很荣幸将以金牌赞助商的身份参与CCL大会汇报,并于六月初开展“达观杯”汽车工业故障模式关系抽取评测任务,截至目前已有100余名高校和企业选手纷纷参赛。考虑到选手的参赛热情,达观将本次评测任务报名时间延期至7月31日,欢迎各位高校与企业的算法菁英积极参与其中。
赛事介绍
任务背景
汽车工业故障知识图谱帮助汽车及零部件厂商构建质量管控知识库,整合知识经验,辅助质量工程师高效、全面地分析故障。汇聚所有专家的智慧,降低对工程师自身经验的依赖,让资历较浅的工程师也能做好故障分析工作,大幅提升故障分析效率,加速工程师成长。既降低故障发生的几率,也减少故障发生的损失,实现降本增效,提升企业竞争力。
任务介绍
实体抽取和关系抽取是信息抽取的基础任务,面向汽车故障领域的信息抽取对于实现智能化检修和诊断具有重大意义。汽车故障领域案例文本是由维修从业人员撰写的描述汽车功能异常、排查步骤的记录,该记录包括故障现象、故障原因以及排故过程等,故障案例知识的重复利用受到数据结构化程度的影响,因而识别数据中的部件单元、性能表征、故障状态等核心实体及其组合的故障模式关系至关重要。
通过从大量故障案例文本抽取出部件单元、性能表征、故障状态等实体及其故障模式,可以为后续故障知识图谱构建和故障智能检修和实时诊断打下坚实基础。本任务需要从故障案例文本自动抽取2种类型的关系和3种类型的实体。关系类型为:部件单元的故障状态、性能表征的故障状态。
组织者和联系人
任务组织者:陈运文、文辉、王文广(达观数据 );王昊奋(同济大学)
任务联系人:王小荻
(wangxiaodi@datagrand.com)
评测赛程
报名截止时间:2022年7月31号
提交截止时间:2022年8月31号
公布结果时间:2022年9月30号
评测奖励
本测评总奖金2万元:
一等奖 (一名) 8000
二等奖 (两名) 4500
三等奖 (三名) 1000
额外奖励:
- 中国中文信息学会提供的荣誉证书
- 达观授予的精美参赛奖牌、证书
-
比赛排名前 20 的选手将获得达观数据提供的全职(面向在职)和实习(面向在校生)的 VIP 通道,通过面试优先录用。
扫码了解 评测任务详情及最新资讯
扫码报名 “达观杯”汽车工业故障模式关系抽取评测任务