由中国图像图形学学会(CSIG)主办CSIG图像图形技术挑战赛日前公布比赛结果,达观数据参赛队伍DataGrand在“票据识别与分析挑战赛”赛道中荣获亚军,A榜与答辩成绩均列第一。
CSIG图像图形技术挑战赛是由中国图像图形学学会主办的系列赛事,旨在搭建学术界与产业界之间的沟通桥梁,助推企业创新发展,促进我国图像图形技术及相关产业的发展和应用,吸引更多的优秀人才。目前已成功举办三届,是该领域最具影响力的赛事之一。
票据识别作为财务自动化办公中非常重要的一环,目的是从扫描的票据中自动提取出既定内容(如日期、金额等)。由于扫描的票据面临版式多样、字迹模糊、文本错位等问题,准确的定位、识别和结构化票据字段是非常具有挑战的任务。该赛题与计算机视觉、自然语言处理、多模态融合等前沿技术相关,具有很大的技术价值和实际社会应用价值。
本次,达观数据参赛团队采用了在实际项目与产品中使用的成熟化工业方案,以更简单通用的工业化pipeline,在信息抽取模块算法设计时精简模态的同时加入重新设计的位置编码方式,达到了流程、效果和性能的多维度平衡优势。在答辩中收获学术界与产业界评委的一致好评,答辩成绩遥遥领先。未来达观数据将继续在OCR、票据和文档抽取领域深耕,以更加优异的成绩保持达观数据OCR和NLP技术在该领域优势。
达观数据票据识别与分析技术,可有效应对文档处理中各类复杂场景:针对质量差的文件通过图像复原算法进行逆向修复与矫正,印章、透视变形、水印、模糊噪点,手写体等也可做到准确识别;拥有业内最佳的表格解析算法,跨页表格、合并单元格、版面倾斜、无框表格等均可精确解析,支持多种样式表格及资金流水单据,精准还原内容与版式。
目前,达观数据票据识别与分析产品已广泛应用于金融、制造、地产、能源、通信、传媒、医药、政务等领域,累积上千家知名政企客户。洞识海量纷繁信息,让文本智能赋能百业。