摘要:广发资管与达观数据联合报送的《面向基于机器学习的宏观政策报告比对研究与实践》研究课题荣获2020年优秀课题三等奖。
5月12日,由深圳证券交易所(以下简称“深交所”)、证券期货业金融科技研究发展中心(深圳)成功举办2020年金融科技课题结题暨2021年课题开题报告会。会议通报了金融科技中心近期工作进展并为2020年优秀课题颁奖,广发证券资产管理(广东)有限公司(下称“广发资管”)联合达观数据报送的《面向基于机器学习的宏观政策报告比对研究与实践》研究课题从50多个课题中脱颖而出,荣获2020年优秀课题三等奖。
广发资管和达观数据联合申报的《面向基于机器学习的宏观政策报告比对研究与实践》课题,其成果体现为服务于金融机构专业从业人员的多套宏观政策报告内容语义分析模型和政策差异智能提炼应用系统。
该研究以政府工作报告、货币政策执行报告、央行工作会议和中央政治局会议报告等9类宏观政策报告数据为基础,分析历年政策报告的框架、主旨大意、行文格式、关键词类型、主谓宾结构和章节划分标识等文本特征,使用自然语言处理、机器学习和深度学习等技术,经过文本标注训练得到多种政策报告的语义分析模型,包括文档解析、语句匹配与语义差异识别、关键信息与摘要抽取和通用语义分析模型等模型,使用这些模型可实现金融语义理解下的宏观政策报告语义比对。
技术研发成果包括:1)基于模板和语义文本聚类的文档解析模型;2)基于语义角色标注和语义匹配模型实现句子级别模糊匹配;
3)包括关键词抽取、摘要抽取等多类前沿AI算法的关键信息抽取模型。
产品研发成果为一套政策舆情分析比对系统,提供政策报告自动采集、公告库管理、用户上传/从公告库中选择多期公告、一键自动比对、离线半主动式查阅比对、一键导出多维度比对结果,全流程线上化、自动化、可视化等功能。为了解决深度学习模型运算耗时长与业务人员使用时实时分析的冲突,在产品架构上采用离线模块负责模型运算+在线模块负责实时响应的设计,保障运算的准确率和响应速率。
该课题的研究成果主要是面向金融机构的分析师、基金经理和投资人等用户,支持用户对历年来的宏观政策报告进行逐句比对(毫秒级)、重点信息比对和关键词比对,辅助用户发现政策报告在主体内容、细节用词、关键词频上的差异,洞察政策报告差异情报,辅助金融机构从业人员斟酌经济形势和政策风向的变化。
例如:2018年二季度以来,货币政策执行报告开始加重笔锋,强调金融支持民营和小微企业发展,如果相关业务人员捕捉到这一信号,商业银行可以尽早调整授信政策,民营企业可以把握风口、尽早争取融资渠道,金融机构可以尽快响应国家政策、享受第一波政策利好,投资者可以尽快获取投资信号、在市场上取得超额收益。
作为国内文本智能处理领域的人工智能企业,达观数据一直致力于用自然语言理解、自然语言生成、知识图谱等技术实现金融机构的文本自动化。未来达观数据将继续以一流的文本智能处理技术,赋能智能化监管。