作为全球领先的综合通信解决方案提供商,2016年,中兴通讯的营业收入已超越千亿元大关,为全球160多个国家和地区的电信运营商和企业网客户提供创新技术与产品解决方案。
作为一家创新驱动的企业,中兴在美国、法国、瑞典、印度及中国等地共设有20个全球研发机构,共有3万余名研发人员专注于行业技术创新。仅以去年为例,中兴PCT国际专利申请三度夺冠,并以19亿美元年度研发投入位居”全球创新企业70强”与”全球ICT企业50强”。目前中兴拥有6.8万余件全球专利申请、已授权专利超过2.8万件。
不过,对于中兴通讯这样的巨头来说,在漫长的业务链条上不可能在每个领域都做得特别精深。对于每天上亿的日志信息如何进行高效的处理和挖掘,就是令中兴方面头疼的一个问题。
为了解决这个问题,中兴的技术部门尝试过使用传统方法,通过构建索引来方便搜索,但是效果不佳。面对上亿的日志量,不仅需要每秒构建上万的索引,而且要合理地进行压缩、优化硬件资源的利用效率,同时还要识别多样化的搜索意图,进行高效匹配,技术难点很多,每一个点都需要系统性的专业解决方案。
作为国内领先的文本挖掘服务提供商,达观数据在这方面的强大技术实力引起了中兴方面的关注。达观数据后台的文本语义理解引擎能够高效地挖掘出文本中有价值的信息,识别用户的搜索意图,通过搜索提示、自动纠错等功能提供个性化的搜索体验。针对中兴方面的具体业务需求,达观数据还为其开发了根据多种数据类型筛选搜索结果的定制服务。“达观数据是文本挖掘方面的专家,和他们一起合作后,日志分析的效果远超过我们的预期!”中兴方面的一位负责人表示。
企业数据后台中数以万亿计的日志文本是一块远未得到开垦的“处女地”,但是要在这块土壤上浇灌出累累的硕果需要强大的算法实力。达观数据和中兴通讯在日志信息文本挖掘方面的合作为文本挖掘类企业服务的商业应用树立了一个标杆性的案例。