达观动态

达观愿与业内同行分享 助力各企业在大数据浪潮来临之际一起破浪前行

人人都知道的搜索:企业级搜索常见场景介绍

导语

应用的搜索功能,虽然作为信息平台的基础功能一直频繁使用,但又并没有受到特殊关注。针对目前企业内部越来越多的系统,无论是信息检索还是人员部门协同,在海量信息下如何做好信息的检索及整合,提高搜索的效果和效率,企业级搜索应运而生。下面就结合我们具体的项目实例,来聊聊企业级搜索的具体的业务场景。

IM工具搜索场景

IM(Instant Messaging),即是我们常用的聊天工具,作为企业内部沟通管理不可或缺的重要工具,所需要的用到的搜索功能是基础但频繁的。

功能场景描述

对于聊天工具的功能场景主要在于以下几点:
  1. 联系人搜索:使用中英文名,拼音,部门,工号,手机号等定位搜索联系人
  2. 群组搜索:使用群名称,中英文名等定位群组
  3. 聊天记录搜索:使用拼音,内容,文件名等定位聊天记录
  4. 文档搜索:使用文件名,发送人,文件内容等进行文件搜索

 

主要问题点

基于我们日常使用的聊天工具来说,各个功能的体验,我们在微信,QQ等聊天工具上已经有了较好的体验了,并且形成了特定的使用习惯。
一般而言,关于聊天工具的搜索功能我们一般会以此类聊天工具也标准,一方面保留当前的常用功能,保证日常功能使用。另一方面延续用户使用的搜索习惯。主要的问题点主要有两个方面:
  1. 整体搜索功能的整合:对单独部分的功能来说(联系人、群组搜索、高亮等),功能实现并没有太大的难点。对此而言,而最大的难点在于对所有搜索结果的整合排序。随着产品对用户体验的追求越来越高,导致实际用户在使用过程中无法快速定位找到自己想要的内容。
  2. 实时的搜索反馈:企业内部的搜索与互联网搜索的关键区别就在于实时性的提现。在百度或者Google从网页的爬取到用户可以搜索到是有一定时间间隔的,用户在搜索的时候即使搜索不到也不会有什么抱怨。但在企业搜索场景中,刚发出的消息,刚创建的群组如果搜索不到的话会让人觉得无法接受。

需要做些什么

对于内容的聚合搜索来说,达观搜索平台基于多维度的精准排序算法,细化到个人的排序,以及根据用户行为数据不断优化搜索排序,以保证最终搜索结果符合用户需要,帮助用户快速定位到所需内容。
pic_001
关于海量数据下的实时反馈,达观采用“垂直分层+水平分层”的方式来进行请求以及信息的分流,以保证近实时的搜索结果反馈,保证用户的搜索体验。

内部信息平台搜索场景

对于大部分企业来说,随着公司业务的发展壮大,信息的产生也越来越多。越来越多的系统,如OA、CRM甚至ERP。为了减少资源内耗,于是会通过专门的信息平台来支撑部门间的信息共享以及问答。对于信息平台的使用,搜索作为一个核心的功能,深度影响着用户的使用以及结果。
pic_002

场景描述

结合我们的具体项目实例,主要集中在以下的功能场景:
  1. 多语言搜索:搜索内容可以对现有及后续增加搜索语种的支持
  2. 模糊搜索:搜索时可以再精准搜索与模糊搜索间的切换
  3. 同义词搜索:搜索时需要支持对于同类词语的通用搜索
  4. 违禁词搜索:搜索过程中对于敏感词禁止搜索
  5. 标准词搜索:对于部分词进行无分词(整体)搜索(例如“NIKE”不将NIKE拆分搜索)
  6. 文档搜索:搜索时可以对内部文档的标题及内容搜索
  7. 应用模块搜索:可以通过搜索直接查找相关应用。

需要做些什么

根据不同客户,不同业务场景,需要的功能也是不同的。为了满足前台用户搜索的需求,一个功能强大的搜索平台是必不可少的。
pic_003
内容多了以后,搜索的功能配置管理变得至关重要了,根据以上提到的功能场景,在众多功能的混合下,如何做好搜索结果的排序是至关重要的,关于排序的优化常用的有两个实现的方向:
  1. 通过不同用户的搜索行为记录(包括但不限于,搜索词、浏览、点击等),结合用户的搜索输入与最终搜索的结果,已优化后续用户的搜索体验
  2. 结合企业内部的一些规章制度,以及运营推广,需要提供人工操作的入口,以保证整体搜索基础质量,以及公司的规章底线。

 

pic_004
结合“自动优化+人工调整“的方式,我们可以更精确,更快速的找到自己想要的内容。同时也可以更好的把控搜索的结果和方向。

搜索系统拓展场景

功能场景描述

随着公司发展,内部的平台、系统数量的增加,会面临以下两个问题:
  1. 不同平台/系统的搜索效果参差不齐
  2. 不同系统没法进行共通的统一搜索维护
在这样的场景下,通常需要的是一个可以方便拓展对接,方便维护的搜索平台。
pic_005

主要问题点

公司接入的系统五花八门,同时对于未来要接入的系统无论是功能层面,使用层面都不确定,我们要处理的便是如何更有前瞻性的做好搜索的复用,即如何做好后续其他系统的搜索接入。对于这种场景主要考虑的有两点:
  1. 多业务线不同的数据及字段该接入
  2. 后续不同业务线如何进行维护

需要做些什么

对于不同系统来说,搜索的内容,字段等,或多或少都有些区别。达观搜索服务,针对不同客户,不同业务线,不同应用,不同场景的搜索处理有着丰富的经验。通过“标准+个性化配置”字段的方式。统一通过可配置接口进行对接,满足不同需要。
pic_006
解决了不同系统的接入问题,还有一个就是要解决不同应用的维护问题。达观搜索对于不同应用间的功能,字段,数据,索引等都做了分离,方便不同系统间的使用维护,使得不同系统间相互无影响。

总结

当然上面描述的只是我们在具体项目落地过程中所遇到的一些具有代表性的搜索场景。实际还有很多结合多种应用的搜索场景,如结合权限的文档、图片、视频的搜索,进行纠正式的问答搜索等等。
通过对企业中散落在各系统的数据、内容进行统一管理和高效利用,使用者可以对企业中的数据、文档、人物、图片、表格等信息进行全方位,以及更高效率的检索。