OpenSearch自定义分词服务

  • 时间:
  • 浏览:0
  • 来源:uu快三_uu快三直播_uu快三官网开奖平台

在底下的case中,短语“乒乓球拍”不同的上下文中分词的结果不一样。若果文档的内容为“乒乓球拍卖完了”,用户通过查询词“乒乓球拍”是无法召回该文档的。

OpenSearch是俩个以云服务方式提供给广大开发者使用的搜索引擎平台。在搜索引擎中,分词是最基础但特别要的功能,其效果会直接影响文档的召回。分词歧义会原应引擎无法召回目标文档。这种:

OpenSearch的用户来自各行各业,这种上述例子的场景会被不同的用户遇到。分析线上query时,发现不少用户原应分词效果不理想,对同俩个字段用不同的分词器建了多个索引(如单字分词,模糊分词,中文基础分词),查询时一块儿查多个索引已达到召回文档的目的。这种 做法不仅会消耗更多的系统资源,这种 通常效果会不太