从一个模糊词查询需求的处理方案讨论到一种极速匹配方案的实现
## 背景 >两年多前的一天(2018年的某天),我们的产品经理突然找到我,说我们的广告业务上线后效果不错,但是需要做敏感词过滤处理,需要接入一个模糊词词典和一个精确词词典。然后我拿到了这两份词典,两份违禁词加起来总量近100w条。 > >这个需求简单来说就是如果用户的查询词中命中了违禁词的话是不能出广告的。如:用户query=怎么去故宫博物院,因为命中了故宫博物院,所以不能出广告。 >最终我合并了这两份词表,并写了一个高效的实现。 > >今天打算就其中的模糊匹配部分单独抽出来讨...阅读全文