关于敏感词过滤，有哪些高效的解决方案

敏感词过滤，一个很经典的需求场景，目前我要对一个每天上千万消息的聊天系统做敏感词过滤优化，之前的解决方案是，每次从redis中取出敏感词集合，然后做遍历操作，使用indexOf查看是否出现在聊天消息中，鉴于消息的高频转发，所以每次从redis中读取敏感词库方案已经不太适用该场景，经过调研和请教有以下两个解决方案可够参考： 1、将redis中的敏感词库在服务启动时，加载到内存中，后续逻辑不变； 2、同样将敏感词库读到内存，不同之处在于使用bloom-filter算法，将敏感词打散到内存位数组中，每次将消息放进去看是否匹配到；优劣分析：方案一可以节约redis读取的耗时，提高每次的处理效率，但是鉴于node单个进程珍贵的1.4G内存，如果敏感词库很大的情况下，不太适用；方案2在方案1的基础上，不仅提高了处理效率，同时大大减少了内存消耗，但缺点很明显，如果聊天消息中包含敏感词之外其他的内容，将对结果造成很大程度的误判；综上，目前我比较偏向于方案2，如果有更好的方案，请大家积极分享；毕竟作为一个经典需求场景应该会有很多人遇到，希望能够帮助到大家；

关于敏感词过滤，有哪些高效的解决方案

Trending Articles

《沈冰自述——我和周永康的故事》全本

Moog - Subsequent 25

出售: 林憶蓮•回來愛的身邊 (東芝1A1頭版)

筆記 - 使用 PowerShell 清除停用 AD 帳號與 OU

df-dferh-01 中国区 Android 安装 Google Play Store 后报错的解决办法

「一棒接一棒、棒棒強棒」108學年度家長會長交接典禮

吸烟与MBTI类型判断捷径 (豆瓣 INFJ的奇幻之旅小组)

acermark龍璿國際展出多款包裝設備

枋寮北勢寮隆山宮睽違12年再辦迎王祭典

日本女优有村千佳COS集锦：狂三&黑白岩&亚丝娜&绫波丽

有遇到过这个问题么。/jsb-videoplayer.js not found, possible missing file.

MAS v2.8 magicgenius 汉化版 - 11.11更新

出售: Monster Cable Interlink Reference 2

福建佛教人士望云和尚(林斌)的九仙禅寺被强行收走，望云妈妈被赶出寺庙

R 语言中的OpenBLAS*和英特尔® 数学核心函数库的性能比较

[转载]煞貢、直星、人專吉日\金神七煞歌

HAKERS哈克士戶外 12月8~14日廠拍

OBS Studio 23.2.1 免安裝中文版 - 免費網路實況廣播軟體實況主必備軟體取代Fraps

<請教>行駛中安卓機會重新開機

Udp2raw-tunnel 及其一键安装脚本