敏感词过滤 / 表格黑名单清洗

上传 CSV、TSV、TXT 或 XLSX 文件,粘贴一行一个黑名单词,工具会在浏览器本地扫描每一行;只要当前行任意单元格包含黑名单词,就过滤到「命中行」,其余保留到「过滤后结果」。文件和敏感词均不上传服务器。

上传文件 行数 0 · 大小 0
过滤第 例如列号 3,第三列非空且不包含中文,或第三列为空时过滤整行
就绪
黑名单词(一行一个) 词数 0 · 字符 0
过滤后结果(未命中过滤条件) 行数 0 · 字符 0
被过滤行(命中黑名单/列条件) 行数 0 · 字符 0

敏感词过滤功能特性

  • 支持 CSVTSVTXTXLSX 文件
  • 黑名单词一行一个,几万个词也能快速匹配
  • 命中任意黑名单词即过滤整行,自动分离保留行和命中行
  • 纯前端本地处理,文件内容和敏感词不上传服务器

适用场景

  • SEO 数据清洗:从关键词、标题、描述、URL 表格中过滤品牌词、违规词或广告词。
  • 内容审核:批量检查 Excel/CSV 文案,只要一行包含黑名单词就单独输出复核。
  • 客户数据整理:按邮箱、电话、备注、来源字段中的敏感词过滤不合规记录。
  • 域名清单排除:用黑名单品牌词、行业词或风险词快速剔除整行域名记录。

常见问题 FAQ

1. 黑名单词很多会不会很慢?

不会按「行数 × 词数」逐个搜索。工具会先把黑名单构建成多模式匹配自动机,再逐行扫描,适合几万黑名单词和大表格数据。

2. 文件会上传服务器吗?

不会。文件解析、敏感词匹配、结果生成全部在浏览器 Web Worker 中完成。

3. XLSX 支持哪些内容?

支持常见 .xlsx 工作簿的第一个工作表,文本、数字、共享字符串和内联字符串都会转成 CSV 输出。老式二进制 .xls 不在本工具支持范围内。

4. 「保留首行表头」是什么意思?

勾选后第一行无论是否包含黑名单词都会进入过滤后结果,适合带表头的 CSV/Excel 文件。

5. 按列过滤的列号怎么算?

列号从 1 开始。填写 3 表示第三列;选择「过滤 非中文(英文等)」后,如果第三列内容非空且不包含中文汉字,就过滤当前整行。选择「过滤空行」时会过滤第三列为空的整行。