一站式百度SEO排名优化!-找老刘博客 低投入,高转化,精益求精、一丝不苟:旨在提供更好的SEO服务!

首页>>SEO问题

谈谈内容优化中的敏感词过滤问题

首页 2020-09-28 SEO问题 1917 ℃Tags:


为了维稳和方便管理,国内几乎所有的网站、论坛都会进行了关于敏感词的设定。所以不管是我们是做软文推广还是发视频,都会特别注意敏感词,以防文章或者帖子不能发表,或者发表后自动删除,甚至被封号。因此,做SEO也不能忽略敏感词过滤。SEO优化有哪些违规词?有哪些过滤技术和技巧是本文要讲述的重点。


谈谈内容优化中的敏感词过滤问题

一、SEO优化中的敏感词


首先是,违反国家规定的词。比如设计游戏类、灰色产业类、封建迷信等等。举个前段时间的一个段子,某个记者写了篇文字,里面引用顾城的“黑夜总会过去,光明才是永恒”引发了过滤机制,“究竟哪个词触发的,是黑夜还是光明?”记者愤怒地质问,最后答复——是黑后面的三个字...


然后是,百度打击的行业,医疗、金融、交友(分性质)等;


当然,还有些百度会收录,但是难以获得好的排名的词汇,比如政治,除此以外还有价钱、交易等等,所以,你知道为什么企业网站权重不好提升了吧?


二、敏感词过滤的方法


这里,列几个通过程序代码实现敏感词过滤的办法,只是简单介绍,具体代码还需要各位自己查找。


1、replace过滤


当一串字符串中有可能会出现的敏感词时,我们直接使用相应的replace方法用*替换出敏感词即可。


2、正则表达式过滤


使用“|”来分割多个敏感词进行匹配,类似re.sub("|".join(keywords), "***", text)


3、利用DFA过滤算法


即Deterministic Finite Automaton算法,它的基本思想是基于状态转移来检索违规词,它是比较常用的过滤手段。


4、AC自动机


就是在tire树(又称前缀树,字典树)的基础上,增加一个fail指针,如果当前点匹配失败,则将指针转移到fail指针指向的地方,一路匹配下去。


如果,各位不熟悉代码,可以采用人工审核的办法,然后将敏感词被字母缩写,或者被读音相近的字、或者星号(*)或叉号(X)等符号替代。


最后,笔者搜到一个百度违规词检测工具,如果有需要的话可以留言SEO违规词检测工具。


搜索
分类
热门标签
  • 首页
  • 电话
  • QQ
  • 联系老刘手机
    1043025812
    联系老刘微信
    扫描微信二维码