分析下最近的垃圾评论的特点

本博客自建站以来,总是受到很多机器人评论,以前总是使用手工删除法,但是越来越多的垃圾评论根本删不完,甚至还把正常的评论给删除了。所以为了使用垃圾过滤插件,我分析了下最近的垃圾评论特点。

开学之前最后一水

140多条,一个月,一个站点。

以下典例关键处已打码。

典例1

Williamsauth
*e**d.k****[email protected]
185.2.32.2

как взломать корпоративную почту - взлом маил, взлом маил

这种俄语的评论很好屏蔽,只要正则里面匹配下几个俄文字符就可以了,不过会误杀一些颜文字,这个没办法。

典例2

Duanefig
izabella.c*****[email protected]
91.200.80.2

check location of map my phone - mobile number location, mobile number location

英语,打广告。这种就要排除纯英文的评论,虽然会误杀,也只能这样了。

其实你看他们的邮箱,都是mail.ru,所以可以直接屏蔽该邮箱地址评论就可以了。

(现在外国人这么反智么,还手机号码位置定位……)

典例3

huxrge
aksfezapw@can***ans.biz
185.71.2.189

legitimate online pharmacy cialis http://c****n.com
http://ci***sn.com - order cialis in usa

relxkt
lurerh@can***ne.biz
185.223.161.158

viagra online bestellen ohne rezept schweiz
http://can****n-phar***e.com order viagra 50mg

这种药品推销的,只要屏蔽药品关键词就行了

(伟哥、犀利士都是什么鬼……这些破广告还发我网站上真是够了)

典例4

HloWew
al**[email protected]
178.159.37.146

Hey! My name E***. Do you wanna to make sex ? Write to me. http://bit.ly/*

这种广告可以屏蔽短网址域名关键词。

(外国约炮这么开放么……钩直耳咸。)

典例5

Fastest Payday Loan
g**@pochtar.men
5.188.210.4

lender payday loans no credit checks lender lender

高利贷……直接屏蔽loan就行了。

总结

大多数IP来自俄罗斯。
大多数评论的网址都是违背法律的。
大多数评论中不含有中文,且昵称为随机生成的字符。

屏蔽可以从以下方面入手:

  1. 昵称关键词
  2. 昵称长度
  3. 邮箱域名
  4. 邮箱关键词
  5. 网址关键词
  6. 评论关键词
  7. 针对性语言屏蔽
  8. IP封禁

总的来说,为什么会有如此多的垃圾评论?他们使用色情链接填写评论地址,降低你网站的权重,浪费你的时间,推广他们的广告。

抵制垃圾评论,从我做起。

本文距离最后一次更新已超过180天,部分内容可能会随着时间的推移变更或失效。

已有 9 条评论
  1. 梁梁

    哈哈哈。有♂趣有♂趣

    梁梁 | | Windows 10 x64 Edition | Google Chrome 61.0.3163.79
  2. terrytao

    ip封禁显然是没有多大效果,全球那么多ip,可不能一个一个封!!

    terrytao 老司机 | | Windows 10 x64 Edition | Google Chrome 74.0.3729.108
    1. Jimmy Ho

      @terrytao

      尤其是即将普及的IPv6,根本封不完的。

      Jimmy Ho 萌萌哒博主 | | Windows 10 x64 Edition | Google Chrome 73.0.3683.103
  3. LingC

    直接设置评论必须要带中文就行了

    LingC 友链认证 | | Windows 10 x64 Edition | Google Chrome 68.0.3440.106
    1. Jimmy Ho

      @LingC

      万一有国外网友评论呢?(虽然这是幻想)

      Jimmy Ho 萌萌哒博主 | | Windows 10 x64 Edition | Google Chrome 68.0.3440.106
  4. 大致

    原生的comment真的是很脆弱,改成ajax,然后把wp-comments-post删掉是种很好的手段,可以防掉95%以上的自动评论。要是再把关键的输入框ID改掉的话,几乎100%了。
    人肉的就没好办法了。

    大致 | | Windows 7 x64 Edition | Firefox 61.0
    1. Jimmy Ho

      @大致

      id一改浏览器自动填表是不是就废了呀
      那样不方便自然人,一网打尽不是好办法

      Jimmy Ho 萌萌哒博主 | | Windows 10 x64 Edition | Google Chrome 68.0.3440.106
  5. Terry

    就没看到什么垃圾评论!!

    Terry 老司机 | | Windows 10 x64 Edition | Google Chrome 68.0.3440.106
    1. Jimmy Ho

      @Terry

      这是一个垃圾评论示例。

      Jimmy Ho 萌萌哒博主 | | Windows 10 x64 Edition | Google Chrome 68.0.3440.84

此处无声胜有声