人肉 SPAM
Update: 我得表明一下立场。在我这里,我对人肉 spam 的定义是:虽然评论和文章内容相关,但是留下的链接不是一个非营利性目的的 Blog 或者个人网站。如果留下的链接是产品推广相关的站点,那更是人肉spam的典型。
配合 Akismet,我这里完全杜绝了俄罗斯人的 spam flood。可是有一种 spam 让我很头痛,那就是中国人肉spam。Wordpress 有很好的自我防御机制,所有评论内包含的链接都会被打上 nofollow 标签。本来这么做可以明显减少以 SEO 为目的的 Spam,同时有效保护自身不因为外部链接遭遇搜索引擎惩罚。可是为什么 spam 还是存在,并且由机械化退回了手工化?
其实都怪百度。当然你也可以怪那些 spammer 越来越聪明,知道任何 anti-spam 插件都不会对人工留言下手。
众所周知,百度不支持 nofollow 标签,不支持 nofollow 标签意味着百度会给所有链接加分。这个结果很让人无奈,人肉 Spammer 很高兴。那么接下来会怎样?如果你的 Blog 莫名其妙被百度 K 掉,请直接怀疑到评论头上。百度就像不分青红皂白的母夜叉,你那里的东西她啥都拿走,发现不好还倒打你一耙。
说穿了,中国人肉 SPAM 旨在针对百度进行 SEO。他们的链接在互联网上出现得越多,百度给他们背后网站的权重就越高。这么下去的话,百度的搜索结果会越来越不公正。在人工干扰搜索结果之后,下一轮就是 SPAM 干扰搜索结果。所以百度已经不能算作一个搜索引擎了。在百度上面,结果往往都是有钱出钱有力出力的产物。你总是需要多翻很多页才能得到自己想要的东西,要是碰上热门关键词,直接点到50页开外可能还有效率一些。
所以,作为 Blogger,要阻断人肉 spammer,首先应该从抵制百度做起。
百度之所以有恃无恐,这和它的市场占有率有关。用的人多,大家对它也就重视。所以才有人捧着钱去做排名,才有人不辞辛劳的在每一个 blog 里灌水。如果有机会,请告诉周围使用电脑的朋友,不要去用百度。咱们直接动摇百度的根基。
抵制的同时,也不要忘了使用武器—— Akismet。
Akismet 很优秀,优秀到其它 anti-spam 插件无法与其媲美的程度。无论给自己的评论框加验证码还是算术题,亦或启用没中文就算 spam 的插件都无法抵御人肉 spam 的进攻,这时我们得指望 akismet 的自动学习功能了。发现属于 spam 性质的评论,请毫不犹豫地标记为 spam。不要担心自己的判断影响到其它人的使用(Akismet 大部分规则通用于所有用户),因为只有当标记这条评论为 spam 的人上升到一定比例,它才会变成真正的 spam。我们都在教 akismet 学习,以便 akismet 为大家服务。难道还有比 Akismet 理念更好的 anti-spam 插件么?没有了。
百度很烂,浑身都是洞,spammer 利用这些洞来实现自己的目的,同时我们的 blog 成了这些 spammer 的垫脚石。如果继续用百度,那就是自己害自己,如果纵容某些模棱两可的评论,那更是被人卖了还帮人数钱。

轮到我了吧,先人肉spam再看文章。友情spam...
用了三个插件,1,就是akismet; 2,some Chinese please, 外文去闪一边去; 3. sofished 人肉删垃圾插件...完美啊, 记得有一次, 一天, 一个人用了N个小时, 人肉发了两百多条评论, 而我费是3分钟, 把他几个小时的工夫的功夫给功夫掉了...总的来说,第三个插件最厉害。
@sofish: 你现在该停用 some chinese please 这个插件了,因为你的blog设计已经红到了国外,万一有老外想赞美你两句怎么办?
我暂时还是不要关掉好了。我设计?我几乎不敢说设计这两个字,不过,还是硬着头皮说。哈哈...
如果有收到邮件,记得告诉我一起...不知道插件起不起作用的....
@sofish: 在这里我当然能收到邮件。。。你是说你那里吗?
@Shawn: 估计是收不了了,因为我刚才@了你。但你没收到。哈哈...@了我自己,也没收到。
@sofish: 我去看了一下,你还是用的 replyTo 么?
重点在这里,点击回复之后产生的代码,要符合触发邮件发送的条件。比如你后台制定的是 @用户名: 的形式,那你就不能删掉冒号。
还有,@用户名: 才能触发,@用户名: 也会无效。
@Shawn: 是的,刚才没有修改。我现在去修改一下,再试试看。
我自己目前写的小插件,屏蔽所有不含中文字符+屏蔽strong+屏蔽href,可以抵制所有机器人spam。人肉的话,国内的基本上是留下几句不痛不痒的话,后面更一个随机数,防止重复发言。
我开始遇到一些,然后把邮箱网址全部黑名单,我那个插件对于黑名单也是直接屏蔽,不写入数据库。
另外,有留下网址的朋友,我直接设定一个就要审核。
现在已经很久没spam了
对了,你的同月热文,以前我也这样,后来发现很不合理。
你看,到了一号就肯定是0,前几天也就那几篇。每月后几号文章就惨了,基本存不住,哈哈。
我后来改了,改成30天内,而不是一个月~
没回复时想看到多点回复,,多了又得预防spam.
@NickyYe: 我怎么觉得更麻烦。。。毕竟现在人肉 spam,除了网址打开以后,基本没有其它特征能够说明他们是在做 spam。而这种 spam 只有人为标记为 spam 才是最便捷的方法。至于屏蔽 href ,对我来说不太方便。。。
你肯定低估我的热文能力了,哈哈。我这里的热文是真正的月度热文,你看看上个月的文章,它们那里的排名不会被冲掉。既是说,每个月都是独立永久存在的。
@iColor: 回复和 spam 是两种东西嘛。
反正不含中文字符的肯定是机器人啦~
这个很方便
你的热文和我思路不同,呵呵
@NickyYe: 我的热文比较实用,
换成 30 天最热的话,以前的文章就被忽略了。
@Shawn: 通过随机文章解决
人肉spam程序是无法避免的,就像你的更新所说,留言的内容确实是正常的,那么程序就无能为力了。只能寄希望于有一个黑名单,凡是留下某个网址的人都进入黑名单中。但是这样又担心有人利用这一点来害人
虽然没看太懂,但我已经从自身做起,不用百度啦
@老所: 那你就看我新写的 SEO 吧,估计能看懂。
所以,这样一下也不会是人肉spam了,哈哈~
@狐狸: 黑名单都是使用 Wordpress + Akismet 的用户共同维护的,只要大家发现一个人肉 spam,标记一个人肉 spam,黑名单很快就完善了。他们建站再廉价,也禁不住大家随手标记 spam 吧。这就是我希望的。
使用wp后,就慢慢的不用百度了!!有时候真觉得国外的东西要比国内的好些!!所以英语很重要啊!!!
现在博客上的中文SPAM,看着是日志评论,打开却是某商业味网站,感觉怪异
@niechen: 呵呵,说的就是这种。很让人无语。
最开始光顾我这的就是spam,还是俄罗斯的,那时我还觉得很奇怪,偶然查了一下我用的域名,居然以前是个俄罗斯的网站……最早的spam我留下来以作纪念 :)
我一般也不去检查每个留下的链接,但是名字太spam的那种,一律删除或者修改链接为google.com
呵呵,其实nofollow还是有作用的。。。。
也辛苦了他们,那可能几小时的“努力”被我们鼠标一轻按就全给解决了..囧
@Shawn: me too 没看懂
@fisio: 以前我也是像你这么干,后来发现 Akismet 可以自动过滤这种了。然后出现了名字没问题但是网址有问题的人肉 spam囧
@时: 百度基本不支持 nofollow,meta robots 更是一点都不支持,我测试过。
你的月度热文功能很不错啊,通过 comments 多少排序,文章数量不足插入随机文章,是这样吗?呵呵。
@Shawn:
不知道你说的支持是什么意思?
我个人感觉是有用的,你可以百度一下自然堂三个字,我的自然堂外部链接基本上都是nofollow。
我正在使用人肉搜索
哈哈
我的Akismet基本上可以把國產人肉也防住……
或者,最厲害的那些還沒找到我的博客?
嗯,我的方法也是Askimet + some Chinese please + 手工,这样感觉比单用某种工具效果好得多,我已经不用百度很久了,它在我的心中没有形象可言……
spam 这个基本很难办。。。
@时: 我的意思是即使你给链接一个 rel="nofollow" 的属性,百度还是会计算这个链接的权重,并且给这个链接加分。
@Centeur: 月度热文我是通过 popular contest 这个插件实现的。这个插件的算法很有意思,不仅仅是评论数那么简单,浏览量、trackback/pingback 都可以量化为一篇文章的分值,综合计算后才是月度热文的最终呈现。
@浮黑: 这两天我也发现很多国产人肉评论被Akismet 挡住了,应该是大家已经开始标记这些评论为 SPAM 了吧。
@ZH CEXO: 我少装一个插件,没装 some chinese please,不过最终效果应该差不多,我老是觉得 SCP 有点不够人性化。。
@醉倚西风: :)
spam是什么东东
@Spoon: 就是广告垃圾
唉,才回来哦,吃了饭休息。
嗯,说的好,无视百度的路过!
@aunsen:
很多时候道高一尺, 魔高一丈, 呵呵, spam信息在网络研究学者眼里简直就是洪水猛兽~
脑残的spammer。做SEO连这些都不知道,还搞毛。
@oxygen: 看来你也被那些 spammer 搞烦了?
@Shawn: 我还好,现在才收到2000多条spam。只是对这种行为表示不理解。
閱讀器現在才抓取到這篇...
百度的洞多着呢...
不过百度对于blog给的权重也不像google那么高~
@孙波: 百度给交钱的权重最高。。。
唉...所以干脆直接禁止了baidu的抓子伸过来得了
@蹲在街角狂笑: 我不小心给禁止了。昨天有朋友和我说,如果把分类目录指定 noindex, follow,百度就不收录单篇文章。。。结果我就是这么干的。
@MY-Hou: 什么阅读器?
鲜果,他们说最近服务器有点问题
@MY-Hou: 鲜果现在不好用了。
好用与否完全是习惯问题,最重要还是稳定...
最近的鲜果让我准备转用GR了
最近我也被人肉spam了。。对于那些在spam边缘的评论,会保留,但是利用AJAX-edt-comment删除链接就OK了。。。
@stephen: 我以前也是删除链接,后来觉得麻烦,直接标记spam
我也来善意的人肉spam, 不过对百度真的有作用,我的实验字眼在百度跑了上去了.