人肉 SPAM

Update: 我得表明一下立场。在我这里,我对人肉 spam 的定义是:虽然评论和文章内容相关,但是留下的链接不是一个非营利性目的的 Blog 或者个人网站。如果留下的链接是产品推广相关的站点,那更是人肉spam的典型。

配合 Akismet,我这里完全杜绝了俄罗斯人的 spam flood。可是有一种 spam 让我很头痛,那就是中国人肉spam。Wordpress 有很好的自我防御机制,所有评论内包含的链接都会被打上 nofollow 标签。本来这么做可以明显减少以 SEO 为目的的 Spam,同时有效保护自身不因为外部链接遭遇搜索引擎惩罚。可是为什么 spam 还是存在,并且由机械化退回了手工化?

其实都怪百度。当然你也可以怪那些 spammer 越来越聪明,知道任何 anti-spam 插件都不会对人工留言下手。

众所周知,百度不支持 nofollow 标签,不支持 nofollow 标签意味着百度会给所有链接加分。这个结果很让人无奈,人肉 Spammer 很高兴。那么接下来会怎样?如果你的 Blog 莫名其妙被百度 K 掉,请直接怀疑到评论头上。百度就像不分青红皂白的母夜叉,你那里的东西她啥都拿走,发现不好还倒打你一耙。

说穿了,中国人肉 SPAM 旨在针对百度进行 SEO。他们的链接在互联网上出现得越多,百度给他们背后网站的权重就越高。这么下去的话,百度的搜索结果会越来越不公正。在人工干扰搜索结果之后,下一轮就是 SPAM 干扰搜索结果。所以百度已经不能算作一个搜索引擎了。在百度上面,结果往往都是有钱出钱有力出力的产物。你总是需要多翻很多页才能得到自己想要的东西,要是碰上热门关键词,直接点到50页开外可能还有效率一些。

所以,作为 Blogger,要阻断人肉 spammer,首先应该从抵制百度做起。

百度之所以有恃无恐,这和它的市场占有率有关。用的人多,大家对它也就重视。所以才有人捧着钱去做排名,才有人不辞辛劳的在每一个 blog 里灌水。如果有机会,请告诉周围使用电脑的朋友,不要去用百度。咱们直接动摇百度的根基。

抵制的同时,也不要忘了使用武器—— Akismet。

Akismet 很优秀,优秀到其它 anti-spam 插件无法与其媲美的程度。无论给自己的评论框加验证码还是算术题,亦或启用没中文就算 spam 的插件都无法抵御人肉 spam 的进攻,这时我们得指望 akismet 的自动学习功能了。发现属于 spam 性质的评论,请毫不犹豫地标记为 spam。不要担心自己的判断影响到其它人的使用(Akismet 大部分规则通用于所有用户),因为只有当标记这条评论为 spam 的人上升到一定比例,它才会变成真正的 spam。我们都在教 akismet 学习,以便 akismet 为大家服务。难道还有比 Akismet 理念更好的 anti-spam 插件么?没有了。

百度很烂,浑身都是洞,spammer 利用这些洞来实现自己的目的,同时我们的 blog 成了这些 spammer 的垫脚石。如果继续用百度,那就是自己害自己,如果纵容某些模棱两可的评论,那更是被人卖了还帮人数钱。

Tag(s):
  • QQ书签
  • Del.icio.us
  • 百度收藏
  • Google
  • 饭否
  • FriendFeed
Shawn Published@11:45 / 2008-11-01 / Trackback / Skip
39 Comments Contributed by Visitors
  1. rebuttonsofish / 11:50@2008-11-01 1
    sofish

    轮到我了吧,先人肉spam再看文章。友情spam...

  2. rebuttonsofish / 11:55@2008-11-01 2
    sofish

    用了三个插件,1,就是akismet; 2,some Chinese please, 外文去闪一边去; 3. sofished 人肉删垃圾插件...完美啊, 记得有一次, 一天, 一个人用了N个小时, 人肉发了两百多条评论, 而我费是3分钟, 把他几个小时的工夫的功夫给功夫掉了...总的来说,第三个插件最厉害。

  3. rebuttonShawn / 11:57@2008-11-01 3
    Shawn

    @sofish: 你现在该停用 some chinese please 这个插件了,因为你的blog设计已经红到了国外,万一有老外想赞美你两句怎么办?

  4. rebuttonsofish / 12:53@2008-11-01 4
    sofish

    我暂时还是不要关掉好了。我设计?我几乎不敢说设计这两个字,不过,还是硬着头皮说。哈哈...

    如果有收到邮件,记得告诉我一起...不知道插件起不起作用的....

  5. rebuttonShawn / 12:56@2008-11-01 5
    Shawn

    @sofish: 在这里我当然能收到邮件。。。你是说你那里吗?

  6. rebuttonsofish / 13:00@2008-11-01 6
    sofish

    @Shawn: 估计是收不了了,因为我刚才@了你。但你没收到。哈哈...@了我自己,也没收到。

  7. rebuttonShawn / 13:07@2008-11-01 7
    Shawn

    @sofish: 我去看了一下,你还是用的 replyTo 么?
    重点在这里,点击回复之后产生的代码,要符合触发邮件发送的条件。比如你后台制定的是 @用户名: 的形式,那你就不能删掉冒号。
    还有,@用户名: 才能触发,@用户名: 也会无效。

  8. rebuttonsofish / 13:14@2008-11-01 8
    sofish

    @Shawn: 是的,刚才没有修改。我现在去修改一下,再试试看。

  9. rebuttonNickyYe / 13:14@2008-11-01 9
    NickyYe

    我自己目前写的小插件,屏蔽所有不含中文字符+屏蔽strong+屏蔽href,可以抵制所有机器人spam。人肉的话,国内的基本上是留下几句不痛不痒的话,后面更一个随机数,防止重复发言。
    我开始遇到一些,然后把邮箱网址全部黑名单,我那个插件对于黑名单也是直接屏蔽,不写入数据库。
    另外,有留下网址的朋友,我直接设定一个就要审核。
    现在已经很久没spam了

  10. rebuttonNickyYe / 13:15@2008-11-01 10
    NickyYe

    对了,你的同月热文,以前我也这样,后来发现很不合理。
    你看,到了一号就肯定是0,前几天也就那几篇。每月后几号文章就惨了,基本存不住,哈哈。
    我后来改了,改成30天内,而不是一个月~

  11. rebuttoniColor / 13:16@2008-11-01 11
    iColor

    没回复时想看到多点回复,,多了又得预防spam. :???:

  12. rebuttonShawn / 13:29@2008-11-01 12
    Shawn

    @NickyYe: 我怎么觉得更麻烦。。。毕竟现在人肉 spam,除了网址打开以后,基本没有其它特征能够说明他们是在做 spam。而这种 spam 只有人为标记为 spam 才是最便捷的方法。至于屏蔽 href ,对我来说不太方便。。。
    你肯定低估我的热文能力了,哈哈。我这里的热文是真正的月度热文,你看看上个月的文章,它们那里的排名不会被冲掉。既是说,每个月都是独立永久存在的。

  13. rebuttonShawn / 13:34@2008-11-01 13
    Shawn

    @iColor: 回复和 spam 是两种东西嘛。

  14. rebuttonNickyYe / 13:46@2008-11-01 14
    NickyYe

    反正不含中文字符的肯定是机器人啦~
    这个很方便
    你的热文和我思路不同,呵呵

  15. rebuttonShawn / 13:55@2008-11-01 15
    Shawn

    @NickyYe: 我的热文比较实用, :grin:
    换成 30 天最热的话,以前的文章就被忽略了。

  16. rebuttonNickyYe / 14:56@2008-11-01 16
    NickyYe

    @Shawn: 通过随机文章解决 :lol:

  17. rebutton狐狸 / 15:41@2008-11-01 17
    狐狸

    人肉spam程序是无法避免的,就像你的更新所说,留言的内容确实是正常的,那么程序就无能为力了。只能寄希望于有一个黑名单,凡是留下某个网址的人都进入黑名单中。但是这样又担心有人利用这一点来害人

  18. rebutton老所 / 15:54@2008-11-01 18
    老所

    虽然没看太懂,但我已经从自身做起,不用百度啦 :lol:

  19. rebuttonShawn / 16:00@2008-11-01 19
    Shawn

    @老所: 那你就看我新写的 SEO 吧,估计能看懂。

  20. rebuttonzenlo / 16:04@2008-11-01 20
    zenlo

    所以,这样一下也不会是人肉spam了,哈哈~

  21. rebuttonShawn / 16:33@2008-11-01 21
    Shawn

    @狐狸: 黑名单都是使用 Wordpress + Akismet 的用户共同维护的,只要大家发现一个人肉 spam,标记一个人肉 spam,黑名单很快就完善了。他们建站再廉价,也禁不住大家随手标记 spam 吧。这就是我希望的。

  22. rebuttonxiaorsz / 17:23@2008-11-01 22
    xiaorsz

    使用wp后,就慢慢的不用百度了!!有时候真觉得国外的东西要比国内的好些!!所以英语很重要啊!!!

  23. rebuttonniechen / 18:05@2008-11-01 23
    niechen

    现在博客上的中文SPAM,看着是日志评论,打开却是某商业味网站,感觉怪异

  24. rebuttonShawn / 18:07@2008-11-01 24
    Shawn

    @niechen: 呵呵,说的就是这种。很让人无语。

  25. rebuttonJoBru / 20:43@2008-11-01 25
    JoBru

    最开始光顾我这的就是spam,还是俄罗斯的,那时我还觉得很奇怪,偶然查了一下我用的域名,居然以前是个俄罗斯的网站……最早的spam我留下来以作纪念 :)

  26. rebuttonfisio / 21:59@2008-11-01 26
    fisio

    我一般也不去检查每个留下的链接,但是名字太spam的那种,一律删除或者修改链接为google.com

  27. rebutton / 22:10@2008-11-01 27
    时

    呵呵,其实nofollow还是有作用的。。。。

  28. rebuttonMY-Hou / 22:16@2008-11-01 28
    MY-Hou

    也辛苦了他们,那可能几小时的“努力”被我们鼠标一轻按就全给解决了..囧

  29. rebuttonSnow / 23:06@2008-11-01 29
    Snow

    @Shawn: me too 没看懂

  30. rebuttonShawn / 1:20@2008-11-02 30
    Shawn

    @fisio: 以前我也是像你这么干,后来发现 Akismet 可以自动过滤这种了。然后出现了名字没问题但是网址有问题的人肉 spam囧

  31. rebuttonShawn / 1:22@2008-11-02 31
    Shawn

    @时: 百度基本不支持 nofollow,meta robots 更是一点都不支持,我测试过。

  32. rebuttonCenteur / 8:11@2008-11-02 32
    Centeur

    你的月度热文功能很不错啊,通过 comments 多少排序,文章数量不足插入随机文章,是这样吗?呵呵。 :?:

  33. rebutton / 9:06@2008-11-02 33
    时

    @Shawn: 
    不知道你说的支持是什么意思?
    我个人感觉是有用的,你可以百度一下自然堂三个字,我的自然堂外部链接基本上都是nofollow。

  34. rebutton醉倚西风 / 10:59@2008-11-02 34
    醉倚西风

    我正在使用人肉搜索
    哈哈 :sad:

  35. rebutton浮黑 / 11:28@2008-11-02 35
    浮黑

    我的Akismet基本上可以把國產人肉也防住……
    或者,最厲害的那些還沒找到我的博客?

  36. rebuttonZH CEXO / 12:57@2008-11-02 36
    ZH CEXO

    嗯,我的方法也是Askimet + some Chinese please + 手工,这样感觉比单用某种工具效果好得多,我已经不用百度很久了,它在我的心中没有形象可言……

  37. rebutton任平生 / 13:31@2008-11-02 37
    任平生

    spam 这个基本很难办。。。

  38. rebuttonShawn / 14:17@2008-11-02 38
    Shawn

    @时: 我的意思是即使你给链接一个 rel="nofollow" 的属性,百度还是会计算这个链接的权重,并且给这个链接加分。

  39. rebuttonShawn / 14:20@2008-11-02 39
    Shawn

    @Centeur: 月度热文我是通过 popular contest 这个插件实现的。这个插件的算法很有意思,不仅仅是评论数那么简单,浏览量、trackback/pingback 都可以量化为一篇文章的分值,综合计算后才是月度热文的最终呈现。

  40. rebuttonShawn / 14:22@2008-11-02 40
    Shawn

    @浮黑: 这两天我也发现很多国产人肉评论被Akismet 挡住了,应该是大家已经开始标记这些评论为 SPAM 了吧。

  41. rebuttonShawn / 14:23@2008-11-02 41
    Shawn

    @ZH CEXO: 我少装一个插件,没装 some chinese please,不过最终效果应该差不多,我老是觉得 SCP 有点不够人性化。。

  42. rebuttonShawn / 14:23@2008-11-02 42
    Shawn
  43. rebuttonSpoon / 17:43@2008-11-02 43
    Spoon

    spam是什么东东 :?:

  44. rebuttonShawn / 18:05@2008-11-02 44
    Shawn

    @Spoon: 就是广告垃圾

  45. rebuttonleehow / 18:48@2008-11-02 45
    leehow

    唉,才回来哦,吃了饭休息。

  46. rebuttonaunsen / 19:14@2008-11-02 46
    aunsen

    嗯,说的好,无视百度的路过!

  47. rebuttonShawn / 21:21@2008-11-02 47
    Shawn
  48. rebutton火星基地 / 17:00@2008-11-03 48
    火星基地

    很多时候道高一尺, 魔高一丈, 呵呵, spam信息在网络研究学者眼里简直就是洪水猛兽~ :-D

  49. rebuttonoxygen / 18:01@2008-11-03 49
    oxygen

    脑残的spammer。做SEO连这些都不知道,还搞毛。

  50. rebuttonShawn / 18:04@2008-11-03 50
    Shawn

    @oxygen: 看来你也被那些 spammer 搞烦了?

  51. rebuttonoxygen / 18:05@2008-11-03 51
    oxygen

    @Shawn: 我还好,现在才收到2000多条spam。只是对这种行为表示不理解。

  52. rebuttonMY-Hou / 18:45@2008-11-03 52
    MY-Hou

    閱讀器現在才抓取到這篇... :?:

  53. rebutton孙波 / 13:32@2008-11-05 53
    孙波

    百度的洞多着呢...
    不过百度对于blog给的权重也不像google那么高~

  54. rebuttonShawn / 14:39@2008-11-05 54
    Shawn

    @孙波: 百度给交钱的权重最高。。。

  55. rebutton蹲在街角狂笑 / 20:47@2008-11-05 55
    蹲在街角狂笑

    :???: 话说什么事只要中国人民想搞...基本没有搞不定的...我们人就是多阿...
    唉...所以干脆直接禁止了baidu的抓子伸过来得了

  56. rebuttonShawn / 20:50@2008-11-05 56
    Shawn

    @蹲在街角狂笑: 我不小心给禁止了。昨天有朋友和我说,如果把分类目录指定 noindex, follow,百度就不收录单篇文章。。。结果我就是这么干的。

  57. rebuttonShawn / 22:14@2008-11-05 57
    Shawn

    @MY-Hou: 什么阅读器?

  58. rebuttonMY-Hou / 0:53@2008-11-06 58
    MY-Hou

    鲜果,他们说最近服务器有点问题

  59. rebuttonShawn / 0:56@2008-11-06 59
    Shawn

    @MY-Hou: 鲜果现在不好用了。

  60. rebuttonMY-Hou / 1:03@2008-11-06 60
    MY-Hou

    好用与否完全是习惯问题,最重要还是稳定...
    最近的鲜果让我准备转用GR了

  61. rebuttonstephen / 21:43@2008-11-07 61
    stephen

    最近我也被人肉spam了。。对于那些在spam边缘的评论,会保留,但是利用AJAX-edt-comment删除链接就OK了。。。

  62. rebuttonShawn / 21:51@2008-11-07 62
    Shawn

    @stephen: 我以前也是删除链接,后来觉得麻烦,直接标记spam

  63. rebutton无聊空间 / 2:06@2008-11-23 63
    无聊空间

    我也来善意的人肉spam, 不过对百度真的有作用,我的实验字眼在百度跑了上去了.

Leave Comments Here...

必填

必填&保密

随您

支持Ctrl+Enter快捷提交

  • 已部署"白忙活" Anti-Spam 系统,猪肉 Spammer 请注意查看源代码链接处。
  • 本站不会泄露您的邮件地址,敬请放心。
  • 支持常用 HTML 代码调用,插入 PHP 代码需注意:< = &lt;> = &gt;
  • 仅当某人针对您的评论做出回应时,您才会收到由本站发出的通知信件。
  • 如您希望以相同方式通知某位网友,请点击 Reply 按钮,或自行输入 @对方名字:
  • 鼠标移至评论列表中的 @someone: 区域即可自动显示 someone 的评论内容。

Shawn Blog

Shawn的个人博客(Blog),分享Wordpress技巧和Firefox浏览器心得,关注Web 2.0应用发展,记录对虚拟主机的使用评价。