D-haha 的情侣博客 » 点滴过往 » 和 SPAM 战斗 (聊聊 Z-blog 之二)
不过乱侃却让事情有了意想不到的变化 ---- 我成为了[插件与扩展]的版主. 实际上, Z-blog 论坛是我第二个发过贴的论坛 (如果学校那种实名的垃圾论坛不算的话) , 怎么当版主根本就心理没数. 虽然想当又不敢答应, 直到看到 Zx.MYS 顶在了前面, 率先成为了这一版的版主.
我对程序根本没什么兴趣, 起码不如 Flash, PS 什么的. 只是03年搞了个 ASP 的网站, 为了改起来不麻烦才陆续学了点 VB. 我数学实在是不好, 算法复杂一点儿我头就大, 所以敲点儿代码只能算是业余爱好中的业余爱好.
由于 SPAM 是我从 LBS 转到 Z-blog 的重要原因, 因此用上 Z-blog 后, SPAM 就成了我最为关注的问题. 起初被收录的情况不好, 也没什么 SPAM, 但当 SPAM 第一次现形后, 麻烦就接蹱而至了. 好在其时 Z-blog 已有了两款反 SPAM 插件, AntiSpam 和 Totoro. 而当我决定安装其中之一时, 又恰逢天才少年对 Totoro 进行了防垃圾引用的升级, 很到位的原理, 当时我想这小子好牛啊, 都能写插件了, 不像我只会瞎嚷嚷.
可最后我还是选择了 AntiSpam, 原因是我对 Access 性能的不放心. 如果是 SQL 数据库, 我会毫不犹豫的选择 Totoro, 但大量涌入带审区的 SPAM 会影响数据库, 而对评论的频繁操作会增加数据库损坏的可能. 而 AntiSpam, 会直接把垃圾评论挡在博客之外. 其实把评论独立到另外一个数据库文件里更合我的本意. 但好像不会有谁无聊的做这种设计.
无论是 AntiSpam 还是 Totoro, 如何区分 SPAM 与正常留言都是其硬指标. 前者用了禁IP, 留言时间间隔, 链接数等办法, 后者引入了与已有留言数据库的比对, 这些办法都不够精确, 要么就会放过一批SPAM, 要么就会杀掉一批访客. 精确的办法还是有的, 那就是关键词屏蔽 (简称黑词). 当然黑词也不是绝对可靠的, 但它至少提供了一个灵活的办法, 使得根据留言内容更精确的判断是否为垃圾评论成为了一种可能.
大部分的垃圾留言都是广告, 广告则势必有链接地址或联系方式, 而这些是唯一的, 一个据此不断更新的黑名单应该可以有效且无误伤的识别 SPAM. 所以从一开始, 我就把域名纳入了黑词列表, 但我有两个基于 Z-blog 的博客, 每添加完一个博客的黑词列表就要去添加另一个, 而且那个编辑黑词的框框小得可怜. 所以我想, 要能把黑词独立到一个文件里, 通过几下点击就能使这两个博客的黑词列表根据这个文件更新该多好.
这就是 Unison 的诞生, 但那时并不叫这个名字, 那时的 Unison 不过是一个我编辑的黑词列表, 而别人也可以通过插件下载到而已. 在其后的一些日子里, 这个插件不断的完善, 在更名为 Unison 之后, 它已经可以通过用户提交的 SPAM 来扩充黑词列表并供用户使用了. 但遗憾的是, 这一切的运行并不是自动的.
其实 Zx.MYS 早就写好了一个提取域名的正则函数, 而这个函数稍加修改便可以提取QQ号, 邮箱, 手机号, 电话号等其它的联系方式. 但如何确定这个评论是恶作剧还是真的垃圾评论却是个问题. SPAM 较多时人工处理比较吃力, 越来越多的 Unison 用户所带来的主机压力都迫使 Unison 的下一次改版提上日程, 如何改, 现在具体想法还没定下来, 也不在这里罗嗦了.
总而言之, 在成为版主前后的这段日子里, 我一直把心思花在了如何对付 SPAM 上, 没有 Sipo 的技术, 只好做些取巧的打算. Unison 的表现也还说得过去, 大概在5月下旬到来时, 我终于可以不再为 SPAM 心烦, 可以在空余时忙些别的事情了.
« 来到 Z-blog 的世界 (聊聊 Z-blog 之一)左派还是右派? »
点击编辑后,没有提交黑词的 提交按钮。是怎么回事呢。
以前560个,这又变成了423个。呵呵。
是否可以重新安装一遍这个插件?
发表评论: