• 欢迎访问老司机不开车的博客,推荐使用最新版火狐浏览器和Chrome浏览器访问本网站,欢迎加入 TG群 QQ群
  • 老司机提醒您:回复"666666"无需人工审核,即可查看文章!Gmail邮箱的都需要审核!
  • 禁止带HTTP连接和联系方式广告留言。所有含有日文以及英语的评论已经屏蔽。
  • 廣告招租!衹接受比特幣和萊特幣付款。廣告沒有限制!有意向聯係 TG_1024
  • 本站的目的是仅仅是科普知识,绝对没有其他任何用意!请遵守当地相关法律法规!
  • 禁止复读机行为!第一次删除账号,第二次封IP。

老司机不开车之黑帽SEO 总结篇

SEO 老司机 1年前 (2018-01-26) 537次浏览 0个评论

此系统文章总共分为四篇,分别是手法篇工具篇隐身篇、总结篇;本篇为总结篇,主要介绍黑帽seo行为的检测以及预防。

如何检测自身网站是否被劫持?

前面介绍了很多关于黑帽seo 的手法,那作为站长或者运维该怎么去监控自身网站是否被入侵,且被黑帽seo利用了呢?这里不说如何检测入侵,因为这不是本文的范畴,我们只谈如何检测被黑帽seo利用,这里提供几个思路。

内部监控

可以监控服务器 web 目录下的文件改动情况,一般黑帽 seo 都需要改动 web 目录下的文件(新增文件,或更改文件内容)。当然有些只改变 nginx 配置就可以达到目的,因此 nginx 等服务器的配置文件也需要进行监控。

小结:内部监控比较类似防篡改的检测,只是面对网页劫持,除了响应文件内容改动以外,还需要响应新增文件等行为,包括服务器配置文件的改动。

外部检测

黑帽 seo 手法从根本上是欺骗搜索引擎,因此检测本质上也可以从搜索引擎出发。检测网站在搜索引擎搜索显示下是否出现了敏感的内容,比如:博彩、色情等。由于网页劫持手法可以动态调控显示内容,比如不同地区点击返回不同的内容等,因此这需要我们的检测程序能够多维度得进行检测。

多维度包括但不局限于以下几种:

  • 采用不同地区的 IP 检测目标网站
  • 采用不同时间段内检测目标网站
  • 采用不同的 UA 访问目标网站
  • 采用不同的访问方式目标网站(百度搜索跳转、直接访问域名)

检测步骤分为:

  • 获取搜索引擎搜索结果
  • 模拟浏览器访问搜索结果网页
  • 解析网页源码等元素
  • 匹配规则判断网站是否被劫持
获取搜索引擎搜索结果

这一步骤需要爬取搜索引擎,比如我们要判断 thief.one 网站是否被劫持,可以搜索百度:site:thief.one 色情。关键词需要自己搜集,然后利用爬虫爬取百度的搜索结果。
显然这一步需要对抗百度搜索引擎,防止被其屏蔽问题,还要能够正确的获取百度的搜索结果。

模拟浏览器访问搜索结果网页

当爬到所需要的网页链接后,我们需要重放 url 获取信息。这一步需要能够动态执行网页中嵌入的 js 代码,动态跟踪网页的走向(跳转)。这里推荐使用 phantomjs 当然也可以使用其他 webkit。

解析网页源码等元素

可以利用 python 解析网页源码、网页标题、URL、js 等内容,最方便的做法是获取各个参数的内容,处理数据打标后扔到机器学习的算法中进行模型计算。

匹配规则判断网站是否被劫持

可以使用正则等方式,根据黑帽 seo 等特征建立规则库去匹配。当然也可以利用机器学习的方式去对相关网页进行分类,我们曾经使用过某种算法,将准确率提高到了 90%左右。

小结:外部检测难度比较大,目前黑帽 seo 主要针对百度,因此这相当于去检测百度的搜索结果;而如何模拟浏览器访问也是一大难题,当然最重要的是最后的机器学习,如何训练模型。

谁来为此买单?

基于黑帽 SEO大多数都为博彩赌博行业做推广,将会增加网民沉迷网络赌博的风险,纵观身边因为网络赌博而家破人亡的事情不在少数;而也有一部分黑帽 SEO在为枪支弹药、毒品违禁药物做推广,更是为犯罪分子提供了便利。在此之前,我一直认为黑产只是暴利并无太大危害,然而通过对黑帽 SEO的研究发现,其危害的绝不仅仅只是经济而已。那么这一切,应该由谁来买单?
首先网站管理者难辞其咎,正因为管理员安全意识的淡薄,网站安全性不高,导致被入侵最终成为黑产的一部分。在我自身处理的几起类似事件中,网站管理员往往是一副无关紧要的态度,即使网站已经被黑帽 SEO 利用,也觉得没有对网站本身造成什么危害,觉悟性不高。
其次搜索引擎应该担负一定的责任,因为黑帽 SEO 行为主要针对搜索引擎,说白了就是利用搜索引擎算法漏洞,提升非法网站权重。国内大多数网民上网都使用搜索引擎。搜索引擎既然有权利决定显示哪些资源给用户,那么也必须有义务确保这些资源的安全性、正规性。

如何制止与防御?

如果您是网民,制止黑帽 seo 最好的方式就是科学上网,发现非法网站及时提交到安全联盟或向搜索引擎举报。
如果您是网站管理员,请做好自身网站的安全建设,及时补漏;若已发现被入侵,及时联系技术人员处理。

谈谈心

当在写这篇文章前,我思索着尽量能够全面地介绍黑帽 SEO 知识以及手法。当开始写这篇文章的时候,我便有点无从下手,因为涉及知识面太广,手法又非常丰富,我研究黑帽 SEO 不久了解也不算深入。而当我写完这篇文章的时候,我觉得这一切才刚刚开始,也许我此刻抒写的正是黑客几年前或十几年前所用或者所流行的技术。


博主在此发文(包括但不限于汉字、拼音、拉丁字母)均为随意敲击键盘所出,用于检验本人电脑键盘录入、屏幕显示的机械、光电性能,并不代表本人局部或全部同意、支持或者反对观点。如需要详查请直接与键盘生产厂商法人代表联系。挖井挑水无水表,不会网购无快递。博主只是一名普通的互联网从业者,不懂修电脑,不会卖电脑,不会帮你盗号,不会破解开机密码,找不回你丢失的手机等,如有这样的想法请绕道! 丨本网站采用CC BY 4.0协议进行授权 , 转载请注明老司机不开车之黑帽SEO 总结篇
喜欢 (1)
发表我的评论
取消评论
表情 加粗 删除线 居中

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址