蜘蛛爬取有(yǒu)陷阱,谨慎!
2015-04-22 11:05:56
有(yǒu)蜘蛛爬取,网站才会有(yǒu)收录。但是蜘蛛抓取过程中,存在陷阱!知道蜘蛛陷阱是什么嘛?蜘蛛陷阱是制止蜘蛛爬行网站的停滞物(wù),对用(yòng)户是没有(yǒu)影响的,网页也没有(yǒu)明显的體(tǐ)现,但是里面就存在陷阱!网站优化SEO不得不知道的蜘蛛陷阱,沧州网站建设优化公司总结如下:
1. Flash动画
為(wèi)什么Flash是蜘蛛陷阱的一种,这个问题很(hěn)简单,就是由于蜘蛛辨认不了Flash。蜘蛛是不能(néng)通过这个Flash跟踪到HTML版本页面的。这就是一个陷阱,拦截了蜘蛛继承抓取网站。
2. JS链接
Javascript可(kě)以创造出很(hěn)多(duō)吸引人得视觉结果,有(yǒu)些网站喜好利用(yòng)Javascript脚本天生导航體(tǐ)系。但是蜘蛛敷衍js也是辨认不了的,敷衍js殊效可(kě)以到场网站,也可(kě)以将不被抓取的链接放入js,但是举行爬行抓取的链接肯定不能(néng)放入JS,这会造成蜘蛛不能(néng)继承爬行,同时js也不要太多(duō),可(kě)以专门建一个js文(wén)件。
3. 动态URL
蜘蛛是可(kě)以抓取部门URL链接的,但是动态URL是数据库直接天生的,有(yǒu)的带了问号、等号等多(duō)个参数。这类网址不但倒霉于搜刮引擎蜘蛛爬行,而且还大概造成蜘蛛的死循环,这是一个致命的蜘蛛陷阱。静态网址在程度上由于动态网址,便于蜘蛛的抓取。
4. Session ID
有(yǒu)些网站為(wèi)了跟踪用(yòng)户访问利用(yòng)Session ID,每个用(yòng)户访问网站时都是得Session ID,也即ID。这个ID都是加在URL中,搜刮引擎蜘蛛的每一次访问也会被当成一个新(xīn)得用(yòng)户在URL中会加上一个差别的ID,如许蜘蛛每次来访问时所的同一个页面会是一个不一样的URL。结果就很(hěn)显着,如许一来会产生复制内容页面,造成了高度重复的内容页。
5. Frame框架
框架结构对蜘蛛来说和Flash、js一样都是一道墙,框架结构也会拦阻搜刮引擎蜘蛛的爬行和抓取,让蜘蛛掉进陷阱。
6. 要求登录
这个是很(hěn)常见的,有(yǒu)些网站内容放在用(yòng)户登录之后才气看到,设置有(yǒu)的整个网站只能(néng)登岸进入后才气看,这敷衍用(yòng)户固然没什么,而敷衍蜘蛛就造成陷阱,為(wèi)什么?由于蜘蛛不能(néng)填写用(yòng)户名、暗码、也不会注册,自然而然,蜘蛛不能(néng)进来抓取你的内容,以是除非是VIP内容大概是不蜘蛛抓取的内容,别的的应该对蜘蛛公然,如许才气抓取。
7. 欺压利用(yòng)Cookies
有(yǒu)些网站為(wèi)了实现某种成果、如记取用(yòng)户登录信息、跟踪用(yòng)户访问路径等、欺压用(yòng)户利用(yòng)Cookies、用(yòng)户欣赏器假如没有(yǒu)启用(yòng)Cookies、页面體(tǐ)现不正常。搜刮引擎蜘蛛就相称于一个禁用(yòng)Cookies得欣赏器、欺压利用(yòng)Cookies只能(néng)造成搜刮引擎蜘蛛无法正常访问。
8.种种跳转
现在比力发起的网站跳转就是301、302重定向,而别的跳转,蜘蛛黑白常的敏感。
9.网站链接结构
敷衍蜘蛛而言,我们重要说的就是网站的链接结构,网站的链接结构就便是一个屋子,链接就是门,而蜘蛛就是我们约请而来的朋侪,网站链接结构槽糕紊乱就相称于朋侪来到你家后基础就分(fēn)不清楚东南西北,找不到入口出口。连对应的链接都找不到,蜘蛛怎样举行抓爬?以是链接结构还是呈扁平树状结构。
蜘蛛能(néng)够抓取到我们网站的内容是很(hěn)重要的,有(yǒu)抓取才会有(yǒu)收录,有(yǒu)收录才会有(yǒu)流量,有(yǒu)流量才会有(yǒu)客户,这都是一系列的联系的。沧州网站优化推广谨记蜘蛛陷阱,避免自己进入到这个陷阱当中。
关键词:网站优化SEO、沧州网站建设优化公司、沧州网站优化推广