网站优化常见错误之网站域名选择太长,地址太深
了解seo的人都知道,蜘蛛是通过网页代码进行抓取的,一般选取比较简短的域名,方便记忆,不能选用过于太长的域名,可以使用简拼进行注册,方便用户记忆;域名过长也会导致后面的路径过长,如果是层级地址太深的话,反而会显得很乱,蜘蛛也很难知道哪里是*,甚至会截断蜘蛛的爬行,一般层级****多分3层即可,但不宜继续往下分,3层是****多的限制。
做优网站优化的URL伪静态不适合全部网站
我们经常要做路径静态化,我们通常叫URL静态(静态路径和伪静态路径)化,很多朋友一看本身网站是动态的,不管三七二十一,我先把伪静态做好再说。但考虑你自身网站而言,伪静态是否真的有必要呢?从来没有去思索过这个问题。
现在我们有必要认识下,伪静态这个具体是做什么用的,伪静态他是提升关键字排名用的吗?实在他也不是提升排名的,但为什么我们要去做呢?是不是全部的*站我们都必要做伪静态?大概有些人说蜘蛛喜好,这里实在不存在蜘蛛是否喜好,而是在于蜘蛛是否能抓到你这个路径,假如蜘蛛可以,那么阐发这就是一个好路径,假如蜘蛛抓不到,大概抓的时间有丢失率,抓取100条路径,丢失了50条,那么叨教,您的这个路径对蜘蛛而言友好吗?很显着是不太友好的。
SEO*之网站日志分析
对网站日志分析是必需要掌握的一项基本的技能,通过日志分析可以分析爬虫抓取页面有效性,通过日志分析蜘蛛返回的状态码能及时发现网站里面是否存在错误或者蜘蛛无法爬取的页面,排查网站页面中存在的404错误页面,500服务器错误等这些噪音内容上噪音页面上(重复页面,低质量页面,空内容页面,404页面,不排名页面等)
一、网站日志可以为我们做什么?
1、 可以分析爬虫抓取页面有效性(减少搜索引擎在一些噪音页面上:重复页面,低质量页面,空内容页面,404页面,不排名页面 的抓取频率);
2、排查网站页面中存在的404错误页面,500服务器错误等
3、页面重要内容是否被爬虫完整爬到并且快速遍历;
4、正确分辨蜘蛛爬虫
二、常见HTTP状态码*
1、200代码,表示蜘蛛爬取正常
2、404代码,访问的这个链接是错误链接
3、301代码,重定向
4、302代码,表示临时重定向
5、304代码,客户端已经执行了GET,但文件未变化。
6、500代码,表示网站内部程序或服务器有错