当前位置:首页 » 宠物新闻 » 正文

(六)站长必备分析技能之一【网站日志分析】

2015年12月15日 13:59:53  分类: 宠物新闻  参与: 743人  点这评论

什么是网站日志?

网站日志是记录web服务器接收处理请求以及运行时错误等各种原始信息的以·log结尾的文件,确切的讲,应该是服务器日志。网站日志最大的意义是记录网站运营中比如空间的运营情况,被访问请求的记录。通过网站日志可以清楚的得知用户在什么IP、什么时间、用什么操作系统、什么浏览器、什么分辨率显示器的情况下访问了你网站的哪个页面,是否访问成功。

搜索引擎的工作过程

其实清楚什么是网站日志就能明白我们为什么要去分析它,为什么作为一名站长必备的技能之一就是分析网站日志。下面看看介绍一下如何分析网站日志、网站日志怎么看。

网站日志应该说每个站长都应该知道如何查看,站长可以通过日志查看网站状态,是每个站长的必备技能。没真正建站的时候看到别人的网站日志看到一连串的代码,各种不懂,各种神秘,感觉站长真是神啊,这么复杂的代码都能看得懂,当时真是太崇拜了。可是当自己建站学习各方面的网站知识后,才发现网站日志查看这种基础技能真的很简单,只要知道搜索引擎蜘蛛名称和一些返回状态码就行了。

各大搜索引擎蜘蛛名称:

百度蜘蛛

百度蜘蛛:Baiduspider

谷歌蜘蛛:googlebot

搜狗蜘蛛:sogou web spider

好搜蜘蛛:haosouspider

必应蜘蛛:bingbot

SOSO蜘蛛:Sosospider

雅虎蜘蛛:Yahoo! Slurp


网站日志怎么看?

首先,要知道网站日志文件所在位置然后下载。一般通过ftp找到.log文件按照日期下载每天的日志,或者登陆网站空间后台找到网站日志下载。

下面从网站日志中复制的一段代码,看看这些代码表示什么意思,我们如何分析网站日志。

2015-02-08 09:05:25 GET /default.asp - - 220.181.108.180 HTTP/1.1Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html) - 200 34499 421

这是一行日志代码,大家应该知道Baiduspide是百度蜘蛛的名称,我们可以从这行代码中看到百度蜘蛛对网站的爬行信息。

2015-02-08 09:05:25 GET /default.asp,这个大家一看就应该明白,意思是Baiduspider这个名称的用户也就是百度蜘蛛在2015-02-08 09:05:25 这个时间爬行了我们网站的主页也就是default.asp页面,这个get就是搜索引擎的一个抓取动作。

220.181.108.180,这个代表的是来访用户的ip地址,在这条日志中这个ip地址就代表着百度蜘蛛的ip来路。相信有过建站经验的朋友对这个ip应该都是极为熟悉的了。

HTTP/1.1这个代码代表的是一个超文本传输协议,接触网络的人应该都知道网络上信息的传递是需要通过一定的网络协议的,这个HTTP/1.1就是众多协议的一种,大家不必对这太过关注,当然如果感兴趣也可以仔细了解。

Mozilla/5.0+(compatible;+Baiduspider/2.0;++http://www.baidu.com/search/spider.html)这段代码Mozilla/5.0代表的意思就是用户使用的浏览器是Mozilla/5.0,而括号里面的信息新站日志中如果出现了应该能让站长们兴奋一会儿,它就是百度蜘蛛了,可以说是搞百度优化站长们的衣食父母啊,对它是又爱又恨啊。

200 34499 421这段代码中“200”代表的是蜘蛛爬行返回的状态码,200代表的是爬行成功的意思,34499代表的是爬行网页的大小。


来源:杨小羽宠物资讯(公众号:yangmxiaoyu或搜“杨萌小羽”),转载请保留出处和链接!

本文链接:http://www.anlandy.com/post/121.html

本文标签:网站日志  网站日志分析  搜索引擎蜘蛛名称  

微信公众号:yangmxiaoyu

加入【杨小羽】QQ群:372221677

<< 上一篇 下一篇 >>

相关文章

网站分类

最近发表

标签列表

最近留言

【感谢支持】

    ____________________________

网站地图 | 宠物新闻 | 宠物故事 | 宠物视频 | 杨小羽

京ICP备14047936号