文章当前位置:甘肃兰州SEO_网站建设_关键词排名优化-⎛⎝张庭宇博客⎠⎞ » SEO基础 » 如何根据网站日志对网站健康度进行检查

如何根据网站日志对网站健康度进行检查

2年前 (2018-05-02) Fianchetto SEO基础 0评论 已收录 1352℃

       定期分析网站日志可以给我们更多的信息对网站安全和健康度进行监测,今天我们分享使用网站日志文件分析我们的网站便于SEO优化

一、获取和查看日志

       日志就是http对网站的一个相应状态,用户的浏览访问页面,时间都记录在一个.log文件夹当中。要查看日志信息,就需要我们把他下载下来,可以查看ftp网站根目录找到我们下载的日志文件夹里面的.log文件。

二、通过Excel表格进行分析

(1):新建一个Excel表格,点击A1-----数据-----导入数据

                       1

(2):点击选择数据源

                              2

(3):要找到.log日志文件需要,选择所有文件,找到我们的文件----点击打开

                               3

(4):进入下一步,在选择分隔符号,下一步

                               4

(5):点击空格,下一步,完成

                               5

三、参数说明

(1)为了分析方便,我们选择第一列冻结窗口 行,选择筛选将我们不需要分析的数据隐藏或者删除单页格子

(2)各参数的意思是:

                 6

      date:发出请求时候的日期。
time:发出请求时候的时间。注意:默认情况下这个时间是格林威治时间,比我们的北京时间晚8个小时,下面有说明。
c-ip:客户端IP地址。
cs-username:用户名,访问服务器的已经过验证用户的名称,匿名用户用连接符-表示。
s-sitename:服务名,记录当记录事件运行于客户端上的Internet服务的名称和实例的编号。
s-computername:服务器的名称。
s-ip:服务器的IP地址。
s-port:为服务配置的服务器端口号。
cs-method:请求中使用的HTTP方法,GET/POST。
cs-uri-stem:URI资源,记录做为操作目标的统一资源标识符(URI),即访问的页面文件。
cs-uri-query:URI查询,记录客户尝试执行的查询,只有动态页面需要URI查询,如果有则记录,没有则以连接 符-表示。即访问网址的附带参数。
sc-status:协议状态,记录HTTP状态代码,200表示成功,403表示没有权限,404表示找不到该页面,具体说明在下面。
sc-substatus:协议子状态,记录HTTP子状态代码。
sc-win32-status:Win32状态,记录Windows状态代码,即http状态码。
sc-bytes:服务器发送的字节数。
cs-bytes:服务器接受的字节数。
time-taken:记录操作所花费的时间,单位是毫秒。
cs-version:记录客户端使用的协议版本,HTTP或者FTP。
cs-host:记录主机头名称,没有的话以连接符-表示。注意:为网站配置的主机名可能会以不同的方式出现在日志文件中,原因是HTTP.sys使用Punycode编码格式来记录主机名。
cs(User-Agent):用户代理,客户端浏览器、操作系统等情况。
cs(Cookie):记录发送或者接受的Cookies内容,没有的话则以连接符-表示。
cs(Referer):引用站点,即访问来源。

四、分析结果

(1)用户访问了我们robots禁止蜘蛛抓取的dede或者wp_admin后台了话,说明有人登陆,我们需要防范,修改密码,能修改后台地址要修改地址
(2)如果说一个用户访问页面出现404状态码,或者500错误的时候,我们要进入网页中进行查看,修改提交百度。我们可以通过一些手段,拒绝用户ip访问用到.htaccess文件,上面添加用户ip即可屏蔽用户点击我们的网站代码如下
Order.Allow.Deny
Allow from all
Deny from 123.456.789(用户ip)
要是屏蔽多个用户就在把上面的在另起一行 书写

(3)如果说用户访问时间过短,说明我们的内容不够吸引人,要加强内容的丰富度优化
(4)可以看到蜘蛛是什么样的蜘蛛来了我们的网站,百度蜘蛛有真有假,通过电脑指令cmd命令输入nslookup 123.456.789(IP地址)查看百度蜘蛛是不是来了。

                      7

(5)出现这样的信息 说明百度蜘蛛来了我们的页面抓取还是没抓取需要看状态码?要是1**2**的 我们可以先不用理会,要是出现4** 、 5** 或者302等情况 ,需要将302改成301 因为302是临时跳转,对蜘蛛来说是不友好的,而4**和5**页面问题,需要找到问题解决,页面大量4**和5**的会导致页面整体排名,流量,权重的丢失。

----------------------------------------------------本文完----------------------------------------------------

         
博主
               

每一个不曾起舞的日子,都是对生命的辜负。--------尼采

相关推荐

亲,来都来了,回复一下再走吧。

×
订阅图标按钮