分析IIS日志的最有效方法

合集下载

网站IIS日志的分析

网站IIS日志的分析

1.日志的后缀名是log,用记事本打开选择格式里的“自动换行”,这样看起来就方便,同时搜索BaiduSpider和Googlebot这两个蜘蛛。

例如:百度蜘蛛2012-06-13 01:49:22 W3SVC177 116.255.169.37 GET / – 80 – 220.181.51.144 Baiduspider-favo+(+ baidu/search/spider ) 200 0 0 15256 197 265谷歌机器人2012-06-13 09:28:48 W3SVC177 116.255.169.37 GET /robots.txt – 80 – 222.186.24.26 Googlebot/2.1+(+ google /bot ) 200 0 0 985 200 31我们分段解释2012-06-13 01:49:22 蜘蛛爬取的时间点和日期W3SVC177 这个是机器码这个是惟一的我们不去管它116.255.169.37 这个IP地址是服务器的IP地址GET 代表事件GET后面就是蜘蛛爬取的网站页面,斜杠就代表首页80 是端口的意思220.181.51.144 这个IP则是蜘蛛的IP,这里告诉大家一个鉴别真假百度蜘蛛的方法,我们电脑点击开始运行输入cmd打开命令提示符,输入nslookup空格加蜘蛛IP点击回车,一般真百度蜘蛛都有自己的服务器IP而假蜘蛛则没有。

如果网站中出现了大量的假蜘蛛则说明有人冒充百度蜘蛛来采集你的内容,你就需要注意了,如果太猖獗那会很占用你的服务器资源,我们需要屏蔽他们的IP.200 0 0这里是状态码状态码的意思可以在百度里搜索下197 265最后两个数字则代表着访问和下载的数据字节数。

2.我们分析的时候先看看状态码 200代表下载成功,304代表页面未修改,500代表服务器超时,这些是一般的其他代码可以百度一下,对于不同的问题我们要处理。

3.我们要看蜘蛛经常爬取哪些页面,我们要记录下来,分析他们为什么会经常被蜘蛛爬取,从而分析出蜘蛛所喜欢内容。

IIS日志-网站运维的好帮手

IIS日志-网站运维的好帮手

IIS⽇志-⽹站运维的好帮⼿对于⼀个需要长期维护的⽹站来说,如何让⽹站长久稳定运⾏是件很有意义的事情。

有些在开发阶段没有暴露的问题很有可能就在运维阶段出现了,这也是很正常的。

还有些时候,我们希望不断地优化⽹站,让⽹站更快速的响应⽤户请求,这些事情都发⽣在开发之后的运维阶段。

与开发阶段不同的,运维阶段不可能让你去调试程序,发现各类问题,我们只能通过各种系统⽇志来分析⽹站的运⾏状况,对于部署在IIS 上的⽹站来说,IIS⽇志提供了最有价值的信息,我们可以通过它来分析⽹站的响应情况,来判断⽹站是否有性能问题,或者存在哪些需要改进的地⽅。

IIS⽇志包含了哪些信息我前⾯说到【IIS⽇志提供了最有价值的信息】,这些信息有哪些呢?看看这个截图吧:这⾥⾯记录了:1. 请求发⽣在什么时刻,2. 哪个客户端IP访问了服务端IP的哪个端⼝,3. 客户端⼯具是什么类型,什么版本,4. 请求的URL以及查询字符串参数是什么,5. 请求的⽅式是GET还是POST,6. 请求的处理结果是什么样的:HTTP状态码,以及操作系统底层的状态码,7. 请求过程中,客户端上传了多少数据,服务端发送了多少数据,8. 请求总共占⽤服务器多长时间、等等。

这些信息在分析时有什么⽤途,我后⾯再说。

先对它有个印象就可以了。

IIS⽇志的配置默认情况下,IIS会产⽣⽇志⽂件,不过,还是有些参数值得我们关注。

IIS的设置界⾯如下(本⽂以 IIS 8 的界⾯为例)。

在IIS管理器中,选择某个⽹站,双击【⽇志】图标,请参考下图:此时(主要部分)界⾯如下:在截图中,⽇志的创建⽅式是每天产⽣⼀个新⽂件,按⽇期来⽣成⽂件名(这是默认值)。

说明:IIS使⽤UTC时间,所以我勾选了最下⾯的复选框,告诉IIS⽤本地时间来⽣成⽂件名。

点击【选择字段】按钮,将出现以下对话框:注意:建议勾选它们。

注意:【发送的字段数】和【接收的字节数】默认是没有选择的。

建议勾选它们。

⾄于其它字段,你可以根据需要来决定是否要勾选它们。

IIS日志分析方法及工具

IIS日志分析方法及工具

IIS⽇志分析⽅法及⼯具IIS⽇志建议使⽤W3C扩充⽇志⽂件格式,这也是IIS 5.0已上默认的格式,可以指定每天记录客户IP地址、⽤户名、服务器端⼝、⽅法、URI资源、URI查询、协议状态、⽤户代理,每天要审查⽇志。

如图1所⽰。

IIS 的WWW⽇志⽂件默认位置为 %systemroot%\system32\logfiles\w3svc1\,(例如:我的则是在C:\WINDOWS\system32\LogFiles\W3SVC1\),默认每天⼀个⽇志。

建议不要使⽤默认的⽬录,更换⼀个记录⽇志的路径,同时设置⽇志访问权限,只允许管理员和SYSTEM为完全控制的权限。

如图2所⽰。

如果发现IIS⽇志再也不记录了,解决办法:看看你有没有启⽤⽇志记录:你的⽹站--> 属性 -->“⽹站”-->“启⽤⽇志”是否勾选。

⽇志⽂件的名称格式是:ex+年份的末两位数字+⽉份+⽇期。

( 如2002年8⽉10⽇的WWW⽇志⽂件是ex020810.log )IIS的⽇志⽂件都是⽂本⽂件,可以使⽤任何编辑器或相关软件打开,例如记事本程序,AWStats⼯具。

开头四⾏都是⽇志的说明信息#Software ⽣成软件 #Version 版本 #Date ⽇志发⽣⽇期 #Fields 字段,显⽰记录信息的格式,可由IIS⾃定义。

⽇志的主体是⼀条⼀条的请求信息,请求信息的格式是由#Fields定义的,每个字段都有空格隔开。

字段解释data ⽇期 time 时间 cs-method 请求⽅法 cs-uri-stem 请求⽂件 cs-uri-query 请求参数 cs-username 客户端⽤户名 c-ip 客户端IP cs-version 客户端协议版本 cs(User-Agent) 客户端浏览器 cs(Referer) 引⽤页下⾯列举说明⽇志⽂件的部分内容(每个⽇志⽂件都有如下的头4⾏): #Software: Microsoft Internet Information Services 6.0 #Version: 1.0 #Date: 2007-09-21 02:38:17 #Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status2007-09-21 01:10:51 10.152.8.17 - 10.152.8.2 80 GET /seek/images/ip.gif - 200 Mozilla/5.0+(X11;+U;+Linux+2.4.2-2+i686;+en-US;+0.7) 上⾯各⾏分别清楚地记下了远程客户端的:连接时间 2007-09-21 01:10:51 IP地址 10.152.8.17 - 10.152.8.2 端⼝ 80 请求动作 GET /seek/images/ip.gif - 200 返回结果 - 200 (⽤数字表⽰,如页⾯不存在则以404返回)浏览器类型 Mozilla/5.0+ 系统等相关信息 X11;+U;+Linux+2.4.2-2+i686;+en-US;+0.7附:IIS的FTP⽇志IIS的FTP⽇志⽂件默认位置为%systemroot%\system32\logfiles\MSFTPSVC1\,对于绝⼤多数系统⽽⾔(如果安装系统时定义了系统存放⽬录则根据实际情况修改)则是C:\winnt\system32\logfiles\ MSFTPSVC1\,和IIS的WWW⽇志⼀样,也是默认每天⼀个⽇志。

[SEO交流] iis日志完全篇如何有效的查看iis日志

[SEO交流] iis日志完全篇如何有效的查看iis日志

iis日志完全篇导语:站长要知道自己的网站被访问的程度,被搜索引擎关注度,搜索引擎每天来抓取某个页面多少次,对某个页面的访问约频繁,说明蜘蛛对该页面约喜爱,该页面的seo优化是值得肯定的,但如何统计这些数据?站长通常的做法是:查看iis日志,,查看iis日志一般方法是在C:\WINDOWS\system32\LogFiles下的某个目录日志文件,是文本文件,从中可以看到一些信息,但是不便于统计和查询,如何更方便有效的掌握统计信息呢,这里我们详细来说明。

首先,让我们来了解如何设置和查看iis日志。

1. 在建立iis网站的时候,要设置iis日志的更新.比如在iis中的网站 这个网站,选择“属性”,在“网站”这个标签页中找到这一项,启用日志记录,为w3c扩展日志文件格式。

点击属性可以看到日志记录设置信息:这里不用详述,一看就明白。

日志文件存放在c:\windows\system32\LogFiles\下但是我们要解释下日志文件名:W3SVC158********\eyymmdd.log其中eyymmdd.log 代表某年某月某日的log文件在高级页上,我们看到:这是iis日志记录的字段记录,比如记录对方主机ip,服务器名,访问方法,等。

我们按默认设置。

之后在c:\windows\system32\LogFiles\下,就可以找到W3SVC158********文件夹了。

2. 如何查看iis日志.打开一个日志文件,我们看到:#Software: Microsoft Internet Information Services 6.0#Version: 1.0#Date: 2011-06-20 00:00:34#Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ipcs(User-Agent) sc-status sc-substatus sc-win32-status2011-06-20 00:00:34 W3SVC158******** 116.252.182.32 GET /news/2011/0114/3556.html - 80 - 220.181.108.185Mozilla/5.0+(compatible;+Baiduspider/2.0;++/search/spider.html) 200 0 0 2011-06-20 00:00:35 W3SVC158******** 116.252.182.32 GET / news /2010/1226/ - 80 - 220.181.108.109Mozilla/5.0+(compatible;+Baiduspider/2.0;++/search/spider.html) 403 14 642011-06-20 00:00:56 W3SVC158******** 116.252.182.32 GET / news /2011/0523/4672_5.html - 80 - 203.208.60.187Mozilla/5.0+(compatible;+Googlebot/2.1;++/bot.html) 304 0 0我们用不同颜色标注了各行,其中#Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ipcs(User-Agent) sc-status sc-substatus sc-win32-status代表了记录的字段,之前你选择“高级”设置时候勾选的字段就会记录接下来就是记录信息了,比如日期date 对应2011-06-20 s-ip 对应对方ip地址。

【最新文档】分析iis日志-范文模板 (10页)

【最新文档】分析iis日志-范文模板 (10页)

本文部分内容来自网络整理,本司不为其真实性负责,如有异议或侵权请及时联系,本司将立即删除!== 本文为word格式,下载后可方便编辑和修改! ==分析iis日志篇一:分析IIS日志的最有效方法分析IIS日志的最有效方法IIS日志分析方法和技巧:一、IIS日志的介绍IIS日志:即服务器日志,记录服务器上的一些访行为和状态.二、IIS日志的作用(1)是否有死链接、错误链接 (404状态码,可用robots进行死链接链接)(2)查看服务器是否正常(500,501,502状态码)(3)了解蜘蛛访问网站的频率(查看时间)(4)了解用户访问形为(即用户访问了哪些页面)(5)了解网站的安全信息例如:13:46:07 127.0.0.1 GET /scripts/..\../winnt/system32/cmd".exe 401 13:46:07 127.0.0.1 GET /scripts/..\../winnt/system32/cmd".exe 200 13:47:37 127.0.0.1 GET /scripts/..\../winnt/system32/cmd".exe 401 如果出现上述这些命令,则表示有人在扫描你的网站(6)分析用户喜欢访问哪些栏目三、怎么下载IIS日志(1)如果是空间,可以在空间后台下载或找空间商(2独立服务器或VPS,进入服务器或VPS进行设置即可四、分析IIS日志例如:例如:#Software: Microsoft Internet Information Services 6.0#Version: 1.0#Date: 201X-04-19 16:03:02#Fields: date time cs-method cs-uri-stem cs-uri-query cs-username c-ip cs-version cs(User-Agent) cs(Referer) sc-status sc-bytes time-taken 201X-04-19 16:03:01 GET /robots.txt - - 123.125.71.81 HTTP/1.1Mozilla/5.0+(compatible;+Baiduspider/2.0;++/search/spider.html) - 200 574 15201X-04-19 16:08:18 GET /index.php - - 222.77.187.33 HTTP/1.1Mozilla/5.0+(compatible;+MSIE+8.0;+Windows+NT+6.1;+Trident/5.0) - 200 30212 859201X-04-19 16:14:19 GET /favicon.ico - - 221.11.16.172 HTTP/1.1Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+Trident/4.0;+.NET+ CLR+2.0.50727;+360space) - 200 3364 156201X-04-19 16:16:30 GET /index.php p=246 - 203.208.60.235 HTTP/1.1 Mozilla/5.0+(compatible;+Googlebot/2.1;++/bot.html) - 200 14802 2546201X-04-19 16:17:31 GET /index.php p=401 - 211.154.149.132 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+8.0;+Windows+NT+6.1;+WOW64;+Trident/4.0 ;+SLCC2;) - 200 18817 937201X-04-19 16:24:35 GET /index.php paged=3 - 180.153.227.29 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1)/s?wd= blog&pn=70&rsv_page=1 200 22752 1000201X-04-19 16:29:46 GET /index.php feed=rss2 - 209.85.238.197HTTP/1.1 Feedfetcher-Google;+(+/feedfetcher.html;+1+subscribers;+feed-id=13463723763221171900) - 304 326 1109201X-04-19 16:31:01 GET /index.php - - 115.238.252.231 HTTP/1.0Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.2;+SV1;+.NET+CLR+1.1. 4322;+.NET+CLR+2.0.50727) - 200 30212 1125201X-04-19 16:31:04 GET /index.php - - 115.238.252.231 HTTP/1.0Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.2;+SV1;+.NET+CLR+1.1. 4322;+.NET+CLR+2.0.50727) - 200 30212 906201X-04-19 16:31:04 GET /index.php - - 115.238.252.231 HTTP/1.0Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.2;+SV1;+.NET+CLR+1.1. 4322;+.NET+CLR+2.0.50727) - 200 30212 1000201X-04-19 16:31:07 GET /index.php - - 115.238.252.231 HTTP/1.0Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.2;+SV1;+.NET+CLR+1.1. 4322;+.NET+CLR+2.0.50727) - 200 30212 1062201X-04-19 16:33:28 GET /index.php - - 218.5.46.237 HTTP/1.1Jakarta+Commons-HttpClient/3.1 - 200 16307 119734201X-04-19 16:42:46 GET /favicon.ico - - 113.206.195.98 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+Trident/4.0;+.NET+ CLR+2.0.50727;+360space) - 200 3364 203201X-04-19 16:42:47 GET /favicon.ico - - 113.206.195.98 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+Trident/4.0;+.NET+ CLR+2.0.50727;+360space) - 200 3364 171201X-04-19 16:50:24 GET /index.php - - 101.226.66.21 HTTP/1.1Mozilla/4.0 - 200 30212 843201X-04-19 16:50:43 GET/wp-content/plugins/dynamic-to-top/js/dynamic.to.top.js ver=3.1.6 - 101.226.66.21 HTTP/1.1 Mozilla/4.0 - 200 439 46201X-04-19 16:50:43 GET /wp-includes/js/l10n.js ver=201X1110 -101.226.66.21 HTTP/1.1 Mozilla/4.0 - 200 592 109201X-04-19 16:50:43 GET/wp-content/plugins/dynamic-to-top/js/libs/jquery.easing.js ver=1.3 - 101.226.66.21 HTTP/1.1 Mozilla/4.0 - 200 5573 171。

IIS日志分析

IIS日志分析

二、通过IIS日志检测入侵攻击1、认识IIS日志IIS日志默认存放在System32\LogFiles目录下,使用W3C扩展格式。

下面我们通过一条日志记录来认识它的格式2005-01-0316:44:57218.17.90.60GET/Default.aspx-80-218.17.90.60Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT +5.2;+.NET+CLR+1.1.4322)200002005-01-0316:44:57:是表示记录的时间;218.17.90.60:表示主机的IP地址;GET:表示获取网页的方法/Default.aspx:表示浏览的网页的名称,如果此外的内容不是你网站网页的名称,那就表示可能有人在用注入式攻击对你的网站进行测试。

如:“/msadc/..蜡..蜡..蜡../winnt/system32/cmd.exe/c+dir”这段格式的文字出现在浏览的网页后面就表示有攻击者尝试能否进入到你的系统目录下。

-80:表示服务器的端口。

-218.17.90.60:表示客户机的IP地址。

如果在某一时间或不同时间都有大量的同一IP对网站的连接那你就要注意了。

Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.2;+.NE T+CLR+1.1.4322):表示用户的浏览器的版本操作系统的版本信息200:表示浏览成功,如果此处为304表示重定向。

如果此处为404则表示客户端错误未找到网页,如果服务器没有问题但出现大量的404错误也表示可能有人在用注入式攻击对你的网站进行测试。

2、检测IIS日志的方法明白了IIS日志的格式,就可以去寻找攻击者的行踪了。

但是人工检查每一条数据几乎是不可能的,所以我们可以利用Windows本身提供了一个命令findstr。

下面以寻找05年1月1日日志中包含CMD字段为例演示一下它的用法。

SEO中轻松学会IIS日志分析的五大要点

SEO中轻松学会IIS日志分析的五大要点

SEO中轻松学会IIS日志分析的五大要点泛泛而谈的seo优化,网站优化,页面的优化布局和分析,无不在我们SEOer 的头脑中形成了一种意识,网站的排名是我们SEOer最为关注的事情了。

平时我们经常说的多的就是通过分析百度相关域和收录、yahoo反向链接以及PR等等来分析我们网站的权重和网站的好坏。

如果是我们的网站出了什么问题,我们做站长的最关心的也就是我们的网站的收录、相关域以及反向链接的变化,在这里我要和大家分享的是IIS日志的分析,下面简单的由我来分析下如何通过IIS日志来跟踪分析搜索引擎蜘蛛。

IIs(internet information services)日志是我们每个网站都具有的功能,只是我们大部分的站长都不怎么去关心它,还有部分站长用的空间或许没有IIs 日志功能,这就需要你去找你的服务器提供商来帮你开通IIS日志功能,只有我们的空间有了这样一个功能后,蜘蛛来到我们的网站了与服务器的对话才会被记录到IIs日志里面,我们通过分析IIS日志就可以知道蜘蛛来我们网站做了什么,爬取和收录了我们的哪些页面,包括蜘蛛来我们网站的爬取次数和地址,哪些是蜘蛛喜欢爬取的,哪些是蜘蛛不喜欢的或者说是无法爬取到的页面,知道这些了我们就能针对蜘蛛爬取的动向来更好的分析和优化我们的网站页面,更清楚我们网站在搜索引擎的动态,那么我们怎么去分析IIS日志?在IIS日志里面找了这样一段代码61.135.168.22 - -[11/Jan/2009:04:02:45 +0800] "GET /bbs/thread-7303-1-1.html HTTP/1.1" 200 8450 "-"通过这一段代码来分析蜘蛛的爬取情况。

第一,我们要知道蜘蛛的名称,有哪些蜘蛛会来我们的网站爬取,这里列出几个比较常见的蜘蛛名,百度->baiduspider、Google ->Googlebot、Msn ->msnbot、yahoo ->Slurp、yodao ->YoudaoBot、sogou ->Sogou+get+spider在日志文件里,搜索以上蜘蛛名称。

分析网站日志

分析网站日志

分析⽹站⽇志分析⽹站⽇志的⽬的?为避免⽹站服务器被攻击;SEO为确定搜索引擎爬⾍访问⽹站情况;蜘蛛爬⾏的流程。

如何分析⽹站⽇志?仅以 IIS7 为例:⽇志的扩展名为 .log1. 打开IIS7,找到⾃⼰要查找的⽹站,⽤⿏标左键点击,然后在右边找到【⾼级设置】选项,⿏标右键点击,选择属性进⼊。

2. 在⾼级设置⾥⾯找到【ID】选项,这⾥是3,说明这个⽹站的⽇志,在ID为3的⽂件夹中。

3. 然后打开系统盘,⽇志⽂件默认保存到系统盘,在系统盘(我的系统盘是C盘)中,找到inetpub——logs⽂件夹。

4. 点击打开⽂件夹,会看到所有⽹站的⽇志⽂件夹都在这个⽂件夹下⾯,还是⼀个⽹站⼀个⽂件夹。

找到ID为3的⽂件夹,这个⽂件夹就是我们要找的⽹站的⽇志⽂件夹。

5. 点击打开后,会看到许多后缀名为.log的⽂件,这些⽂件就是⽹站的⽇志。

分析⽹站⽇志实例解析:如果蜘蛛抓取返回码出现很多的304状态,蜘蛛抓取的次数就会越来越少304状态码表⽰的是蜘蛛来到⽹站抓取内容时,内容和上⼀次来抓取的时,⽹站是没有变化的,也就是没有更新为了更好地了解蜘蛛爬⾏的流程,⾸先需要理解搜索引擎的⼯作原理:搜索引擎为了⾃⾝的⽤户体验,会想尽办法来提⾼检索调⽤率、准确性、新鲜度,这将导致引擎不得不把主要的精⼒放在拥有优质内容源的⽹站上。

惟其如此,搜索结果的质量才能更加符合搜索者的体验。

因此我们可以这样理解:搜索引擎蜘蛛会更加青睐内容源更新频繁的⽹站。

通过特定时间内对⽹站抓取返回的状态码来调节对该⽹站的抓取频次。

若⽹站在⼀定时间内⼀直处于304的状态,那么蜘蛛可能会降低对⽹站的抓取次数。

相反,若⽹站变化的频率⾮常之快,每次抓取都能获取新内容,那么⽇积⽉累,的回访率也会提⾼。

304状态是如何产⽣?服务器为了提⾼⽹站访问速度,对之前访问的部分页⾯制定缓存机制,当客户端在此对这些页⾯进⾏请求,服务器会根据缓存内容判断页⾯与之前是否相同,若相同便直接返回304,此时客户端调⽤缓存内容,不必进⾏⼆次下载,可以说304从某种⾓度起到了减少服务器带宽并提⾼蜘蛛爬⾏效率的作⽤。

如何使用excel轻松分析iis日志

如何使用excel轻松分析iis日志

如何使用excel轻松分析iis日志作为一个seo,应该每天都会遇到这样那样的问题,在出现各种问题后,有一个常识就是先分析一下网站的日志,通过网站日志可以记录各搜索引擎蜘蛛机器人爬行网站的详细情况,例如:哪个IP的百度蜘蛛机器人在哪天访问了网站多少次,访问了哪些页面,以及访问页面时返回的HTTP状态码。

当然,这篇文章不是讲如何通过日志分析问题,而且关于日志的各个参数代表什么,网上已经有很多技术文章,这里只是给大家分享一下如何更清晰直观的查看日志,也许有人说网上有各种日志分析工具,也有人说直接通过查找来分析,但都有一定的局限性,日志分析工具并不能让你分辨真假蜘蛛(很多工具都有模拟蜘蛛爬行),而且很多工具的显示数都有限制;而直接查找更不能批量的分析和统计数据。

其实,我们只要简单的通过excel表格就能得到很直观的数据界面,而且非常便于分析,现在就言规正传,来看一下怎么操作:1.先用文本方式将日志文件打开,删除data前面的文字(包括空格),如图,红框中为必须删除的文字,这样是为了导入之后显示没有错位。

保存,退出。

2.新建一个excel表格,如图选中“数据”→“导入外部数据”→“导入数据”。

3.找到日志所在的文件夹,在文件类型中选中“所有文件”,这时会显示出日志的log文件,双击进行导入。

4.在跳出的“导入向导”对话框中选中“分隔符号”,单击下一步。

然后在“分隔符号”里面选中“空格”选项,然后下一步。

直接点击完成,在新出来的对话框中点击确定。

5.这时,我们就可以看见日志数据很清晰的出现在表格中了,这时候我们要做的就是让数据更便于检索,选中第一行数据,点击“数据”→“筛选”→“自动筛选”。

我们就可以看到第一行都出现了下拉箭头,在这个里面,我们就可以方便的选择想要看到的数据了,例如想看某个页面被访问的详情,就可以在“cs-uri-stem”下拉框中找到相应的页面,如果页面过多还可以在下拉框中选择“自定义”来进行各项操作,方便直观。

IIS网站日志综合分析

IIS网站日志综合分析

IIS网站日志综合分析IIS网站日志综合分析一、日志介绍网站日志是属于服务器中的一种数据记录文本,主要针对网站在运行状态中所产生的各类数据,常规情况下由网站在正常运营的中,由服务器所自己保持记录的数据。

网站日志与网站的服务器程序密不可分,不同的服务器程序在生成网站日志时方法相差相大。

互联网上常见的服务器程序有:Apache 49%,IIS 20% ,Lighttpd 4%本文档侧重于IIS与Apache服务器的日志说明。

二、网站日志与SEO的作用了解搜索引擎抓取网页的问题:1、根据搜索引擎蜘蛛所抓取的情况,我们能够分析出网站在搜索引擎收录中的状态。

2、通过网站日志中的蜘蛛所抓取的数据我们可以清楚的知道,我们网站搜索引擎喜欢哪些页面,哪些页面经常被爬取,而哪些页面爬取频率稍微低一些,从数据我们对网站中不友好的地方做出相应的调整。

3、对搜索引擎蜘蛛在对我们网站在爬去中每日的数据是否正常,是否有太大的变化和不正常的抓取频率。

4、对我们所设置的ROBOTS能够进行跟踪,对所调整后的页面和对蜘蛛进行屏蔽了的页面进行关注和跟进,了解蜘蛛对我们所屏蔽的页面是否有重复或者是继续抓取的情况。

了解网站内容及链接是否正常:1、通过对返回的HTML状态代码我们可以了解网站中是否存在死链接,错误地址。

2、了解网站是否存在内容更新而因设置的关系导致搜索引擎在抓取中无法发觉。

3、网站是否存在了重定向的问题。

4、服务器是否存在稳定性不足,影响搜索引擎的爬去。

5、服务器存在权限不足导致搜索引擎无法抓取。

6、网站是否被植入一些木马病毒或者是一些可疑的文本植入进行对网站的攻击,我们通过对网站日志所保存的数据跟踪能够及时找到问题的根源。

7、网站中是否存在了某些文件被误删的情况,通常比如说图片、文档、CSS、JS文本等等。

网站日志研究对于网站安全的作用:1、了解网站被盗链的情况如果网站出现了第三方网站的盗链,对我网站中的图片、视频、MP3进行绝对路径的调用导致服务器资源被大量浪费,我们从网站日志中能够及时进行处理。

利用IIS日志分析网站安全问题

利用IIS日志分析网站安全问题

利用IIS日志分析网站安全问题内容摘要:随着网站制作技术的普及,网站的安全问题越来越严重,而分析IIS 日志是一种比较常用,比较有效的方法,文章由此出发,介绍了如何分析IIS 日志,利用日志发现安全问题,进而加强安全防范。

关键字:日志、安全、措施IIS提供了一套相当有效的安全管理机制,并且也提供了一套强大的日志文件系统,而IIS日志文件一直都是网站管理人员查找“病源”的有利工具,通过对日志文件的监测,可以找出有疑问的痕迹,得到网站的访问,操作记录,以及系统的问题所在。

1、IIS日志简介1.1 什么是IIS日志II即为Internet Information Server,是英特网信息服务的意思,是一个World Wide Web server。

而这个World Wide Web server的服务一般有三个步骤,第一是服务请求,包含用户端的众多基本信息,如IP地址、浏览器类型、目标URL等。

第二是服务响应,Web服务器接收到请求后,按照用户要求运行相应的功能,并将信息返回给用户。

如果出现错误,将返回错误代码。

第三是追加日志,服务器将对用户访问过程中的相关信息以追加的方式保存到日志文件中。

IIS日志记录了网站服务器接收,处理请求以及运行错误等各种原始信息。

即它可以记录访问者的一举一动,不管访问者是访问网站,还是上传文件,不管是成功还是失败,日志都以进行记录。

1.2 IIS日志文件的存放通过你的网站--> 属性-->“网站”-->“启用日志”是否勾选可以看到日志文件是否启用。

IIS6.0日志文件默认位置为%systemroot%\system32\logfiles\w3svc1\,默认每天一个日志。

不要使用默认的目录,更换一个记录日志的路径,如果不换日志的路径,不对日志进行保护,会很容易被入侵者找到并把日志中的痕迹毁掉,因此建议不要使用默认目录,设置日志文件的访问友限,只允许管理员SYSTEM为完全控制的权限。

IIS日志分析范文

IIS日志分析范文

IIS日志分析范文IIS(Internet Information Services)日志是IIS服务器记录和存储的访问日志,包含了客户端请求的详细信息。

对IIS日志进行分析可以帮助管理员了解和优化网站的性能、安全性和用户行为等方面。

在本文中,我们将介绍IIS日志的结构和内容,并探讨如何对其进行分析。

一、IIS日志的结构和内容1.IP地址:客户端的IP地址。

2.时间戳:请求的时间和日期。

3.HTTP方法:请求的方法,如GET、POST等。

4.URL:请求的URL地址。

5.协议:请求使用的协议,如HTTP、HTTPS等。

6.状态码:服务器返回给客户端的状态码。

7.字节数:请求和响应的字节数。

9.用户代理:请求的客户端浏览器和操作系统信息。

除了上述基本字段,IIS日志还可以包含其他自定义字段,如Cookie、SessionID等。

这些字段的存在可以帮助分析用户行为和进行用户追踪。

二、IIS日志的分析方法对于IIS日志的分析,主要可以从以下几个方面进行:1.网站性能分析:通过分析请求的响应时间和字节数等信息,可以了解网站的性能瓶颈,并进行优化。

例如,可以根据请求的URL和时间戳来识别出访问量最高的页面,从而进行页面的缓存和性能优化。

2.安全事件分析:通过分析IIS日志中的IP地址、状态码和用户代理等信息,可以识别和跟踪潜在的安全事件,如恶意请求、扫描和暴力破解等。

例如,可以根据IP地址的访问频率和请求的URL来判断是否存在恶意攻击,进而采取相应的防御措施。

3. 用户行为分析:通过分析IIS日志中的Referer、URL和用户代理等信息,可以了解用户的访问行为和偏好,从而进行用户分群和个性化推荐。

例如,可以根据Referer和URL来判断用户的关键字和访问路径,进而为用户提供相关的推荐内容和广告。

4.基础统计分析:通过对IIS日志进行基本的统计分析,可以了解网站的访问量、流量和访客数等基本指标,从而进行营销和广告投放。

IIS日志分析工具(点格IIS日志分析器)使用图文教程

IIS日志分析工具(点格IIS日志分析器)使用图文教程

IIS日志分析工具(点格IIS日志分析器)使用图文教程最近服务器经常遭受hacker侵扰。

入侵者技术比较高明,会删除IIS日志文件以抹去痕迹,这时可以到事件查看器看来自W3SVC的警告信息,往往能找到一些线索。

当然,对于访问量特别大的Web服务器,仅靠人工分析几乎是不可能的--数据太多了!可以借助第三方日志分析工具,此处仅仅介绍一款名叫点格IIS日志分析器。

它是一个免费的日志分析工具,可以分析IIS 4/5、Apache和其他日志文件。

该软件简单易用软件名称:点格IIS日志分析器2.0绿色版1:运行IISLogViewer.exe,启动IIS日志分析工具,界面如下图:2:可以选择单个IIS日志文件分析或整个站点文件夹进行分析,这里点击批量文件夹,选择要分析的IIS日志文件目录,如下图:2-1:选择好要分析的IIS日志文件或文件夹后,默认产生日志列表,列表包括日志文件名称和文件大小,如下图:3:点击汇总统计,可以统计列出的文件的基本访问情况信息,如下图,正在加载中:3-1:汇总统计加载完成后,将显示出所有文件各搜索引擎和非搜索引擎的基本访问信息,如下图:4:切换查看明细,可以选择日志文件可以针对单个IIS日志文件进行分析,这里示例按状态码进行分析,右侧显示日志的状态码统计,并有针对状态码的基本说明,如下图:5:双击状态码单元格,将进入状态码明细分析,可针对单个状态码进行分析,同时右侧,还可以按搜索引擎分类显示,点击右侧列表单元格,将在左侧下方显示IP详情,双击IP详情项,将弹出网页显示IP的所在地,如下图:6:除了按状态码分析,切换24小时,还可以按时段进行分析,右侧按时段显示24小时的各搜索引擎和非搜索引擎访问情况,如下图:7:双击24小时列表单元格内的信息,将弹出24小时明细,进行时段内更详细的分析,如下图,也可以按搜索引擎分类显示,单击列表单元格信息,也可显示IP详情,双击IP详情,同样会弹出网页显示IP地址。

windows系统IIS日志分析

windows系统IIS日志分析

windows系统IIS⽇志分析⼀、IIS⽇志介绍: 1.IIS简介: IIS全称Internet Information Services,是由微软公司提供的基于运⾏Microsoft Windwos的互联⽹基本服务,IIS是⼀种Web(⽹页)服务组件,其中包括Web服务器、FTP服务器、NNTP服务器和SMTP服务器,分别⽤于⽹页浏览、⽂件传输、新闻服务和邮件发送等⽅⾯,它使得在⽹络(包括互联⽹和局域⽹)上发布信息成了⼀件很容易的事。

IIS可设置的内容包括:虚拟⽬录及访问权限、默认⽂件名称、⽬录浏览。

2.IIS⽇志的路径: Server 2003,路径为:C:\WINDOWS\system32\LogFiles; Server 2008/R2,路径为:C:\inetpub\logs\LogFiles。

Win10系统默认的IIS服务是关闭的,如果需要开启服务,参考: 3.W3C扩展⽇志⽂件格式: 转⾃博客: 下⾯是⼀段常见的IIS⽣产的W3C扩展WEB⽇志: 2011-09-01 16:02:22 GET /Enterprise/detail.asp 70.25.29.53 http:/ /www /searchout.asp 202 17735 369 4656 date time s-ip cs-method cs-uri-stem cs-uri-query s-port(#7) cs-username c-ip cs(User-Agent) cs(Cookie) cs(Referer) cs-host sc-status sc-substatus sc-win32-status time-taken 这个⽇志可以解读为:IP是70.25.29.53,来⾃"/searchout.asp"的访客,在2011-09-01 16:02:22,访问(GET)了主机的/Enterprise/detail.asp,访问成功,得到17735字节数据。

IIS日志分析工具

IIS日志分析工具
安装Log Parser Studio 2. 下载地址:
运行
安装完成第一个文件之后,解压第二个文件,直接运行LPS.者日志目录都可以:
2. 创建查询 点击“Create a new queyr”按钮,修改查询语句中的“LOGFILEPATH”:
3. 修改日志类型查询 设置日志类型,然后点击查询:
大神你好这篇文章写的非常棒但是我有一个疑问针对你提出的第三个场景中的优化您文章中说到使用标签跳转来避免打开新浏览器的问题你说的标签是powerbi中的书签功能吗另外这个要怎么去实现这个
IIS日 志 分 析 工 具
发现一个强大的图形化IIS日志分析工具:Log Parser Studio。
安装
1. 需要先安装Log Parser 下载地址:

如何查看网站空间IIS日志与分析

如何查看网站空间IIS日志与分析

如何查看网站空间IIS日志与分析前言一个网站一直以来都有个问题困扰着他们,这个网站的注册一共分为4个步骤就是通过四次下一步就能够完成网站的注册,他们发现这个注册页面每10000个人都来到了注册的第一步,但是到第四个步骤完成注册的人却只有几十个,这个是一个非常大的落差,但是他们一开始也没有太注意,认为可能只是根据人的习惯不同而导致的,但是在一次日志分析中意外发现有某一个页面出现了90000多次的404状态码,经过查看之后发现这个页面正好就是这个注册页面的第二个步骤相应的页面,因为程序出现了一些问题导致很多时候点击下一步的时候出现错误导致无法完成注册。

可以想象这么多用户流失是一个多么大的损失,而这些都是流量统计工具无法找到的,如果能够及时的分析网站的日志就能够早点发现这个问题避免损失的出现。

什么是网站日志?网站日志是记录web企业虚拟主机服务器接收处理请求以及运行时错误等各种原始信息的以.log结尾的文件。

用我自己的理解就是我们可以通俗的认为他就是一个流水账,就像是你今天早上吃了啥,谁来了你家做客等等统统记下来的一本流水账,只不过这本流水账使用的是自己的方式记录的,我们也许看起来不是那么方便,如果你对服务器返回代码比较熟悉的话是没有多大问题,如果你对代码不熟悉那就头痛了,那么我们这个时候就要用到IIS日志分析工具了。

有了IIS日志分析工具我们就能够很直观了了解到今天自己的网站发生了哪些事情,是否有蜘蛛来过。

网站IIS日志分析工具推荐下(光年日志分析工具)下载光年日志分析系统2.0光年日志分析系统光年日志分析系统报告光年日志分析系统功能光年日志分析系统是国平的公司开发的一款日志分析统计,也是现在大家都比较喜欢的一款日志分析工具,功能也比较强大,反馈的日志报告也能够很直观的给出我们想要的信息虽然还有一些其他分析工具这里就不一一介绍了性质都差不多,具体使用步骤:1.登入自己万网购买空间后台(不是网站后台),然后在自己主机管理选项里找到(空间日志IIS下载)不同空间说法不一样,只要看到有关日志一类的选项即可,然后点击下载,下载可以选择下载哪一天的日志,下载成功后他会在你FTP根目录(wwwlog)文件夹下自动创建,可能不同空间名字不同。

如何分析ISS日志及其重要性

如何分析ISS日志及其重要性

分析iss日志都知道很重要,但是却很少去重视它。

通常网站的基本数据都可以通过百度统计、站长工具可以查到,但是有些东西想通过这些常用的工具并不能全名链接网站的一些细节方面,比如说蜘蛛的爬去方式。

通过iss日志我们可以很好的观察到网站被搜索引擎蜘蛛爬去的方式。

对于SEO优化人员来说,IIS日志就是我们网站优化的指南针,就是我们优化的晴雨表,能够通过分析IIS 日志能够有效的修正我们网站优化的方向,从而加快SEO 优化的进程,说明IIS日志对于SEO优化人员来说是至关重要的,那么IIS日志我们应该如何分析呢?iss日志我们可以做些什么呢?1、可以简介的分析网站的反链情况2、我们的空间的稳定性3、蜘蛛喜欢我们哪些网页?4、蜘蛛什么时候来的最新综艺节目通常我们看我们的iss日志的时候,通常情况下是看有多少的200状态吗,那么iss日志就那么点功能吧。

其实不是这样的,下面通过一些方面给大家介绍一下为什么seoer 要养成看日志的习惯。

一、iss日志重要型表现在那些方面?1.通过iss日志我们可以间接的发现蜘蛛在爬去你网站的时候的频繁度,蜘蛛通过外部链接来爬去你网站的的时候的内容,可以通过iss日志发现蜘蛛的抓取方式与轨迹。

外链的数量其实可以间接的反应你网站的的外链做的成功度。

2这些我们同时可以通过网站最新综艺娱乐节目的iss日志可以看见.iss日志的更新频率与网站的内容更新频率有一定的关系,网站的更新同时与网站的微调也有一定的关系!3.我们可以通过iss日志去发现我们空间那些地方出现问题了。

这些东西都可以提前做好预警。

通过iss日志分析我们可以间接的分析出一个网站空间的稳定性,我们可以很好4.其实搜索引擎能够通过各种代码来分析你网站建设的质量如何,比如404页面太多,那么返给他的结果是非常差的,是不会给你很好的排名,所以网站的logfile文件代码对于网站的优化时多么的重要!5.第三.我们可以根据IIS日志的反应情况,对我们的空间的某些事情和问题提前进行预警,因为服务器如果出问题的话在IIS日志中会第一时间反映出来,要知道服务器的稳定速度和打开速度两者都会直接影响我们的网站。

IIS日志位置及查看方法

IIS日志位置及查看方法

二、Internet信息服务日志
1、FTP日志默认位置:%systemroot%\system32\logfiles\msftpsvc1\,默认每天一个日志
2、WWW日志默认位置:%systemroot%\system32\logfiles\w3svc1\,默认每天一个日志
三、Scheduler服务日志默认位置:%systemroot%\schedlgu.txt
怎么查看IIS【如何查看IIS日志】iis日志存放位置 及 查看方法
IIS:控制面板--管理工具--internet信息服务
网站的IIS日志是在空间里面看的、要登陆到空间里面的一个IIS日志里面看、IIS日志一般都很大的、看会有点。。
一、应用程序日志、安全日志、系统日志、DNS日志默认位置:%systemroot%\system32\config,默认文件大小512KB,管理员都会改变这个默认大小。
1、安全日志文件:%systemroot%\system32\config\SecEvent.EVT
2、系统日志文件:%systemroot%\system32\config\SysEvent.EVT
3、应用程序日志文件:%systemroot%\system32\config\AppEvent.EVT
304 未修改 — 未按预期修改文档。
305 使用代理 — 必须通过位置字段中提供的代理来访问请求的资源。
306 未使用 — 不再使用;保留此代码以便将来使用。
4xx 客户机中出现的错误
400 错误请求 — 请求中有语法问题,或不能满足请求。
401 未授权 — 未授权客户机访问数据。
200 和404,301同属码及其含义。

C#分析IIS日志(Log)

C#分析IIS日志(Log)

C#分析IIS⽇志(Log)由于最近⼜要对 IIS⽇志 (Log) 分析,以便得出各个搜索引擎每⽇抓取的频率,所以这两天⼀直在尝试各个办法来分析 IIS ⽇志 (Log),其中尝试过:导⼊数据库、Log parser、Powsershell 等等⽅法,最后改⽤的是c# 读取 IIS ⽇志的⽅法,性能最好,定制化也⽐较能满⾜需求。

读取 100M 的 log⽇志,⼤概10⼏秒就能完成,下⾯是⼀个读取IISlog⽇志分析各个爬⾍来的数量的例⼦://百度爬⾍标识符号: Baiduspider//⾕歌爬⾍标识符号: Googlebot//搜狗爬⾍标识符号: Sogou+web+spider//搜搜爬⾍标识符号: Sosospiderprivate void button1_Click(object sender, EventArgs e){int Baidubot = 0, Googlebot = 0, Sogoubot = 0, Sosobot = 0;//log ⽇志的⽬录string url = textBox1.Text.Trim();FileStream fs = new FileStream(url, FileMode.Open, FileAccess.Read, FileShare.ReadWrite);#region循环读取⽂本,并统计各个爬⾍次数using (StreamReader sr = new StreamReader(fs, System.Text.Encoding.Default)){string line = string.Empty;while (!string.IsNullOrEmpty(line = sr.ReadLine())){if (line.Contains("Baiduspider")){++Baidubot;}else if (line.Contains("Googlebot")){++Googlebot;}else if (line.Contains("Sogou+web+spider")){++Sogoubot;}else if (line.Contains("Sosospider")){++Sosobot;}}}#endregionlabel2.Text = "搜索引擎光顾次数:\n\r\n\r";label2.Text += "百度:" + Baidubot + "\n\r\n\r";label2.Text += "⾕歌:" + Googlebot + "\n\r\n\r";label2.Text += "搜狗:" + Sogoubot + "\n\r\n\r";label2.Text += "搜搜:" + Sosobot + "\n\r\n\r";}。

相关主题
  1. 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
  2. 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
  3. 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。

分析IIS日志的最有效方法IIS日志分析方法和技巧:一、IIS日志的介绍IIS日志:即服务器日志,记录服务器上的一些访行为和状态.二、IIS日志的作用(1)是否有死链接、错误链接 (404状态码,可用robots进行死链接链接)(2)查看服务器是否正常(500,501,502状态码)(3)了解蜘蛛访问网站的频率(查看时间)(4)了解用户访问形为(即用户访问了哪些页面)(5)了解网站的安全信息例如:13:46:07 127.0.0.1 GET /scripts/..\../winnt/system32/cmd".exe 401 13:46:07 127.0.0.1 GET /scripts/..\../winnt/system32/cmd".exe 200 13:47:37 127.0.0.1 GET /scripts/..\../winnt/system32/cmd".exe 401如果出现上述这些命令,则表示有人在扫描你的网站(6)分析用户喜欢访问哪些栏目三、怎么下载IIS日志(1)如果是空间,可以在空间后台下载或找空间商(2独立服务器或VPS,进入服务器或VPS进行设置即可四、分析IIS日志例如:例如:#Software: Microsoft Internet Information Services 6.0#Version: 1.0#Date: 2012-04-19 16:03:02#Fields: date time cs-method cs-uri-stem cs-uri-query cs-username c-ip cs-version cs(User-Agent) cs(Referer) sc-status sc-bytes time-taken 2012-04-19 16:03:01 GET /robots.txt - - 123.125.71.81 HTTP/1.1Mozilla/5.0+(compatible;+Baiduspider/2.0;++/searc h/spider.html) - 200 574 152012-04-19 16:08:18 GET /index.php - - 222.77.187.33 HTTP/1.1Mozilla/5.0+(compatible;+MSIE+8.0;+Windows+NT+6.1;+Trident/5.0) - 200 30212 8592012-04-19 16:14:19 GET /favicon.ico - - 221.11.16.172 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+Trident/4.0;+.NET+ CLR+2.0.50727;+360space) - 200 3364 1562012-04-19 16:16:30 GET /index.php p=246 - 203.208.60.235 HTTP/1.1 Mozilla/5.0+(compatible;+Googlebot/2.1;++/bot.ht ml) - 200 14802 25462012-04-19 16:17:31 GET /index.php p=401 - 211.154.149.132 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+8.0;+Windows+NT+6.1;+WOW64;+Trident/4.0 ;+SLCC2;) - 200 18817 9372012-04-19 16:24:35 GET /index.php paged=3 - 180.153.227.29 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.1;+SV1)/s?wd= blog&pn=70&rsv_page=1 200 22752 10002012-04-19 16:29:46 GET /index.php feed=rss2 - 209.85.238.197 HTTP/1.1 Feedfetcher-Google;+(+/feedfetcher.html;+1+subsc ribers;+feed-id=13463723763221171900) - 304 326 11092012-04-19 16:31:01 GET /index.php - - 115.238.252.231 HTTP/1.0 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.2;+SV1;+.NET+CLR+1.1. 4322;+.NET+CLR+2.0.50727) - 200 30212 11252012-04-19 16:31:04 GET /index.php - - 115.238.252.231 HTTP/1.0 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.2;+SV1;+.NET+CLR+1.1. 4322;+.NET+CLR+2.0.50727) - 200 30212 9062012-04-19 16:31:04 GET /index.php - - 115.238.252.231 HTTP/1.0 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.2;+SV1;+.NET+CLR+1.1. 4322;+.NET+CLR+2.0.50727) - 200 30212 10002012-04-19 16:31:07 GET /index.php - - 115.238.252.231 HTTP/1.0 Mozilla/4.0+(compatible;+MSIE+6.0;+Windows+NT+5.2;+SV1;+.NET+CLR+1.1. 4322;+.NET+CLR+2.0.50727) - 200 30212 10622012-04-19 16:33:28 GET /index.php - - 218.5.46.237 HTTP/1.1Jakarta+Commons-HttpClient/3.1 - 200 16307 1197342012-04-19 16:42:46 GET /favicon.ico - - 113.206.195.98 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+Trident/4.0;+.NET+ CLR+2.0.50727;+360space) - 200 3364 2032012-04-19 16:42:47 GET /favicon.ico - - 113.206.195.98 HTTP/1.1 Mozilla/4.0+(compatible;+MSIE+7.0;+Windows+NT+5.1;+Trident/4.0;+.NET+ CLR+2.0.50727;+360space) - 200 3364 1712012-04-19 16:50:24 GET /index.php - - 101.226.66.21 HTTP/1.1 Mozilla/4.0 - 200 30212 8432012-04-19 16:50:43 GET/wp-content/plugins/dynamic-to-top/js/dynamic.to.top.js ver=3.1.6 - 101.226.66.21 HTTP/1.1 Mozilla/4.0 - 200 439 462012-04-19 16:50:43 GET /wp-includes/js/l10n.js ver=20101110 -101.226.66.21 HTTP/1.1 Mozilla/4.0 - 200 592 1092012-04-19 16:50:43 GET/wp-content/plugins/dynamic-to-top/js/libs/jquery.easing.js ver=1.3 - 101.226.66.21 HTTP/1.1 Mozilla/4.0 - 200 5573 1712012-04-19 16:50:43 GET /wp-includes/js/jquery/jquery.js ver=1.6.1 - 101.226.66.21 HTTP/1.1 Mozilla/4.0 - 200 91314 6402012-04-19 16:52:23 GET /robots.txt - - 208.115.113.89 HTTP/1.1 Mozilla/5.0+(compatible;+Ezooms/1.0;+ezooms.bot@) - 200 555 296分析如下:#Software: Microsoft Internet Information Services 6.0#Version: 1.0 这是版本号#Fields: date time cs-method cs-uri-stem cs-uri-query cs-username c-ip cs-version cs(User-Agent) cs(Referer) sc-status sc-bytes time-taken 这是文本定义,具体可对照下面二张图片例如:2012-04-19 16:03:01 GET /robots.txt - - 123.125.71.81 HTTP/1.1 Mozilla/5.0+(compatible;+Baiduspider/2.0;++/searc h/spider.html) - 200 574 15其中四个最主要参数(1)访问路径 /robots.txt(2)访问者IP 123.125.71.81(3)Baiduspider 百度蜘蛛(4) 返回的状态码 200 574 15(其中200为正常访问,574表示抓取的字节数,15表秒花费了的毫秒)注:怎么判断是不是百度假蜘蛛点击“开始”-“运行”-“cmd”-“nslookup IP地址”-“回车”代码具体如下:2xx (成功)表示成功处理了请求的状态代码。

代码说明200 (成功)服务器已成功处理了请求。

通常,这表示服务器提供了请求的网页。

201 (已创建)请求成功并且服务器创建了新的资源。

202 (已接受)服务器已接受请求,但尚未处理。

相关文档
最新文档