代理猎手的使用技巧和说明
- 1、下载文档前请自行甄别文档内容的完整性,平台不提供额外的编辑、内容补充、找答案等附加服务。
- 2、"仅部分预览"的文档,不可在线预览部分如存在完整性等问题,可反馈申请退款(可完整预览的文档不适用该条件!)。
- 3、如文档侵犯您的权益,请联系客服反馈,我们会尽快为您处理(人工客服工作时间:9:00-18:30)。
代理猎手的使用技巧和说明
代理猎手验证输出结果的含义
以
10.48.72.2:80@HTTP$6&263,1987,2543#哈尔滨
为例
10.48.72.2 表示为代理服务器的IP地址为10.48.72.2 :80 “:”后的80表示该代理服务器的服务端口为80(21、23、80、81、1080、3128、8080等)
@HTTP “@“后的HTTP表示该代理服务器的类型为HTTP代理(HTTP、FTP、SOCKS4/5、TELNET五类)
$ ”$”后的数值表示代理服务器验证状态
$4:正在验证
$5:验证超时(网络连接太慢,再校验多几次会有所发现)
$6:免费的(这才是我们所要的^.^)
$7:要密码(可以用demo/demo、guest/gues、temp/temp、share/ahare、test/test 作为口令/密码试试)
$8:不合符协议
$9:不匹配(如果代理服务器太忙也会出现这种情况)
$10:不支持的协议
$11:无法确定
& "&"后的以“,” 分隔的三个数值是反映该代理本地连接的三个时间特性
第一个是反应速度,第二个是校验时间,第三个是连接时间;
所以当然也就是数值越小的代理就是越快的。
#后面的地址为注释,能看出代理的地理位置,一般需要用代理定位软件来完成。
用代理猎手验证代理时,总有些地址明明验证的结果是free,使用时却总是连接到固
定的网站,如“漯河信息港”,“宁夏吉通分公司”之类,对此一直不知原因,还以为是
代理猎手的Bug。
前几日搜索某学校校内的代理服务器,为求速度,以该学校主页为验证
数据,其特征字串为“某某大学”(即title标签中内容)。
结果搜出的服务器有连接到
“某某大学图书馆”,“某某大学某某学院”的,于是豁然开朗,打开“漯河信息港”,
“宁夏吉通分公司”等页面查看其源代码,果然在其主页里发现了“Google”字样,而这
正是我(估计大家也是)常用的验证数据,原来这就是罪魁祸首!于是将Google 的标题连
同其标签一起作为特征字串(即“<title>Google</title>”),再进行验证,果然没有
了一些网站鱼目混珠的现象发生。
原来代理猎手的验证方法就是在获得的整个页面中搜索特征字串,搜到了就认为
这个
服务器为free,因此有此错误。
而用Intel等网站作验证时,由于其标题较为复杂(如
“Welcome to Intel”,故无此问题发生。
特将此经验与各位共享。
前面看到有些站友说用代理猎手效率低,很难搜到代理,我个人感觉教育网内的免费代理一般是比较多的,只要有时间,很容易搜到很多代理。
根据我的经验,搜不到代理可以与以下几个方面有关:
1、协议和端口的设置,常于的http代理端口有80、8080、8888、8888、3128等,socks端口有1080、10080等,如果你设置搜索的端口没有包含代理的端口,当然就搜不到了。
所以要尽可能多地设置搜索端口,但是,相应地,搜索的时间就要长一些。
2、验证数据的设置,这是最重要的一点,代理猎手向所搜索或验证的代理发送访问“验证资源地址”的命令,并将返回的信息的头部与“验证资源参数”相比较,如果返回的信息头部中含有“验证资源参数”,结果即为free。
如果有返回结果,但不含有验证资源参数,结果即为“不匹配”,可以用于反向验证代理。
所以,我们选择验证资源参数时,一定要选择“验证资源地址”网页源文件的头部,一般选择<title></title>中的部分。
3、验证地址的选择,很多人搜索代理时喜欢直接验证某数据库,但是这样做对于教育网内用户成功率极低。
因为订阅数据库的一般都是大学,而大学对于出国IP控制是非常严格的,很难找到。
而大学内的很多数据库就非常有用,所以对于我们来说,只要能使用校内资源就很有用了。
这样,只要搜索到能访问国内的代理就可以了。
所以,建议先用国内网站验证,比如新浪或网易。
free的结果就可以直接访问该大学的数据库。
再用国外网站验证,如果有成功的话,你就发达了。
4、搜索网址范围的选择,所搜索的网址范围必须是你可以直接访问的,即在IE 中不需要设置代理即可访问,或者可以直接ping到的,(只有这样的代理你才能使用)否则是不可能验证到任何代理的。
所以教育网内用户无法直接验证国外代理。
解决方法:我自己摸索出来的,不知道是不是最好的,请高手指点。
使用sockscap,当然,前提是你要有可用的能直接访问你所搜索IP段的socks 代理,或者用socks2http这样的软件。
把代理猎手的快捷方式拖到sockscap
的窗口中运行,这样,就可以验证代理可以直接访问的IP段了。
注意,代理一般都有数据限制,所以线程不可过大,一般只能10个左右。
5、启用先ping后连的机制虽然可以大加快搜索的速度,但是经常会漏掉很多代理,如果不是很急的话,不推荐使用。
6、 socks代理的应用,有些初学代理的朋友可能觉得socks代理没什么用处,甚至不去验证。
殊不知,socks代理是最有用的。
譬如说,有很多数据库可以穿透代理,即使使用了代理,它也能穿透代理看到真实IP而无法使用,譬如Kluwer 数据库就是这样,但是它却不能穿透socks代理,因些,用 socks代就可以使用。
而且,把http代理用socks2http或httport转为socks协议也可以,大家不妨一试。
以上是我搜索代理的一点体会,希望对新手有所帮助,欢迎高手指点。
三、代理猎手在文献检索中应用的部分帖子
找一个能下载该期刊文章的代理试一试,用关键词检索后,会出现一个显示结果的页面,记住该页面的url(即地址栏显示的东东),在代理猎手的代理验证参数中,地址栏填刚才的url,验证词填你选用的关键词,ok,你可以开始验证了。
其实得到代理,有如下三种方法:
方法一,网上可以找到很多很好的代理网站,"检索高手经验谈”中就介绍了一些好的代理网站,比如proxy365, chinaproxy等等,这些网站里面经常会公布一些代理列表,当然有些代理并不能查阅文献,这需要你去验证(我建议用proxyhunter去验证)。
方法二,你用代理猎手或者其它网络端口扫描的程序去搜索大学的IP端(建议搜索美国的高校,中国的高校搜索时一定要谨慎),http端口为80,8000,8002,8080,1008,3128等,这样你可以得到一些代理,而后再验证是否能查文献。
方法三,如果你的确找不到,你可以像检索高手们求助,向他们要代理,大侠们向来乐于助人的!
至于验证,方法有二:
方法一:先用windows开始菜单的运行命令,命令关键字迹为ping ,如你搜索到的代理为202.***.****.***:3128,你可以ping 202.***.****.***,如果不显示requested time out ,你可以将代理填入你的浏览器的代理设置栏,而后上你要查文献的网站,如果你能查到全文,ok,你成功了!
方法二,选择软件验证,这要选好验证关键词。
这些关键词可以从以下途径得到:(1)找能上该网站的同学或者网上的大侠发给你。
(2)自己得到其它代理后,上查文献的网站,记住一些验证关键词,留着备用。
这些是我的个人检索经验,请大家补充。
ittle0的检索经验:
1.要善于利用site:****命令。
检索一定不要一把抓,我习惯于局限于一定地区去找,如KR,TW,MY等,要想在USA,UK,FR找密码,真是太费劲了,不过不是不可能,一定要有选择的找,后面我会讲到。
site:edu password journal 这是查米国的
site: password journal这是查日落帝国的
site:edu.au password journal 查袋鼠国的,
等等等等!!!
2。
不要一味局限在大学
大学图书馆固然是我们寻找的重点,但一定不要忽视了其他地方,如一些高中图书馆,特别是美国的,还有就是一些国外大公司的网站,如SAMSUNG,LG等。
3。
要注意数据库也具有地域性
一些数据库如OVID,EBSCO,OCLC在一些国家可能用得很多,在另外一些国家可能就很少用。
不信你可以总结一下这些数据库在某些国家出现的规律,你会大吃一惊!!!?
4。
不要总局现在国外
国内一些高校的图书馆很值得一看,不信去同济大学图书馆看看
5找原文不一定都是PDF格式,几个关键词加上作者名足够了
我的很多文章都是以HTML的格式找到的,所以如果只以PDF来找,可能会漏检。
6。
善于利用文章后面的E-MAIL
这一点就不多说了,外国学者很好的!
7。
国外的一些民间机构,也是寻找的重点
仔细找一找,定有收获
8。
不要回事了一些TXT.HML文件
找密码时,经常会遇到PASSWORD出现在上述一些文件中,千万别放过。
9.请在google搜索栏中键入:
site:ru springer password。