24小时热门版块排行榜    

查看: 385  |  回复: 0
当前主题已经存档。

lvweifu

新虫 (初入文坛)

[交流] 【转贴】文献检索概述(2)

第十讲,专讲一个特殊语法,很有用:inurl。

“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后
,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。

示例:查找MIDI曲“沧海一声笑”。
搜索:“inurl:midi 沧海一声笑”
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。

示例:查找微软网站上关于windows2000的安全课题资料。
搜索:“inurl:security windows2000 site:microsoft.com”

结果:已在microsoft.com内搜索有关inurlecurity windows2000 的网页。
注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。例如,GOOGLE会把“cgi-bin/phf”中的“/”当成空格处理。
而一般众多密码或数据库往往出现在链接之中,如查Ideallibrary 
inurl:ideallibrary proxy passowrd(ID)

“allinurl”语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。

示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。
语法:“allinurl:"cgi-bin" phf +com”
搜索:已向英特网搜索allinurl:"cgi-bin" phf +com. 共约有37项查询结果,这是第1-10项 。 搜索用时0.36秒

这语法若能活用,用途十分大!

补充讲site语法
site即将搜索定位于某一个域名上,有利于缩小搜索范围,提高搜索效率 。如keywords site:edu,效果很好!可以方便地搜索到各大学内有用的资源,至于关键词的选择,其它讲都有了。
site:tw, site:edu.tw, site: edu.cn.......
这是定位于国家或地区,将搜索局限于某些国家或地区,或加上edu,则是这些国家或地区的大学,效果自然更好。如果site:mu.edu.cn则搜索国内医科大学内的资源(会漏综合性大学的资源的,要慎用)。
一般的,欧美人的版权意识强,一般密码不易公布,相反,非洲、美洲、亚洲则往往公开密码,这是获得密码的最重要来源之一,善于利用这些地方的资源有助于提高搜索效率。

这是site两大好处,不可忽视!

今天讲第十二讲,顺便说一句,这里所有的内容几乎都是版主手敲进去的,绝大部分内容是原创的,少数引用其他人一些技巧,但看上去大家对它的热情并不是很高,不知是什么原因,是不是我写得太差了,或没有用?希望大家多发点意见。

下面讲代理。

国外的数据库,许多需代理,如何搜索到?普通的代理遍地都是,只要用google输入proxy free或代理服务器 免费就能搜索到非常多的代理,但这些代理并不适用于查阅一些著名数据库,好么如何找到?一般有以下几点技巧,我并作简要分析:
由于这些代理必须要出现于大学内。
(1)因而如果采用普通的免费代理,则必须保证这种代理在某个大学,这可通过代理测得,其中无特别的技巧。可见下面一个代理服务器帖子的说明。
(2)如果要搜索,则应该将代理服务器限制于大学内,因而其搜索格式应该如下:
proxy 数据库名 site:edu
这是标准格式,搜索的数据库较多,但一定注意并不等于搜索出的代理都有用,有些代理还需密码支持,仔细判定。
其它类似可选关键词也列一些,与上述核心关键词适当组合便可,提高搜索准确率:
Off-Campus:能提高无密码搜索成功率
netscape:能提高准确率
大家试试,再花些工夫,我想一定收获大大的。 sciencedirect甚至都可找出上面讲代理,有时甚至要先找代理,后找密码,二者可结合起来,当然麻烦是肯定的。

另外,代理未必一定找美国的(site:edu),也可考虑找台湾等其它地方,其格式可换为site:edu.tw,site;edu.fr, site:edu.kr等等,收获往往更大。这也是一些小的 经验,大家在平时注意积累,会有很多发现的。

再补充讲几句用google查密码。大多数人用google,仍未能对google有深入地了解。往往用google搜索出大量密码,一用才知道都过期了,尤其是中文的密码,现在更新极度频繁,如何能查到最新的密码很重要。在前面几讲我讲过百度的更新较google快,然而百度对
链接分析能力较google差,google能分析到下四层链接,而百度可能只能至第三层,而往往密码出现的位置:大学主页--图书馆---电子数据库---某些数据库密码,从这个分析可以看到,许多密码都出现在主页的第四层下面,百度往往搜索不到(当然第三层也有很多,这是百度长处之一)。因而搜索中文密码google仍很重要,那么如何用最新的google?
google的中文数据库一月一更新(太慢了,英文的一天一更新),但 google在全球有数千台服务器,它们对各种语种更新的速度是不同的。并且更新方式采用梯度更新,即先更新某些服务器,后来全面更新。因而我们能利用google最新的服务器搜索,而 goole最新服务器的链接在这里:
http://www3.google.com.可试试我的主页:生物谷。新服务器已收录了,在第二项,而普通www.google.com还没收录(到一月后)。采用新服务器搜索中文密码效果非常好!大家试试,若有效果,请留言!

再说一句,这里所有讲座都是本人心血,望勿转于其它论坛!

还补充几点:
1。不要一味局限在大学。
大学图书馆固然是我们寻找的重点,但一定不要忽视了其他地方,如一些高中图书馆,特别是美国的,还有就是一些国外大公司的网站,如SAMSUNG,LG等。
2。要注意数据库也具有地域性。
一些数据库如OVID,EBSCO,OCLC在一些国家可能用得很多,在另外一些国家可能就很少用。不信你可以总结一下这些数据库在某些国家出现的规律,你会大吃一惊!!
3。不要总局现在国外,国内一些高校的图书馆很值得一看,不信去同济大学图书馆看看。
4。找原文不一定都是PDF格式,几个关键词加上作者名足够了。
我的很多文章都是以HTML的格式找到的,所以如果只以PDF来找,可能会漏检。
5。善于利用文章后面的E-MAIL。
这一点就不多说了,外国学者很好的!
6。国外的一些民间机构,也是寻找的重点。仔细找一找,定有收获!
7。不要回事了一些TXT.HML文件。
找密码时,经常会遇到PASSWORD出现在上述一些文件中,千万别放过。

再补充一点,大家看到这时,应该主动用google实战一下,先花一个小时,你一定会有不少收获的,否则看完后也忘得差不多了



五、过期密码反查法。

目前公布的过期密码十分多,还有部分是过期代理(甚至是scciencedirect的),我们可将这些过期的username password或proxy输入到google后,再打开该页,往往会出现已更新的内容!很简单的方法,但效果不错!
但google对210.45.17.138等这样的代理极不敏感!一般不要用google搜索,可考虑用其它引擎(具体见主页下方的搜索引荐及其中的帮www.bioon.com)
举例如下:

这是一过期密码:
ScienceDirect (Username: andong, Password: andong)
再输入sciencedirect andong试试,一下子便能找到该密码原来所属的页面:
http://lib.andong.ac.kr/e_db.htm
进一步深入下去,会有一定的收获的,虽然不一定还有sciencedirect。

补充讲一点google其它功能。
利用google查缩略词的全称,如果写作时突然忘了某个缩略词的全称,当时手头若有金山词霸等软件则要,若无可考虑使用google,将其中文名与其缩略名作为关键词搜索,效果很好,如:
不知道血管活性肠肽(VIP)的全称,可在google中输入
血管活性肠肽 VIP
不出几条便出现全称。
再如如果要找某个英文单词的中文名称,如troponin,我不知道中文是如何称呼的,这样你同样可以利用google,只要你知道这个东西是什么地方的,或者是什么属性的就可以找到,如我知道它可能是心脏内的一种蛋白,这样你就有两种方法搜索到它的中文名称:
troponin 蛋白
或者:troponin 心
讲到这里我想到了搜索电话,如果我想知道某个公司的电话,往往许多人喜欢这样选关键词:公司名称 tel,结果得到的根本不是你需要的。如果你知道这个公司的性质或属于什么地方的,则可以这样搜索:区号 公司名,这比上述关键词要有效得多,这也涉及到搜索效率的问题。今后将后有更多的讲座。因为在当今互联网上,你永远不会愁你找不到东西,而是东西太多,你无法找到你需要的东西,因此搜索效率便成为最重要的一环,搜索效率直接关系到搜索的关键词的选择。

另外,google是最全的英中词典,你找到一个英文词,却不知中文怎么办?
用google,写出英文词,然后大概了解一下这个词属于哪一个学科,再用加用一个中文关键词搜索一下,效果很好。
如urotensin不知道中文意思,但我知道它是收缩血管的药物,这时用urotensin 血管 收缩查一下,可能会出现一些文章或综述内,其中便附有这个词的中文了,当然应该用ctrl+F快速查找,提高效率。

一条通知:百度开展了flash文件搜索,但目前仍处于试用期,效果不太理想,但值得我们密切关注!
在google中搜索flash文件方法:
关键词 filetype:SWF
如某个朋友过生日,但苦于自己不会做flash,送过网易的吧,上面还有广告,可利用google搜索一下,输入birthday filetype:SWF
好多精美的flash.
若自己女友过生日了,怎么办?
love filetype:SWF
或loveyou filetype:SWF
瞧这个经典的flash:
http://bbs.bioon.com/bbs/dispbbs ... ID=2994&ID=2994
酷!
当然了,mp3文件,RA,RM格式电影都可用这种方法搜索。

六、代理服务器搜索技巧!

国内许多大学,如清华、上海交大都购买了Elsevier等数据库,采用的方式实质是IP限制,因而只要找到他们的代理服务器便一切OK了!而且查国内的数据库,如CNKI,万方,也不会提示什么IP地址不对的消息了。那么我们的目标便只是这些学校的代理服务器了。

方法一:采用代理猎手,输入这些学校的IP地址范围,逐个搜索。
方法二:在google中输入 上海交通大学 今日代理
注意:由于代理服务器使用时间短,因而往往采用论坛等形式更新,而取名也是今日代理,瞧瞧!会有意想不到的收获!当然若搜索的结果过少,则改用免费代理试试。
我提供一个极好的站点http://catalyst.dhs.org/
利用其代理,可找到国内外多种文献,我试过,速度快,好用,而且教育网用户可也以用。
七、如何获得网络的无穷无尽的资源?

尤其是教育网用户一般不有上国际网更难了。
其实我们应该看到在中国主要有三大网络系统:互联网、教育网、科技网,据说C网也快普及了。互联网上的资源一般难以完全共享,因为互联网上来自国人的资源实在太少,但我们又不可能把老外的资源随便的共享出来,版权!我们国人应该有这种意识!因而想在互联网上搜索有用的信息的确很难,我们都有体会。但作为国人,还可利用另外两个大网络,它的资源同样丰富。事先声明:本方法绝对不是用于想查某个数据库密码的方法,因为教育网上并不包括这些数据库,但除掉数据库外,还有很多我们需要的东西!一定要记住,有些资源比数据库更重要!如各大学的教授的讲义、各大学学生的个人参考文献,这往往学生将它放到网上方便其它相关领域的研究人员,因为这些文献都已收集好了。当然还有娱乐的电影、mp3,大量的实用软件,尤其是一般难以得到的软件。这些资源你们只要知道今天的讲座后,便随手可得了,而且对于你来说,你是free and copyrigh!
我们知道教育网的资源主要的形式是通过ftp形式发布的,几乎各大学都有免费使用的ftp目录,多是供本校师生使用,但毕竟一个学校力量有限,专业有限,如果能获得其它院校的ftp,那么就能得到大量信息。那么如何得到免费可用的ftp地址呢?

(1)ftp地址如何使用。高版本的IE似乎已支持直接浏览ftp了,但最好的还是使用cuteftp pro这个软件,本人强烈推荐,因为它具有resume(断点续传的功能,尤其是针对大型软件很有益,IE是不稳定的)。当然需下载一个。这儿http://www.bioon.com/ime/relat
ed.htm具体设置很简单,只要填入合适的ftp地址便可了

(2)搜索ftp地址,这样的软件目前很多,如ftpfind,FTP Search V3.5;Fast FTP Search V3.7等,这个页面可以参考http://www.impu.edu.cn/NetWorkSe ... ternet/search09.htm
当然国内的最好的是北大天网的ftp搜索了http://bingle.pku.edu.cn/,你可以直接输入软件名称,但注意一般只输其中的关键部分,不要输全部,如找cutefptpro 2.1版,你最好只能输入cuteftp,这样搜索出的结果肯定较多,但你只要眼一看便知道哪些是你的所需
了,一般你需下载含pro并含cr字眼的软件。为什么不能输全称呢?因为此软件全称中有空格,但你并不清楚大多数ftp中此软件命名时是否包含有这个空格,你若加,但命名时往往并没有空格,若不加,似乎并不顺眼。一般ftp资源通过天网ftp便可搞定,当然你可利用
主页http://www.bioon.com下方的搜索引擎了,因为里面已集成了天网的ftp,很方便,因为你还可以直接使用其它的搜索引擎。

(3)我若想找一些讲义怎么办呢?用关键词,不可能!为什么?一般ftp中讲义多只有lecture这个名称,但各专业均有,你想找与你相关专业的lecture太难了!我这里提供一个最简单的方法,供大家享用!
你随便输入某一个常用词,然后用天网ftp搜索,便可搜索到数万个结果,没关系,你将凡是没有打叉的ftp的前面名称复制下来,放到一个文本文件中,一般可收集十几个不同的ftp,然后输入cuteftp pro中,选择匿名登录,OK!这里面的资源你可尽情享用了!简直是无穷无尽!你随便看看就可以了。也许你说这太繁了,你可以到主页的资源下载中心下载一个教育网ftp资源大全,然后直接导入即可,下载地http://www.bioon.com/download.htm,你会感到其它一切搜索技巧都变得那么苍白无力!

(4)那么我用拨号或ADSL,不能上教育网怎么办?找个教育网代理,OK,搞定!那么教育网代理在哪里?请到论坛中找一下诸如上海交大等代理,只要是大学的代理均可使用。还有什么疑问,请到论坛http://bbs.bioon.com中发言.
这篇是本人这个月最大的体会,精心奉献给大家!如果您要转载,请必须注明:来自于生物谷http://www.bioon.com和中国生命科学论坛http://www.bioon.net,版权所有!

我顺便提供几个地址:
ftp.tranlux.net.cn 无密码无用户名,各种资源均有,超星这里也有!
happybean.d2g.com 无密码无用户名,各种软件

再补充讲一点,利用旧密码结合搜索引擎查到新密码
许多重要数据库或杂志的密码经常变化,往往用了一段时间后便过期,那么过期后我们怎么办呢?
一般这些密码多是某大学图书馆购买或个人购买,因而往往更改时,只更改密码或用户名,一般不全部更改,那么我们便可利用这个性质搜索出关键性密码。
如过去有个失效的密码:用户名:smith 密码 scienceball 数据库名:xxxx
那么你这样搜索,当然用google了:
smith xxxx username password
smith xxxx ID password
scienceball xxxx username password
scienceball xxxx ID password
若搜索出的结果过多怎么办?请加上campus等词再试,若结果过少则却掉password,灵活使用
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 lvweifu 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见