24小时热门版块排行榜    

查看: 1183  |  回复: 12
当前主题已经存档。

shmily2085

金虫 (正式写手)

[交流] 什么是SCI?

我是汤姆森科技信息集团中国区的总经理,SCI是汤姆森的一个产品,一个数据库,我前两年在科学时报有一个讨论,讨论SCI,就汤姆森科技而言,我们基本上不介入中国的这种讨论,这个讨论从1963年SCI创刊开始,1970年代的时候,纽约大学一个教授,把SCI作为一个基本的分析工具开始,这个讨论就不断的出现。我今天讲什么是SCI。

    汤姆森科技是从事科技情报服务的,最早的品牌是德文特,到1958年加非尔德建立了SCI,我们是提供信息解决方案的,我们目的是为全球的科技和创新领域提供领先的整合信息解决方案,推动信息创新,加速企业成长。SCI的起源,1955年在Science里面发表论文,这篇论文提出一个引文索引,作为文献检索和分类的工具,这是这篇论文的创新点,即把文献作为一个检索字段,加非尔德先生参加了美国医学图书馆的前身美国医学军事情报所的项目,研究所谓的机器标引的方式检索文献,他研究发现,自动标引很难,加非尔德他发现关键词的标引很难,因为语言本身有模糊性,在座大家都知道“cancer”这个词,但是生物学领域当中“cancer”是动物学纲的学术名称;语言学中这个词的出现、出现的频率跟词的位置,各种各样构成了一个概念,而一篇文献,作为一个集合,无论你用多少个词描述一个论文,都无法穷尽这篇论文的Idea,比如说爱因斯坦发表相对论的文章,今天被引用超过3000次,最近十年引用次数出现飞速的增长,刚才提到科斯,他一生只发表两篇论文,但是每年都被引用十几次以上。一个Idea的影响,一篇文章,尤其是文章对后期的影响,引用文章以后做什么样的工作,由此了解这个课题最新发展的情况,整个课题发展的进程是如何的?科学引文索引,今天你可以看到一百年以前的文章,究竟怎么在影响今天科学的发展,科学引文很简单。这样的一个工具是什么呢?就是我们通过科学引文索引,是要追溯科学发展的进程,而不是用来做评价的。

    到后来我们发展到“Web logic”,数据库里面有什么呢?李国杰老师提到了科技会议录,科技会议录索引也是汤姆森出版的数据库。为什么Web of science科学研究与科学管理是基本工具呢?收录最重要的学术期刊,文献之间相互引证反映科学研究间的内在联系,从加非尔德建立科学引文索引开始,我们的宗旨是什么?他认为,一本有效的索引工具,只收录那些对研究人员有用的信息和期刊,每一本SCI期刊,都经过严格的评估和长期的跟踪,我们希望收集每个领域最有影响的学术期刊,为什么这样做呢?举个例子来讲,每天在电子工程领域,全球有一千篇论文发表,哪个科学家能看完这一千篇论文?不管你们搞什么学科,都不可能,也没有必要都看完,为什么?很多科学论文发表了以后,他论文的质量本身和数据是很难重复的,我曾经找了两三篇文章,按文献合成,我始终合成不出来,后来我找了一个JOC的文章,发现那些合成路线是有问题的。在这个基础之上,我们看一下所谓科学文献里面的二八定律,60年代SCI建立以前,有一个“布氏”法则,他的分析发现,就某一个学科而言,他涵盖学科里面最重要的研究论文,加非尔德做了引文发现20%的期刊发表80%的重要文献。SCI怎么选刊呢,我们有四个基本的标准,基本期刊出版标准,编辑和评委的意见,国际性与区域代表性,引文分析。前两年计算机世界把杂志寄给我要求评审,我们评审是美国进行的。这个期刊如果论文的选录,不是由同行评议来完成的,这种期刊我们根本不做评审,全世界超过30万种期刊,大概三四万期刊有同行评议的过程,我们有很多指标,每本期刊根据所属学科领域来评审的,我们看一下Web of science里面,一共收录了3千多种期刊,IEEE所有的会议录我们基本上都收录了,曾经有人说,SCI是科学引文索引,也是自然科学的,我们大概收录了工程技术领域超过1200种工程技术领域所有的期刊。这是我们在JCR报告里面,对期刊的分析,影响因子是我们引文分析里面的一个指标,我们利用了超过十几种指标分析一本期刊,这里有张图,这个期刊的自引率(黄色的)很少。这里我们要提到中国学术界的诚信问题,我举一个例子,SCI期刊平均期刊的自引率少于20%,中国科技期刊平均自引率多于60%,原因是什么,我不做评价。中国的编辑是很有能力去制造影响因子的,这里要说明,大家看Science这本期刊里面,很多很多文章,它的影响因子是二十五点几,但是Science自引率少于5%。自引一定是有的,我写文章,我不可能不引用我过去发表的文章,但是我认为制造自引是学术本身的诚信问题。任何的评价体系,无论是同行评议还是SCI,首先确定一点,就是科学家自己自身的学术道德的问题,你是不是在认真对待你的研究,你是不是认真对待别人的研究,这也是学术界自身的问题。

    第二部分,论文相互的引证,SCI建立的宗旨是建立一个数据库,帮助大家了解全球科学发展的情况,为什么我们这样做呢?大家想一想,我们写文章的时候,为什么要引别人的文章?你引用别人的文章,跟你完全没有关系,你仅仅因为凑数,引用别人的文章吗?我们看看这篇文章,这篇文章是姜涛老师的文章,这是SCI里的一条记录,这是我们Web of science的记录,他跟别的不同在什么地方呢?这有一个按纽,参考文献,这个文章引用了26个参考文献,点击这个以后,所有他引用的参考文献列出来了,而且参考文献的题目也列了出来,我们发现一个什么问题,姜老师引用的参考文献都是有超链接的,说明什么,这些参考文献也是被SCI收录的,也就是说当我们一年收录超过120万篇论文的同时,我们收录的参考文献超过2千万篇参考文献的出处,你可以了解姜老师工作基于哪些工作发展而来,为什么他工作当中要引用这篇文章,我们工作是帮助你去了解查文献的回溯法,我们看一下,还有一个什么按纽,再点一个按纽得到什么呢,姜老师这篇文章发表以后,被引用了11次,所有引用他的文章,11篇文章全部列了出来,我们称为他引的文章,你可以了解这些文章为什么引姜老师的文章,引用他的文章对他进行评价还是发展,还是利用,通过这个了解,你可以了解这个课题最新进展是什么,这就是科学引文索引最基本的目的。如果我们对这个文章背后引用11次,我们看一下引用11次意味着什么,还有一个按纽,叫相关发现,相关记录,如果姜老师说,我查找引用和被引用的文章不能了解这个课题相关的东西,我们点击以后发现,所有跟这篇文章相关的文献一共有2677篇文献,姜老师说这么多相关文献,相关性是如何确定的呢?如果论文甲和乙都引用了5篇文章,我们认为这两篇课文有一定的相关性,我们不是根据词的出现来确定了,而是根据两篇论文引用相同的参考文献确定相关性,这样做的好处是什么?好处是突破学科的局限性。我们可以分析,这2677篇相关文献,分布在哪些学科当中,你可以发现,这里有超链接的按纽叫分析结果,你点击分析结果,从作者、学科,论文,机构来分析这2600多篇引用他的文章,我们分析引用他文章分布在哪些学科里面,有哪些作者做相关性的研究工作,这样帮助你找到你需要的文章,这就是科学引文索引建立的宗旨,就是从一篇高质量的文献出发,从相关文献了解跨越学科的界限,了解不同的学科,怎样在针对一篇论文做研究的。我们称之为越查越旧,越查越新,越查越深。被引次数,分析引用他的文章是什么工作,分布在哪个领域当中,是哪个机构做这些工作的。

    第三部分,介绍一下文献相互引证反映科学研究的贡献与影响,传统上科学引文索引是为信息检索而建立的,他只选择他认为最有影响力的期刊,第二、他可以反映一篇论文发表以后被引用的次数,大家想像一下,当你用论文评估作者研究绩效的时候,有哪两个基本特征你要评估,刚才姜老师和李老师都提出了,你可以看他在哪个期刊里面发表,如果这个期刊本身,是高质量的,或者高影响力的;第二、如果这个论文发表以后,五年、十年从来没有被别人引用过,或者20年以后没有被别人引用过,这个论文可以说没有什么影响力,我可以让你看到,论文发表以后被引用的次数,这样的原则很多人用他来做他的研究工具。用引文分析法对科学研究进行评估的前提是什么,比如说你是制造武器的,制造打人的武器是你评估的条件,如果你是搞技术的,你有没有申请专利,专利有没有被别人利用,这可能是一个评估的条件,或者你有没有造出一个创新的东西,一个软件,这是一个最基本的,引文分析中要注意的问题,第一、不要完全看论文的收录次数和被引次数。引文分析的基线,如果按学科来分布,这是我们基本的科学指标,这是引文分析的基线。中国学科当中平均影响力是如何的,这个是全球计算机科学的发展情况,上面一个图代表论文的阐述率,总的背景频次的发展情况是如何的,平均背景频次发展情况是如何的,中国的论文数,SCI论文数增长速度非常快,平均背景频次在0.6左右,不同学科结果是不太一样的,总的论文数只能代表产出,这些东西只是用来分析对平均而言的。大家分析一下中国的科学家,看看有多少论文被引用25次,这个大家以后可以分析,科学引文索引可以做很多很多的工作,这是我们国家做研究前沿的分析,这是科学图谱的分析。以科学论文分析的结果和关系,判断一个学科的发展走势,日本和欧洲正在使用这样的数据来分析下一个五年到十年,应该重点投资的一些方向,他们做工作的同时,引用了四种方式做规划,一个是定量的,研究前沿的数据进行分析,一个是同行评议的方式来做,还有其他的工具,后来发现结果是比较线性的,很多老师提到技术科学的,不搞论文发表,你有多少专利,这个我们也不讲了,专利的情况,这是中国清华大学一位老师叫范守善,这是他发表的论文,他99年在Science里面发表论文,这是他发明专利的情况。

    研究是一个创新的循环,不管用什么样的方式去评估,最后是要创造财富的。基础科学如何发展成商业应用的研究,如何变成专利,如何创造财富,这是对DVD,CD—ROM领域分析的情况。
回复此楼
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

blacksandy

木虫 (正式写手)

长见识了,谢谢shmily2085
2楼2009-05-23 21:37:42
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

davidsdu

木虫 (正式写手)

Stupid Chinese Ideas----SCI
往者不可见,来者犹可追
3楼2009-05-23 22:45:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

gjliu

银虫 (小有名气)

引用回帖:
Originally posted by davidsdu at 2009-5-23 22:45:
Stupid Chinese Ideas----SCI

Very Correct!!!
4楼2009-05-24 20:51:41
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

shmily2085

金虫 (正式写手)

5楼2009-05-25 21:01:05
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

googlesea

木虫 (著名写手)

够详细的,还是第一次这么系统的看解释!
6楼2009-05-25 21:18:16
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

acr

木虫 (著名写手)


小木虫(金币+0.5):给个红包,谢谢回帖交流
引用回帖:
Originally posted by gjliu at 2009-5-24 20:51:


Very Correct!!!

niu.!
2006-03-300910 2009-03-180222
7楼2009-05-26 10:45:18
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

smallwww

铁杆木虫 (著名写手)


小木虫(金币+0.5):给个红包,谢谢回帖交流
学写了!!!!
8楼2009-05-26 10:47:22
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

liujiufu

银虫 (小有名气)


小木虫(金币+0.5):给个红包,谢谢回帖交流
好.好好好好好好.
9楼2009-05-26 11:04:59
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖

kdy

木虫 (著名写手)


小木虫(金币+0.5):给个红包,谢谢回帖交流
SCI确实很好,我很多资料都是通过它查出来的,太感谢了
10楼2009-05-26 12:45:00
已阅   回复此楼   关注TA 给TA发消息 送TA红花 TA的回帖
相关版块跳转 我要订阅楼主 shmily2085 的主题更新
普通表情 高级回复 (可上传附件)
信息提示
请填处理意见