基本科学指标数据库
计量分析数据库
基本科学指标数据库(Essential Science Indicators,简称ESI),是由科睿唯安(Clarivate Analytics,原汤森路透知识产权与科技事业部)在汇集和分析Web of Science核心合集所收录的学术文献及其所引用的参考文献的基础上建立起来的分析型数据库。ESI由学术信息出版机构美国科学信息研究所(ISI)于2001年推出的衡量科学研究绩效、跟踪科学发展趋势基本分析评价工具,现已成为世界范围内普遍用以评价高校、学术机构、国家/地区国际学术水平及影响力的重要评价指标工具。
功能
研究人员可以系统地、有针对性地分析国际科技文献,从而了解一些著名的科学家、研究机构(或大学)、国家(或区域)和学术期刊在某一学科领域的发展和影响;同时科研管理人员也可以利用该资源找到影响决策分析基础数据
Essential Science Indicators可以帮助使用者进行很多工作:
1、分析特定研究机构、国家、公司和学术期刊的研究绩效和影响力;
2、在22个专业领域内分别对国家、研究机构、期刊、论文、科学家进行统
计分析和排序;
3、跟踪自然科学和社会科学领域内的研究发展趋势,给出衡量研究绩效的
4、评估潜在的合作者、评论家、同行和雇员;
5、测定特定研究领域的研究产出与影响;
6、及时获知各领域内高被引论文和近期最关注的话题;
7、通过共引分析方法,揭示各个学科当前的研究前沿,锁定隐含的突破性研究;
8、通过引文数据库揭示不同学科发展的趋势。
检索指南
引文排名(Citation Rankings)
(1)查阅引文排名
在ESI数据库中可以查阅在22个学科领域中以下4种引文排名:
1)科学家Scientists(取排名前1%);
2)研究机构Institutions(取排名前1%);
3)国家/地区Countries/Territories(取排名前50%);
4)期刊Journals(取排名前50%)。
选择任意一种排名,如研究机构Institutions,可以进一步按学科(BY FIELD)浏览某个学科下的研究机构排名,或检索指定的研究机构(BY NAME)在22个学科领域中的排名,检索支持通配符“*”(表示任何字符组,包括空字符)。
(2)检索结果的浏览
1)各种排名的结果可以依据引文数(citation(s)),论文数(paper(s))或篇均引文数(citation(s) per paper)限定至少多少数目才显示(Display items with at least),并且还可按Citations(引文数),Papers(论文数),Citations per Paper(篇均引文数),Journal,or Field(期刊,科学家,研究机构或国家/地区)排序浏览(Sorted by)。
2)点击论文图标(Paper icon),可以浏览期刊(或科学家,研究机构,国家/地区)在某个学科领域中所对应的高被引论文(TOP PAPERS)。
3)点击图图标(Graph icon),可以浏览按照时间的走势图
4)点击期刊(或科学家,研究机构,国家/地区)名称,可以查阅其学科排名。点击学科名称,显示该学科下期刊(或科学家,研究机构,国家/地区)的排名。
高被引论文(Most Cited Papers)
(1)通过两种途径可以浏览高被引论文:
1)10年来的高被引文章(Highly Cited Papers(last 10 years)):发表于十年内各领域中被引用次数Top1%的文章。可以浏览单一学科或者综合所有学科的高被引的论文(BY FIELD),或某一科学家、某一研究机构、国家/地区或者期刊的高被引文章(BY NAME),或通过检索创建相关高被引文章列表(BY SEARCHING)。
2)近两年来高被引的文章(Hot Papers(last 2 years)):发表于两年内最近两个月被引用次数为各领域Top0.1%的文章。
(2)检索结果的浏览
1)检索结果可以按引文数(Citations),出版年份(Publication Year),期刊名(Journal Title)排序。
2)点击图图标(Graph icon),可以浏览按照时间的走势图。
3)点击WEB OF SCIENCE按钮,链接到Web of Science,了解更多的细节,最新的引文统计和获取出版社全文等。
4)点击COMMENTARY按钮,查看相关研究领域的话题讨论。
引文分析(Citation Analysis)
1)基线数值(Baselines)为引文统计数据提供了比较分析的依据。进入BASELINES MENU,可以查看平均引文率(Average Citation Rates)——按照10年间各年进行统计,表示各学科中每年发表论文的篇均被引次数;或Percentiles——每年发表的论文达到某个百分点基准应被引用的次数;或Field Rankings——显示某个学科中的论文总数和引文总数。
2)研究前沿(Research Fronts)按照共引关系聚类高被引论文,用以了解新的突破可能出现的领域以及科学家之间的非正式交流的关系。可以进一步按学科(BY FIELD)浏览研究前沿,或查看指定的主题(BY NAME)的研究前沿。
专家评述(Commentary)
(可以免费获取)
1)in-cites:提供进入科学社区的门户,提供多个学科领域中高被引研究人员、论文、机构、期刊和国家的采访资料等。
2)Special Topics:在某个的学科领域中取得重大研究进展或者引起特别兴趣的论文的引文分析和专家意见。
3)Science Watch:提供Thomson Scientific快讯的编辑材料。
结构组成
ESI由引文排位(Citation Rankings)、高被引论文(Most Cited Papers)、引文分析(Citation Analysis)和评论报道(Commentary)4部分构成。
指标与原理
ESI处理的数据仅限于ESI收录的期刊论文科技论文、评述论文、会议论文以及研究报告)。编辑信件、更正通知、摘要、图书、图书的章节以及未被ESI索引的期刊论文,均不被考虑在内。数据一年更新6次,更新周期为2个月。
ESI以引文分析为基础,出版和引文活动可以衡量各国科研水平、期刊的声誉和影响力,也可以反映科研机构和科学家的学术水平。其中,被引频次作为同行认知(Peer Recognition)的一种形式,反映科研群体对科学家的依赖程度。
(一)论文数与引文数
论文数是描述科学家、期刊、机构、国家发表论文能力的一个基本指标,是在给定时期或给定领域内发表或刊载论文的数量。引文数是从使用者的角度评价科学家、期刊、机构、国家科学水平的一个基本指标,是论文被引用的全部次数,它用客观使用的数量反映了科学体在科学发展和文献交流中的作用。这两个指标都是绝对数量指标,一般来说,其值越大,表明该科学家、期刊、机构、国家的作用越重要。
ESI将论文数和引文数作为指标,针对不同对象,对期刊论文的第一作者和非第一作者平等对待,论文引用和被引频次平等归于所有作者,体现了对科学参与者的公平评价。时间段为10年(包括当前更新时间),从ESI收录该论文的实际年份算起,反映了文献从发表到引用高峰再到引用稀少的客观过程。热点论文计算的时间段为2年,计算国际上过去2年中各领域论文在近2个月被引用的次数,也是依热点问题的生命周期和人们的关注程度而定。
(二)篇均被引频次和平均被引频次
篇均被引频次(Average Citations Per Paper)是给定时间内,期刊所载文献被引数量除以该刊全部论文数。以科学家为例,它表示科学家所发表每篇论文被引用的平均水平,其值高则一般代表该科学家水平高。它同样适用于用于期刊、机构和国家。作为一个相对数量指标,它弥补了绝对数量指标中马太效应导致的偏差。在ESI中篇均被引频次即引文数除以论文数,表示每篇论文被引用的平均水平,针对不同对象,篇均被引频次反映该对象的学术水平高低。
ESI中平均被引频次(Averages)与篇均被引频次不同,ESI的Baselines中给出了各领域论文每年的年平均被引频次和10年累积平均被引频次Averages值由某领域总引文数除以总论文数得到。这些平均值可以被用作科学家、机构、国家以及期刊排位表给出的单篇被引值的基线,独立年份的学科领域平均值可用于该年份出版的论文的比较。
(三)平均年份(Mean Year)
该指标出现在Research Fronts中,它是引文发表的平均年份,是衡量学术界对相关主题研究的活跃(Currency)程度的一个指标,其核心思想是:引文发表的平均年份越近,表示当前对该主题开展的研究越多。Mean Year离当前年份越近越能表明该主题处于当前学科热点或研究前沿。即Mean Year就是前沿课题研究兴起的时间点
计算其值,要从论文的发表年份开始到当前引用年份,将年月转变成数字:1-12月分别对应0,1/12,2/12,......11/12,年份为整数部分,然后对所有数字求算术平均即可。
(四)标准共引阈值(Normalized Co-citation)
引用表现学科领域间的联系,共引反映科学领域内重要问题之间的联系。所谓共引,是在给定论文的参考文献中,对某一论文的引用伴随着对另一论文的引用。Research Fronts是引文网络结构根据若干篇原创性成果的核心文献来描述某个特定研究领域现状的应用。它汇集特定领域核心文献和研究焦点,追踪学科发展趋势,辨析科学家、研究机构、国家对科学发展的贡献。
ESI采用单连接聚类算法(Single-Linkage),其基本思想是两个簇之间的距离为从两个簇中抽取的每对样本的最小距离。通俗地讲,样本点离哪个类近就划入哪一类,表达关系密切、性质相近的意思。Research Fronts的聚类分析共引强度为基本计量单位,分析之前需要先为论文设定共引强度阈值(Integer Co-citation Frequency),目的是去除大量弱相关论文(噪音),然后形成学科强相关的论文簇,进而定量分析。为筛选具有一定共引强度的论文,设定了标准共引阈值。假设有论文A和B,其共引阈值的计算公式如下:
标准共引阈值=论文A和B的共引强度阈值/(论文A的引文数×论文B的引文数)0.5
该公式通过聚类分析推导而来,其中共引强度阈值一般以专家打分的方式给出,然后通过该公式转换成标准共引阈值。ESI在处理数据时将Integer Co-citation Frequency赋值为2,为Normalized Co-citation赋予0.3的值。
(五)引文阈值
引文阈值作为筛选标准,用来从各领域中选出一定比例的科学家、科研机构、国家和期刊,引文数大于等于阈值者均可入选。针对不同学科、学科特点及引文率的不同,各领域设定不同的引文阈值。ESI设定了国际顶尖论文引文阈值,考虑到学科不同和时间上新旧文献的可比性,将每个学科每年分别设定不同的值,将某论文10年内累积引文数与阈值比较,大于等于则可以入选。热点论文引文阈值,每个领域每两个月设定不同的值,将某论文2个月内的累积引文数与阈值比较,大于等于则可以入选。
(六)All Fields(全部领域)
ESI多处从“All Fields”全学科领域的角度出发,向研究者展示科学全貌、科学前沿全貌。引文排位部分里,直接在“Select a Scientist From This Field”的下拉列表中选择“All fields”点击“GO”按钮,不分领域依据引文数列出了居前科学家,由此可以观察判断排在科学发展前列的科学家及其所研究的领域,也可以判断学科研究间的关系。同理,对于科研机构、国家/地区以及期刊,高被引论文部分“All Fields”可以判断出科学发展的热点和重点。
(七)跨学科期刊归类
ESI中任何一种专业期刊都只能归入唯一领域。对于跨学科期刊,如Nature、Science等,之前全部归入Multidisciplinary Field。现在ESI对约60种跨学科期刊论文按照其引文对其进行归类,即论文的归类取决于其引文和参考文献的归类。其主要依据引文的特点,引文是一篇论文对另一篇论文的应用,一定程度上反映学科内容之间的引证关系。例如,一篇刊载在跨学科期刊上的论文,如果其大多数引文属于神经系统科学(Neuroscience)领域,且大多数参考文献来自神经系统科学领域,那么该论文就被归入Neuroscience。
跨学科期刊论文的归类情况因期刊而异,如Nature、Science的再分类率可达95%。采取此法,60种期刊约17万篇论文中近半数被归入具体领域。重新归类为科学家、机构、国家、期刊论文排序提供了更准确的统计数据,可更准确地反映各学科领域的研究情况、学术成果、影响力。
(八)ESI指标值校正
ESI对科学家、科研机构、国家和期刊在一定时期内分别进行排序。时间序列以5年为一段,有部分重叠依次连续后推,即1995-1999年、1996-2000年。这样采用5年期的移动平均Moving Average, MA)方法对一个科学家、机构、国家或期刊的科研能力进行评估,旨在减少异常值的影响。这样评价保持了评级结果的稳定性。
ESI每2个月更新一次,所以当前年份各项指标值都不够完全,不能反映实际情况。ESI根据长期观察总结发现:假设有稳定的出版量,整个数据库中,每5年最后一年的引文数平均占该时期全部引文数的41%,而这41%的引文又近似平均分布在这一年的6个时间段内。
学科领域
ESI期刊列表一共包括22个学科分类:AGRICULTURAL SCIENCES(农业科学)、BIOLOGY & BIOCHEMISTRY(生物学与生物化学)、CHEMISTRY(化学)、CLINICAL MEDICINE(临床医学)、COMPUTER SCIENCE(计算机科学)、ECONOMICS & BUSINESS(经济与商业学)、Engineering(工程学)、ENVIRONMENT/ECOLOGY(环境科学与生态学)、GEOSCIENCES(地球科学)、IMMUNOLOGY(免疫学)、MATERIALS SCIENCE(材料科学)、MATHEMATICS(数学)、MICROBIOLOGY(微生物学)、MOLECULAR BIOLOGY&GENETICS(分子生物学与遗传学)、Multidisciplinary(综合交叉学科)、NEUROSCIENCE&BEHAVIOR(神经科学与行为科学)、PHARMACOLOGY&TOXICOLOGY(药理学与毒理学)、PHYSICS(物理学)、PLANT&ANIMAL SCIENCE(植物学与动物学)、PSYCHIATRY/PSYCHOLOGY(精神病学与心理学)、SOCIAL SCIENCES, GENERAL+(社会科学总论)、SPACE SCIENCE(空间科学)。
参考资料
数据库导航.清华大学图书馆.2022-09-07
【双一流】ESI指标原理及计算-发展规划与教学质量监控中心.桂林理工大学发展规划与教学质量监控中心.2017-06-16
最新修订时间:2024-09-11 13:54
目录
概述
功能
参考资料