基于CSSCI计量我国学科信息门户的语义网在学科信息门户中的应用

摘 要:论文以CSSCI为统计源,采用文献计量的方法,通过对2002-2010年间我国学科信息门户研究论文的时间分布、期刊分布、著者分布、著者机构分布、引证分布等进行了统计分析,对我国学科信息门户的发展历程进行有效地研究,并就语义网技术应用于学科信息门户进行一定的探讨.

关 键 词:学科信息门户;主题网关;学科门户;主体门户;SIG;CSSCI;定量分析;文献计量统计;语义网;本体

中图分类号:6250.252文献标识码:A文章编号:1008-0821(2012)07-0126-05

自网络技术诞生以来,网上信息的数量呈现出几何倍数地增长,搜索引擎和网络目录的出现虽大大方便了人们检索和利用信息,但其搜索信息数量的过剩以及质量的参差不齐,都给人们带来了诸多不便,尤其是无法满足科研和学术机构人员对高质量学术信息的需求.学科信息门户的建立是解决这一问题的有效措施之一,它借用了商业信息门户的概念和技术,并借鉴和改进了一系列传统文献信息处理理论与技术,对特定学科领域的网上信息进行深层组织,有效解决了网络信息资源在体积、质量和可信度等方面存在的突出问题,为科研工作者提供权威和可靠的学科信息和服务.

1.学科信息门户

学科信息门户(SubjectInformationGateway,以下简称SIG),又有学科门户、主题网关、主题门户等多种提法.其概念最早的提出者TraugottKoch认为:“SIG是支持系统化资源发现的因特网服务,通过因特网提供对资源(文献、对象、网站或服务)的链接.该服务建立在资源描述的基础之上,可以通过主题结构浏览资源是其重要特征.”

SIG的概念在之后的发展中不断地完善,鉴于当前的发展情况,笔者认为:SIG是针对特定学科或主题领域,按照一定的资源选择和评价标准以及规范的资源描述和组织体系.对具有一定学术价值的网络资源(网站、文献、工具或服务等)进行搜集、描述和组织,并提供检索、浏览、导航等基本功能,此外,SIG的扩展功能应包括提供一些自建资源(如全文文献、特色馆藏库等)、RSS、学术博客、学术论坛等增值服务以及个性化服务(如信息推送、信息等).

本文以CSSCI为统计数据源,通过对我国学科信息门户相关论文在时间、期刊、著者、著者机构分布及引证关系等方面进行统计分析,以了解我国学科信息门户的发展特点与趋势,为进一步研究提供参考.2学科信息门户结果统计分析

本文的统计数据源来自于CSSIC(中文社科引文索引来源期刊).CSSCI由南京大学中国社会科学研究评价中心主持评选,其遵循文献计量学规律,采取定量与定性评价相结合的方法从全国2700余种中文人文社会科学学术性期刊中精选出学术性强、编辑规范的期刊作为统计源期刊.

笔者于2011年10月25日,以“学科信息门户”、“学科门户”、“主题网关”、“主题门户”等为检索词,对1998-2011年间的数据库进行检索,共检出SIG研究领域相关文献79篇,并据此进行文献计量学分析.

2.1年代分析

某一时期论文数量的变化速度和数量,在一定意义上说明了这一领域学术研究的理论水平和发展速度,也能在一定程度上反映研究者和实践者对该领域的重视程度.

从表1和图1可以看出,按照各年的发文量进行统计,我国学科信息门户研究大致可以分为3个小阶段.

2.1.12002-2003年

虽然笔者选取了1998-2011年间的所有数据库,但我国关于SIG研究的第1篇文章出现在2002年,由张晓林撰写关于国家科学数字图书馆分布式SIG及学科信息导航系统建设的研究.可以说这篇文章开启了我国对SIG的研究进程,对以后的研究起到了非常深远的影响.但在第l篇文章发表后的1年时间中,并没有很多学者对于辩开展有效的研究,从以上数据可以看出,2003年也仅有1篇关于big的文献,由张智雄撰写对主要目录协议在主题网关中的应用进行了探讨.虽然国外从20世纪90年代就开始了SIG的建设与使用,但引进我国的时间是21世纪初.张晓林虽然对SIG进行了介绍,但是由于国内还没有正式开始规划和组建SIG的项目,所以,没有引起学界的重视.

2.1.22004-2006年

从2004年起,连续3年呈现出快速增长趋势,在2006年发文量已达到19篇,创年度发文量最高纪录.从2004年开始,由国家科学数字图书馆规划建设5个SIG,并聚集大量人力、物力等资源进行具体的落实,因而激起了全国范围内建设SIG的热潮,其中包括武汉理工大学、中国科学院武汉文献情报中心、国家科技图书文献中心等机构也纷纷加入建设队伍.在建设过程中,对于SIG的相关理论与实践研究也快速发展起来.2004年,国科图的5个SIG以及其他机构建设的SIG正式启用,研究人员在对SIG的评价,与国外SIG的对比,对国内SIG的调研等研究也陆续开展,这些原因都促使2004-2006年期间文献量迅速增长.

2.1.32007年-至今

从2007年开始,学界的研究热情逐渐减退.发文量也呈现出下滑趋势.笔者认为,首先,国内学者都喜欢跟风.一段时间内会出现对一个问题全方位、多角度的研究,研究成果很快覆盖了该问题几乎所有的内容,导致之后的研究难以找到突破口和创新点.其次,由于SIG研究的逐渐成熟,研究核心从介绍性的理论研究转向评价与维护、平台构建与技术创新等方面,这些内容要求研究人员对SIG有更深层次的探索.再者,我国SIG在建成之后的利用效果非常不令人满意,很多SIG从建成后几乎一直没有更新.用户访问量和使用率都极低,二者应该是互为因果的关系,所以,影响了学者的研究热情.

2.2期刊分布

对某一领域研究论文的期刊分布情况进行分析,不仅可以确定该领域的核心期刊,为文献的收集管理者提供依据,为读者提供指导,还可以了解各刊物的办刊特点,指导刊物发展.经调查统计,2002年来,研究人员在17种刊物上发表SIG论文共79篇,平均每种期刊发表约4.6篇.从表2可以看出,图书情报工作、情报理论与实践、图书馆杂志与情报杂志发表文献量较多,这说明这4种期刊是研究SIG的核心期刊,为以后学者研究该课题或是发表该类文献提供了指南作用.同时,还能看出,除了科技进步与对策外,其余16种都属于图书馆、情报与文献学类期刊.由于在SIG的建设过程中涉及到信息采集、信息组织以及质量控制等工作都是图情领域的核心价值,所以,得到了图情界学者的广泛关注.

2.3著者分析

2.3.1著者发文分布

对著者群的统计分析,能反映出文献作者与文献量的关系,同时能预测、估计和揭示科学研究人员的研究能力.对进一步了解SIG研究领域的现状和发展趋势都具有重要的意义.自2002年以来,共有108位作者发表了有关SIG的文献,而文献总量为79篇,可以看出合著率较高.发表1篇文章的作者占总数的82.4%,发表2篇文章的作者占总数的10.2%.

从表3可以看出,共有8位作者发文量在3篇及3篇以上.发文量最多的是5篇,分别是中国科学院资源环境科学信息中心的祝忠明、肇庆学院图书馆的李育嫦以及武汉大学信息管理学院的胡明玲.从发文时间以及发文内容分析可以得出,2003年,国科图开启了资源环境学科信息门户建设项目,祝忠明、吴新年等中国科学院资源环境科学信息中心的研究人员参与其中,伴随着项目的推进而合著了多篇有关SIG的文献.同样,胡明玲和武汉理工大学图书馆员王建涛也背靠武汉理工大学建设SIG的机遇,深入研究SIG,合著了多篇文献.侯汉清是我国图情界著名的专家学者,现任南京农业大学信息科技学院教授,在表2中,提及的惟一一篇被情报学报收入的《学科门户智能搜索引擎的设计与构建——农业史门户搜索引擎的实验》即出自侯教授笔.

2.3.2著者机构分布

自2002年来,共有58个机构发表了有关SIG的文献,发表1篇文献的机构占总数的72.4%.发表 2篇文献的机构占总数的13.8%.从表4可以看出,武汉大学信息管理学院发文量高达16篇,其次是中国科学院资源环境科学信息中心,发文量5篇.紧跟其后的是肇庆学院图书馆、武汉理工大学图书馆、武汉大学信息资源研究中心,发文量均为4篇.由此可知,武汉大学和中国科学院系统是研究SIG的重要机构,值得关注.

2.3.3著者机构类型分布

学界一直在探讨,SIG的建设应该由图书馆牵头还是由高校院系牵头.在对著者机构类型进行统计,结果显示有53篇文献出自高校院系,有49篇文献出自图书馆,因此,可以看出高校院系和图书馆都对SIC开展了有效的研究,所以,SIG的构建不应该由一个机构单独完成,而应该是院系与图书馆合作开展,分别发挥自身的优势.实现一加一大于二的成效.

2.4引证分析

2.4.1被引情况分析

由于本文的统计源是CSSCI,CSSCI的来源期刊质量均较高,故相关文献被引次数较高是普遍存在的特点.本文研究的这79篇文献的被引次数也符合以上规律.从统计数据可知,被引次数在10次以上的文献占总数的41.8%.从表5可以看出,在79篇文献中,有14篇文献的被引量达到20次及以上.被引次数最高的是张晓林的《分布式学科信息门户中网络信息导航系统的规范建设》一文,高达143次,这正是笔者在年代分布部分提及过的.我国第1篇发表的有关SIG的文献,该文献不仅发表时间最早、质量高,而且文中描述了SIG中的资源选择、搜寻策略、元数据、知识组织体系、维护使用管理机制等内容,都是之后SIG研究的重点,所以,被引次数非常高.其次,近几年,web2.0毫无疑问成为各领域都高度关注的话题.研究SIG的学者也不例外.虽然王晓光基于web2.0在SIG应用的文献发表于2007年,但被引次数高达50次.随后,王玮、韩丽以及王楠等文献被引次数都较高,这些文献大都得到了各类基金项目的赞助.因此可知,在基金项目的赞助下,不仅容易出成果,而且成果质量普遍较高、参考价值大.

2.4.2引用情况分析

对发布文献的引用情况进行统计,结果显示对SIG研究的作者引用了大量的参考文献.79篇文献一共引用了985篇相关文献,平均每篇都引用了12.47篇.这与以上统计的被引次数高有着密切的联系,因为引用与被引就是一对相互影响的关系体.

在79篇文献中,徐佳宁和赵洋合著的《国外学术信息主题网关特点分析》,引用67篇,引用篇数最多;其次,何琳和陈焕之合著的《我国学科信息门户研究综述》,引用47篇;随后,祝忠明、吴新年、孙成权等合著的《资源环境学科信息门户的研究与建设》,引用35篇.

3.总结

本文以CSSCI为数据源,对我国学科信息门户的发展研究进行了文献计量学统计工作,以了解我国学科信息门户的发展历史及进程.最终检索出79篇相关文献,对其进行统计得出,我国学科信息门户的发展主要分为3个阶段:2002-2003年的萌芽期,2004-2006年的快速成长期,2007-2010年的缓慢发展期,其发展特点完全符合对一个新事物的认识发展过程.从期刊的载文量来看,呈现出集中与分散的特点,具体表现在,这79篇文献分散于17种不同的期刊上,但数量排名前3的期刊载文量占总量的48%.从学科分布来看,在这17种期刊中,除了《科技进步与对策》外,其余的16种都是图书馆、情报与文献学类期刊,这表明图情领域是我国学科信息门户研究的中心.从著者发文中了解到,这79篇文献涉及108位作者.可见合著率较高,发表1篇及2篇的作者占比分别为82.4%、10.2%.其中有8位作者发文量在3篇及3篇以上.从著者机构的统计结果看,共有58个机构发表了相关论文,其中发表1篇和2篇的机构占比分别为72.4%和13%,发表3篇及3篇以上的共有8个机构,这些机构基本是发文量较高的作者所在单位,比较突出的是武汉大学和中国科学院系统.说明这两家机构在我国学科信息门户的研究中占有重要地位,是该领域研究的主要阵地,代表着该领域研究的最高水平.由于CSSCI来源期刊的质量较高.被收录文献被引频次都较高,被引次数在10次以上的文献占总数的41.8%.其中.有14篇文献的被引量达到20次及以上.而张晓林在国内发表的第一篇有关学科信息门户的文章被引量达到了143次,其次,各类基金项目赞助的科研成果也成为被引热文.由于被引与引用是一对相互影响的关系体,在如此高的被引量下,这79篇文章的引用量也比较高,平均每篇引用12.47篇,引证关系的统计表明,在我国学科信息门户的研究中,借鉴较多、参考频繁.总的来说,在近十年的发展中,我国学者对SIG的研究取得了一定的进展,不仅在理论上有所突破,也建成了一些颇具代表的big.但从维护以及使用情况来看,这些SIG运行都不太理想.既然学界已经认识到SIG对研究人员来说的重要性,就应该加强对SIG的建设与维护.应该加强图书馆和高校院系的合作,搭建出优秀的SIG,建立起有效的维护机制,加强宣传等举措.更好地为研究人员的研究工作服务.


4.语义网技术在学科信息门户中的应用

虽然学科信息门户能够有效解决网络信息资源在体积、质量和可信度等方面的问题,但要想提供更高效的检索效率,就需要把语义网技术应用于学科信息门户.近年来,语义网逐渐成为WWW领域的研究热点以及智能化网络服务和应用开发中的关键技术之一.利用语义网技术可以为信息创建元数据,这些元数据可以被机器理解,然后利用本体对不同信息源中的元数据进行查询和推理,找出用户需要的信息.

2006年我国有2篇文献分别从信息组织和信息查询两个维度把语义网技术应用于学科信息门户.冯玉和雷菊霞在论文中提及,由于学科信息门户的分类法和主题词表的局限性,所以需要扩展多变量、多层次、多功能的关系列表体系来组织学科信息,以强调表现概念之间的关系,语义网就是关系列表体系的代表.通过语义网来构建本学科领域的本体,利用其对学科信息资源内容进行语义标注或语义挖掘,形成基于语义的资源元数据,用于表述十分复杂的事物间的相互关系的特定概念模型,以实现门户知识的共享.但文章仅仅是提出此概念,并没有对如何实现或者实际案例进行阐释,有很大的局限性.吴浩东和刘强提出,用户查询信息有两种情况:能清楚表达需求信息和不能清楚表达需求信息.针对这两种情况,提出一种基于本体的信息查询模型,对于能清楚表达需求的用户,采用基于领域本体的改进搜索方法;对于不能清楚表达需求的用户,采用基于模糊本体的逐步精确查询方法.文章对两种方式具体的实现过程进行了阐释.胡明玲、王建涛以宁波市数字图书馆服务外包产业信息门户关联数据应用为例,研究了关联数据发布与应用的架构,并以专业人才关联数据发布为例分析了关联数据发布和应用的实现方法.关联数据作为语义网的一个分支,其不仅能在系统内部很好地与对象信息资源有关的相关数据进行统一展示.还使企业能在自己系统中应用这些数据,拓展数据的利用方式的同时,支持企业的信息化建设,这对于企业或者图书馆来说,都具有重大的意义.

随着语义网研究的深入,语义网技术被应用到多个学科领域,从学科信息门户来看,融入语义网技术后,能够提供更有效的检索,能为用户提供更好的服务,但就我国目前的情况来看,还没有太多成熟的语义网应用,所以,应该重视语义网技术,并从理论研究上升到实践中,更好地为用户提供优质、有效的服务.

类似论文

我国会计信息质量现状

【摘 要】会计信息是一个企业一定时期的财务状况和经营成果的综合反映,其质量的高低直接决定了会计信息自身可用价值的程度 但。
更新日期:2024-4-5 浏览量:11638 点赞量:3898

我国城乡信息消费对比

摘 要:利用1998-2008年间我国城乡信息消费的时间序列数据,通过“新恩格尔系数”这一指标对我国城乡信息消费结构进。
更新日期:2024-7-13 浏览量:93825 点赞量:20609

我国城市政府门户网站检索功能调研

摘 要:本文选取中国大陆地区27个省会城市的政府门户网站作为调查对象,主要从检索功能设置和检索结果两个方面分。
更新日期:2024-5-17 浏览量:72054 点赞量:16876

关于我国电子信息技术趋势

【摘 要】本文分析了电子信息技术的发展的重要性和必要性,研究了我国电子信息技术在发展过程中存在的问题,。
更新日期:2024-2-10 浏览量:32689 点赞量:8401

2004年―2023年我国图书馆信息政策综述

摘 要通过对我国图书馆信息政策研究文献的年代分布、期刊分布、作者情况、关 键 词的出现频次等进行统计分析 认为目前关于。
更新日期:2024-3-6 浏览量:12936 点赞量:4878

我国体育信息的文献计量

摘 要:采用网络期刊检索工具《中国学术期刊网络出版总库》,在题名中以“体育信息”、“体育情报”。
更新日期:2024-5-20 浏览量:70418 点赞量:15951