学术搜索“不学有术”

学术搜索的出现,使普通人“站在巨人肩上”显得容易一些了.开发该类搜索的Google希望,这个搜索子集引擎,能够帮助那些对某个或某些领域热心的门外汉,提高成为专家的可能性.

对于中文使用者而言,下面的报道无疑是个好消息:

在1月9日和11日这两天,第一中文搜索引擎百度和全球互联网第一搜索引擎Google,几乎是不约而同地把焦点瞄准中文:百度则发布了国学搜索(guoxue.省略),而Google则发布了学术搜索的中文版(scholar.省略).

Google学术搜索可以帮助使用者准确搜索到某一领域的学术文献.据Google全球副总裁、中国区总裁李开复称,目前全球互联网上的中文学术文献的数量仅次于英文,中文已经成为互联网第二大语言,这也是Google积极推出中文学术搜索的主要动力.

目前,Google学术搜索可搜索到用英语等西欧语言、中文和巴西语、葡萄牙语撰写的文献.百度国学则主要专注于中国传统历史文化领域的资料搜索.目前两者均免费.

没有上网也能找到

记者最近正在研读《隋书》(中华书局版),就随便在Google学术搜索上查了一下该书的主编“魏征”,结果第一条就是唐朝魏征主编的《隋书》.同一时刻(1月12日9时30时),在百度国学上没有找到任何结果.

不过,Google学术搜索这第一条结果无法点击进去,该条目最左边的方括号中写着“引用”两字.

据Google资深工程师赵羽可介绍,Google学术搜索除了能检索到大部分已经上网的学术文献外,还可以通过对这些在线文献进行逻辑分析,找出那些没有上网的、但也许更加重要的文献,魏征主编的《隋书》就是一例.

原来,有许多在线的学术文章中都引用了该书的内容,版本也多为中华书局版,于是,该版就成为“魏征”词条下最重要的一条结果.当然,该书是否在线并不是研究者的最大障碍,重要的是,研究者知道了确实还有这么一本书可以参考.

Google杰出工程师AnuragAcharya说:“我们不知道下一个重要的突破会来自哪里,但我们相信,通过使各地研究者更轻松地了解在全球范围内已取得的研究成果,将对他们有所帮助.”

搜索结果的排名顺序对研究者而言,可能比普通用户更为重要.

赵羽可介绍,Google学术搜索的文献排名严格按照文章的学术价值来进行,参考因素包括文献、作者、出版者的权威性、被引用的次数等,与普通Google网页排名大有不同.

例如,查询“HumanGenome”(人类基因组),普通Google搜索结果超过700万个,排名在前面的都是机构首页,包括美国能源部、美国国家卫生研究院等,到了20名前后才出现刊登于《自然》、《科学》的相关文章.而Google学术搜索只命中39万个结果,排名前10位的都是在《自然》、《科学》等著名学术媒体上发表的文章.至于学术搜索的结果排名是否与Pagerank排名相似,赵羽可认为,有类似地方,但也有大不同.

“鱼香”是怎么来的

Google虽然给这个新鲜玩意起了个“学术搜索”的名字,但它一点也没有学者的“严肃”气质,反而活泼得很.这个新鲜玩意并不是学者的“独享品”,每个有兴趣的普通用户都可以自由把玩.

“Google学术搜索不仅仅面对学者和专家,普通用户也可以从中获得许多知识.”李开复说.比如,用户用学术搜索检索一下“鱼香肉丝”这个关 键 词,得到的结果十分有趣,其中有不少问题是普通人以前无法解答、甚至根本没有想过的,如:鱼香肉丝的“鱼香”是怎么来的.

Google学术搜索的口号是“站在巨人肩上”,利用这个学习工具,你完全有可能成为某一领域的专家,即使你现在还只是一个该领域的门外汉.


事实上,Google学术搜索并非完全独立的产品,它只是Google网页搜索的庞大数据库的一个子集.据赵羽可介绍,该子集建立在Google网页数据库的学术索引上,通过该索引,用户可以在一个更加准确的专业子集上搜索.

与Google网页搜索一样,Google学术搜索根据相关性对搜索结果进行排序,最相关的信息显示在页面上方.这一排序同时考虑到每篇文章的全文内容、作者、发表该文章的刊物,以及该文章被其他学术著作引用的次数等要素.在可能的情况下,Google学术搜索还会搜索全文,而不仅仅只是摘 要部分,给予用户对学术内容全面深入的搜索,同时也加强了搜索结果的相关性.

学术搜索是怎样炼成的

“学术搜索从提出想法到形成产品,仅用了9个月,开发者只有4个人:1个产品经理,3个工程师.”李开复说.

学术搜索的提出者是Google搜索的资深工程师之一,他最初的想法是:网上有很多为公众用户提供服务的搜索引擎,但很少有为专业人士提供服务的同类产品.

“魏征”的学术搜索结果

于是,他就在Google内部提出了自己的想法,立刻得到了一些同事的响应.

在Google内部有两个有趣的约定:第一,每个工程师都有20%的时间干自己想干的事;第二,Google大部分产品的提出,不是由公司高层决定,而是由决定的.

Google学术搜索之所以仅用了不到36人月的工作时间就形成产品,确实与上面两个约定有很大关系.

当然,还得有一个重要保障:公司不能急功近利.

李开复称:“Google学术搜索没有收费计划.”按照Google以往的惯例,学术搜索很可能是永久免费的.据悉,目前与Google合作的信息内容提供者如万方数据、维普资讯等,与Google相互之间都是免费的.

链接

百度推出国学频道

1月9日,百度正式推出“国学频道”(guoxue.省略).

据百度产品市场部总监边江介绍说,百度国学频道是全球第一个国学搜索频道,其数据主要由专业国学网站――“国学网”提供,为网友提供免费的国学典籍在线阅读以及搜索服务.该频道目前有10多万网页,1.4亿字;收录大部分上起先秦、下至清末两千多年间以汉字为载体的历代典籍,其内容将随着用户的需要而不断扩大.

跟以前推出的其他产品不同,国学频道的搜索只在频道内部进行,不会出现网页的搜索结果.这样,搜索出来的结果基本上具备了高精度、高准确度、高质量的三高特点.

百度董事长兼首席执行官李彦宏认为,互联网庞大的用户量和搜索引擎逐渐成为主要的互联网工具,使得国学得以以一种全新方式和面貌全面复兴.李彦宏表示,将来的国学频道,不仅仅是文字的,还将包括图片、拓片,甚至古典音乐等等,以将百度国学打造成一个“当代的四库全书”.

著名电子文献专家、国学网CEO尹小林表示,这次和百度的合作,也是看中了百度在中文搜索领域的地位与号召力,能够让更多人关注国学,了解国学,对国学的普及传播与弘扬大有裨益.

事实上,互联网上本已经具备国学的相关信息,但与互联网资讯掺杂到一起,很难高精度提取,也有很多经典国学内容被曲解,以讹传讹成为普遍现象.在此次频道建立过程中,百度公司邀请到一些博士生导师和国学专家们为这些信息进行了校勘.(文/贾鹏雷)

类似论文

谷歌学术搜索的缺陷

〔摘 要〕GoogleScholar是一种重要的检索工具 作者从应用角度中抽样统计并分析了这种工具的一些不足,包括对谷歌。
更新日期:2024-7-7 浏览量:13946 点赞量:4045

Googlescholar与读秀学术搜索比较

摘 要:Google scholar和读秀学术搜索是两种常用的学术搜索引擎 从资源覆盖范围、检索功能、检索效果和个性化服务等方面对这。
更新日期:2024-6-19 浏览量:82250 点赞量:18414

如何利用Glgoo学术搜索编辑参考文献

如何利用Glgoo 学术搜索编辑参考文献?请参看以下步骤: 一、如何利用Glgoo 学术搜索编辑参考文献前期关于本科毕。
更新日期:2024-11-3 浏览量:20733 点赞量:6128