图书馆便携式数据采集器实际应用查重处理

摘 要 :在现场采购已经成为图书采访工作的重要方式,利用数据采集器套用本馆现有的图书资源数据进行图书的现场查重与筛选,已成为各图书馆一种常用而有效的方法.而数据处理又以查重为主,虽然大多查重软件可以实现查重功能,但有时利用access功能进行多采集器数据处理感觉更加方便.本文结合实际工作经验介绍图书馆便携式数据采集器在实际工作中的使用方法及外出采购图书后的数据查重处理.

关 键 词 :图书馆 便携式数据采集器 查重

一、图书数据采集

1.图书数据采集前的准备工作

便携式数据采集器是通过对图书的ISBN号进行读取,并与存储的本馆图书ISBN号进行比对,从而实现查重功能.因此图书采集前应先将本馆图书数据导入到便携式数据采集器中.利用自动化图书管理系统的导出功能,将系统数据库中的图书数据导出,可导出为MARC数据或者Excel表格形式.因图书一般是分批购买,所以后续经常有书商的定单要加入其中,采用Excel表格来存储和管理本馆数据较为方便.因图书馆数据量越来越多,通常的Excel2003只能处理6万多行数据,所以一般采用Excel2010进行初步处理,将需要的文件按字段合并成一个文件,将无用的字段去除,保留ISBN、题名、库存数量、等基本信息,形成馆藏信息文件,用于导入数据采集器.因为图书一般是按照ISBN进行区分,甚至可只保存ISBN和库存数量,在采集中题名意义不是太大,当然不影响采集速度的话保留越多越好.

2.馆藏信息去重

(1)先将合并形成的馆藏信息Excel表中多余的列和行去掉,将“序号”改为“文本”,isbn按“数据/分列”,选择“文本”,将这一列转化为文本类型.

(2)将处理完后馆藏信息Excel表导入ACCESS中.

(3)新建Access查询,“在设计视图中创建查询”,打开设计视图,添加“总计”,在isbn这一列的总计中,选“Group by”,库存数量字段中选择“合计”,其它字段选择“Frist”,保存结果.经查询后的结果为按ISBN分类,对库存数量进行相加,其余字段不变的按ISBN去重的结果.

(4)将查询结果导出,这个结果即可用于导入便携式数据采集器.

3.数据导入采集器

(1)先将已经取出数据的采集器中的“订.txt”和“库.txt”删除.

(2)连接好数据采集器,点“开始/程序/新大陆图书信息管理软件/新大陆图书信息管理软件”,在打开的界面上点“书库数据管理/书库数据清空”,清空原有的数据(否则导入的数据会累加在一起).再点“书库数据处理/导入书库数据/导入DBF”,将DBF格式的馆藏数据导入到此软件中,导入完成后再选“书库数据管理/导出书库数据/将书库直接导出到采集器”,这时新大陆图书信息管理软件会进行数据处理,处理完后点确定,完成从电脑到采集器的传输.

(3)传输结束后,拔下采集器,换另一个已经清空数据的采集器,再点“书库数据管理/导出书库数据/将书库直接导出到采集器”,再次进行数据处理和传输.

二、便携式数据采集器定单数据的提取及处理

1.便携式数据采集器定单数据的提取

(1)将数据采集器连接电脑,点击“开始/程序/新大陆图书信息管理软件/图书数据交换”,点此界面上的“掌上设备”,找到“订.txt”文件,选中此文件,点此界面上的复制按钮,再点击“F”盘,(哪个分区也行,随便选,知道在哪放着就行),再点击软件界面上的“粘贴”按钮,(因导出订书数据有问题,所以采用复制的方法导出)

(2)将第一个采集器上的订书文件存为“订1.txt”,将第二个采集器上的订书文件存为“订2.txt”,下面的工作是将这两个采集器的isbn号查重.

(3)打开“订1.txt”,选“文件/另存为”,输入文件名为“1.xls”,点保存,会存为一个名为“1”的EXCEL文件,打开此文件,再选另存为,输入文件名为“11”,下面文件类型选“EXCEL工作薄”,此时的“11”为真正的EXCEL表格文件.其它定单文件也按此方法操作.


2.定单文件的处理

对定单的处理主要是从两定单中按isbn进行查重:

(1)将两定单中无用的列和行删除,保留序号、isbn、书名等基本列,保留列标题.(注意,两表列标题要相同,表最后一行统计行也要删除)

(2)打开定单EXCEL表,将第一列“序号”设为“单元格格式/数据/文本”,选中第二列isbn列,点“数据/分列/”,选择“文本”,将这一列转化为文本类型,最后保存文件.(所有EXCEL文件均如此操作)

(3)新建ACCESS数据库文件,将处理好的EXCEL两个表导入,将两表重命名为“1”和“2”(简单名字好用,注意此两表字段值必须一样,如果EXCEL两表已经将列标题设为一样,则此两表字段值是一样的)

(4)在ACCESS中点查询,“使用向导创建查询”,将所有字段导入,最后点完成生成一个查询表,并双击打开这个查询表.

(5)点“视图/SQL视图”,弹出SQL语名输入界面,删除里面所有内容,输入语句“select * from 1 where isbn in(select isbn from 2);”(注意,这条语句最后要跟一个英文版的分号),输入完后点上面的叹号“!”运行,保存此查询.此查询文件即为表1在表2中存在的相同的isbn号.

(6)如果是查询表1中有而表2中没有的isbn,应在查询中输入语句“select * from 1 where isbn not in(select isbn from a);”

(7)最后将查询结果输出保存.

三、使用体会

尽管便携式数据采集器在图书馆的应用中仍有不足,但其在图书现采中的作用和优势是不容置疑的.随着科技的进一步发展,软件的进一步升级开发,功能的进一步改进与图书管理系统的进一步完善,便携式数据采集器在图书馆的应用将会更加广泛、更加深人.

类似论文

IMP分散式数据采集器在火电厂的应用

摘 要IMP是一种新型的分散式数据信息采集装置,其可靠的采集精度和高强度的抗干扰能力,很好地解决了火电厂监控系统į。
更新日期:2024-6-23 浏览量:83450 点赞量:18896

基于C8051F320数据采集器的设计与实现

【摘 要 】本文论述了基于C8051F320单片机外接M25P32闪速存储器的数据采集器的设计与实现,并详细介绍了其软、硬件设计 它利用C8051F320单。
更新日期:2024-12-6 浏览量:22273 点赞量:6449

基于单片机的数据采集器设计

摘 要对于数据信息的转化和采集是一项非常重要的任务 信号能够以各种各样的方式存在于自然界中,比&。
更新日期:2024-5-21 浏览量:69747 点赞量:15768

基于LabVIEW的数据采集与子面板设计

LabVIEW虚拟仪器软件被广泛应用于测控系统的开发 本文阐述了在LabVIEW图形化编程语言的环境下,微弱信号采集系统界面的设计 介绍了菜单的。
更新日期:2024-1-15 浏览量:20806 点赞量:6114

三维模拟人形数码艺术设计与人体数据采集

摘 要 三维人体造型艺术产品是结合人体生理学特征,通过数字化手段设计的模拟人形艺术产品,是现代艺术设计手段与人体生理学完美结合。
更新日期:2024-9-17 浏览量:120700 点赞量:26791