外文教材书目数据的搜集技巧
教育部外国教材信息平台建设项目主要包括三部分内容:一是搜集整理2000年以来外国教材中心馆藏教材的书目信息;二是查询整理2008年以来国内外高校各学科专业的教学信息;三是搜索整理最新的国内外教材的出版信息。
其中,外国教材书目数据有重要字段信息30个。具体为:书目记录号(BibNumber)、中心代码(CustomerCode)、本馆索书号(CustomerCode)、中图分类号(ClCNumber)、题名(Title)、副标题(Subtitle)、中文译名(ChineseTitle)、国际标准书号10 (ISBN10)、国际标准书号13(ISBN13)、作者(Author)、编者(Editor)、出版社(Publisher)、出版年(PubYear)、出版地(PubPlace)、版本(Edition)、版本类型(BookType)、原版ISBN( OrigISBN)、关键词/主题词(Keywords)、丛编题名(Series)、卷期(Volume)、语种(Language)、页码(Pages)、前言(Preface)、摘要(Abstract)、目录(Contents)、内容简介(Description)、书评(Review)、读者对象(Readership),封面(CoverImage)、全文链接(FullTextUrl)等。
在数据整理过程中,有些字段信息的搜索非常简便,如页码(Pages),出版年(Pubyear)等24个信息,这里不作说明。而其它6个字段信息,如前言(Preface)、摘要(Abstract)、目录(Contents)、内容简介(Description)、书评(Review)、封面(CoverImage)等难以搜集。具体来说,前言(Preface)和目录(Contents)需要后期通过扫描仪扫描进行数据的录入。这里主要介绍封面(CoverImage)、摘要(Abstract)、内容简介(Description)和书评(Review)四个字段信息的搜集和录入技巧。
四种信息的搜集,用到的网站主要有亚马逊(www.amazon.com)、OCLC(www.oclc.org)、Google、Yahoo、百度、新浪、卓越网、当当网、淘宝网、美国国会图书馆(www.Loc.gov)、和www.alibris.com等。在各网站上,通过信息搜集比对后,发现:www.amazon.com最为全面和快捷。amazon中文译作亚马逊。该网站为规模最大、品种最全的网上购物商城。在线特价销售超过70万种图书、音像制品。同时提供玩具、礼品、家居、化妆、IT数码、手机、小家电、钟表首饰等20大类数十万种产品。点击“图书”进入界面,可进行搜索书目信息。此网站的优点,几乎所有的外文图书都可以在此网站检索到,有少部分图书缺少封面信息。OCLC(Online Computer Library Center,Inc.),即联机计算机图书馆中心,总部设在美国的俄亥俄州,是世界上最大的提供文献信息服务的机构之一,它是一个非赢利的组织,以推动更多的人检索世界上的信息、实现资源共享并减少使用信息的费用为主要目的。通过搜索发现,此网站书目齐全,但信息如,目录等无法截取,只可浏览。作为补充,可参考www.alibris.com网站。此网站特点是搜索简便,内容一目了然。当有些信息以上网站都没有时,再参考卓越网、www.loc.gov等网站进行搜索效果优佳。
关于外文教材书目数据的搜集,以封面(Coverimage)、摘要(Abstruct)、内容简介(Description)和书评(Review)为例,其搜集技巧如下。
首先,在电脑硬盘如“D”盘下,建立文件夹“外文教材书目数据信息”,打开此文件夹,建立上述4个字段信息的文件夹。以下介绍这4个字段信息的具体搜集方法。
1、封面(Coverimage)的搜集技巧
首先打开“南开大学外国教材中心书目”的Excel文档,点到对应的书目的ISBN码处,如“3527403205”,右键复制。打开亚马逊网站进入图书搜索界面,在空白处右键“粘贴”(或快捷键“Ctrl+V),点击“Go”,即进入图书信息界面,出现封面图片,点击图片进入链接,在大图片处点击右键“图片另存为”,选择保存在对应的文件夹下,在文件名处全选,摁快捷键“Ctrl+V”,即生成以ISBN码命名的图片文件(保存类型为jpg或者gif)。第二次及以后的保存直接“Ctrl+V”即可。需特别注意的是,不可在小图片上直接点击“图片另存为”,因小图片上写有“lookinside”字样。点击带有“look inside”字母的链接,出现书目的封面、出版信息、目录、附录以及封底信息等。此信息只可浏览,不可复制。
保存图片之后,在对应的其他书目信息的文件夹下建立word文件,举例,右键新建“Microsoftword文档”,然后选中“.Doc”之前的文字“新建Microsoft word”,点击“Ctrl+V”快捷键,即生成以ISBN码命名的word文件,右键复制,然后粘贴至其他对应的书目信息的文件夹下,方法是,打开对应的文件夹,点击“Ctrl+V”,word文件即粘贴在对应的位置上。此快捷键的使用比拉动滑动条更简洁,提高效率。
2、摘要(Abstract)的搜集技巧
在书目信息上面查找关于摘要的信息,复制粘贴在对应的word文档下,之后点击文字后面的小图标,右键,“仅保留文本”,以便使得所存信息文字格式一致。常有网站上没有的信息尝试在其他网站上查找。保证信息的完善,做到“有则必备”。
3、内容简介(Description)的搜集技巧
一般来说,内容简介部分,常有网站上皆有。复制粘贴在对应的word文档下,之后点击文字后面的小图标,右键,“仅保留文本”,以便使得所存信息文字格式一致。
4、书评(Review)的搜集技巧
常有网站上关于书评信息甚少,故需要在多个网站上进行搜集信息。如sina,google,当当等。将搜集所得信息复制粘贴在对应的word文档下,之后点击文字后面的小图标,右键,“仅保留文本”,以便使得所存信息文字格式一致。
有些书目信息,如封面(Coverimage)、摘要(Abstruct)、内容简介(Description)和书评(Review)的信息,即便用到多个搜索引擎依然查找不到。如果后期工作将前言(Preface)、目录(Contents)信息通过扫描录入,必将使工作量大大加重。对此,我们应寻求更有效的搜集方法。