《信息检索论文通用7篇》由精心整编,希望在【信息检索论文】的写作上带给您相应的帮助与启发。
循证医学与以往的传统医学临床经验和实践是有很大区别的,传统医学是以经验医学为主,也就是根据个人多年临床工作经验或以往临床工作人员的工作经验,依据现有的临床资料和对疾病的了解来主观的去为病人诊治。而循证医学的诊治原则是必须以真实客观的科学研究证据与临床实践相结合对病患安全的、正确的进行治疗。
网络信息检索,顾名思义,也就是在网络环境下进行的信息检索,也就是将网络上的真实的、有用的信息资源按照特定的方式存储起来,再用科学的方法,利用不同检索工具,为我们用户查找、解释、传递信息和知识的整个业务过程。它有广义和狭义两种概念概念之分,广义的网络信息检索包括信息存储和信息查找两个过程,而狭义的概念是广义概念的后半部分,也就是仅指信息查找这一过程。狭义的概念是被广泛应用的,也就是在各种专业数据库中查找搜索所需知识信息的过程。网络信息检索这门课程在高校已经开展了30多年,对于我们现代大学生而言都不陌生,无论是综合性的高校还是专业性比较强的工科、艺术、医学等专科性的高校,都是非常重视信息检索这门课程的开展。本研究就2016年以来近期调查河北省69所高校网络信息检索课程的开展情况来看,已全部实现所有本科类院校全部开展了信息检索课程,专科类院校也有95%已经开展这门课程;在所有调查高校中把信息检索课作为必修课的高校占所有高校的比例不足10%,把信息检索课作为选修课学分占比重较高的高校占所有高校比例为35%,作为选修课学分比重较低的高校占所有高校的百分之45%,而将这门课程作为公选课的高校占所有高校比重的10%左右。而对于医学高等院校甚至包括医学院校的附属医院的医生都是很重视着网络信息检索这门课程的学习。网络信息检索课的学习偏重于与医学信息知识相联系的方向,把循证医学的思维模式放入到网络信息检索课程的教学当中来,对于医学及其相关专业的科研工作人员是非常重要的。现今的互联网环境下,网络信息呈爆炸式增长席卷全球,优略混杂,信息泛滥,网络信息检索可以教会老师和学生怎样从海量信息中查找到有用信息,进而转变成自己所掌握的知识;循证医学研究的原则就是必须以科学研究证据为前提而进行研究;网络信息检索相当于一个查找工具,而循证医学相当于是被证明了正确的科学知识库,通过查找工具去查找获取科学知识,对于一个科研工作人员而言是非常正确的选择,因此,对于医学科研工作人员而言,在网络信息检索这门课中加入循证医学思维是非常有必要的,二者有着密不可分的关联性。
一、网络信息检索课国内开展现状与不足之处
(一)网络信息检索课国内开展现状
随着互联网技术的更新与飞速发展,信息检索课教学内容与网络信息、科学技术的发展有着密不可分的关系,对网络信息有用知识的检索与利用已经成为现代大学生迫切需要掌握的技能之一。当前信息检索课在大多数高校中使用的教材还都是纸版教材,电子版教材使用率还是比较低,从1984年国家教育部文书要求在各大高校开设文检课以来已经经历了32年的历程,各个高校在几十年的摸爬滚打中所使用的信息文献检索课的教材也都趋于稳定,直至今日我国国内出版信息检索的教材约900余种,本研究从不同的题名、主题、内容及载体等方面进行著作检索,总结出现今信息检索课的教材从学科专业的角度上大致可以分为三类:一个是通用型教材,也就是大部分高校都是使用的一种教材,不限学科类别,都可以通用;一类是针对专业性比较强的专科性学校的教材,分别是医学、军事、农业、经济等专业的教材;还有一类就是社会科学类的教材。现今使用通用教材的高校是最多的,占到大约70%。现今出版的专门针对医学的信息检索教材比较少,且没有统一的规定和约束,大部分医学类高等院校也是使用通用型教材。
针对信息检索课的教学改革研究,本文以中国知网数字检索平台对1984年以来近30度年对信息检索课的教学改革研究的文献综述进行统计,进入 comki网络检索平台的高级检索中的专业检索界面,以“信息检索课”或“文献检索课”为一类主题检索词,以“教学改革”或“课程改革”为另一类主题检索词进行二主题并列文献检索,共检索出838条结果,以2000年为分界线,2000年以前的研究性文献共75篇,2000年以后共763篇,可见自互联网技术的不断成熟与应用,信息检索这门课也在突飞猛进的发展,对其进行的研究也越来越多。更换主题检索词,还是以“信息检索课”或“文献检索课”为一类主题检索词,而另一类主题词替换为“医学”、“医院”或“医疗”进行二主题检索,共检索出563条结果,再增加并列主题词‘教学改革’或‘课程改革’进行三主题并列检索,共检索出111条检索结果。从以上三种主题检索结果分析,其士论文0篇,硕士论文仅有两篇关于信息检索课程教学改革的,关于信息检索这门课程的教学改革所做的研究性论文非常少。
(二)网络信息检索课存在的不足
1)信息检索教材内容陈旧,更新较慢,且应用混论。信息检索的教材一般经历编纂、修改、出版这三个过程,这种周期一般都比较长,本身经历了一到三年的时间才能出版[ 2 ],出版后的教材在应用到高校的教学中去后又会经历更长时间的的应用,一般都是五年到十年的时间,而恰恰是在这么长的周期中,网络信息检索技术在不断更新、发展、进步,从信息资源的管理不断完善到检索工具功能的不断更新和提高,譬如:各种专业数据库从最开始的简单基础检索到高级专业检索,还有他们服务功能的不断完善,有些数据库增添了在线咨询、名师讲堂的新内容以及博客搜索的新应用等等。这些新的理论和技术不会在旧的教材教学中体现,导致了教学内容的落后。近20来年,国家并没有下发过新的有关信息检索这门课程教学的文件或通知,截止到2016年3月,国内共出版了约70多种关于医学类的信息检索教材,各大医学类院校由于国家教育部并没有做出硬性规定,因此,各个高校都是文检教研室自行决定运用哪一种教材进行教学,随意性非常大。教材不统一,导致教学内容也比较混论。
2)信息检索课形式单一,电子化程度低。互联网技术的飞速发展使得现今教学手段发生了翻天覆地的变化,过去的一手书、一手粉笔、一面黑板的教学模式已改为现今的多媒体ppt教学模式。但是目前绝大多数高校所使用的教材仍然是单一性的纸板书为主,应用电子教材的学校微乎其微,甚至对电子版的教材比较陌生。电子版教材是近几年才发展起来的,它除了包含有纸质版的教材内容外,还包括配有导学光盘,电子课件以及课余的习题集等,是纸质版教材、指导性学习光盘和网络直播课程三位一体的新形教材。有些学校可能在专业必修课程的学习教材上已经应用到了电子媒体课件,但是在网络信息检索这门课程上的应用发展速度还是非常慢的,由于大部分高校是将信息检索这门课作为选修课来上的,并没有引起对这门课的足够重视,且教师的电子ppt教材制作水平参差不齐,因此课程形式的发展比较单一落后。
3)信息检索课缺乏与实践内容的对接,不利于培养学生实践动手能力。现今的医学类院校信息检索课程仍然是以教材理论为基础义务性的将课程中的基础理论知识、数据库检索以及检索工具使用理论机械性的介绍给学生,依然停留在课本内容章节介绍的层面行,学生即使理解了理论性的概念知识,如果长时间不应用在实际的问题中,很快就会把这些知识遗忘掉。教学内容枯燥乏味,普遍缺乏案例实际讲解与分析,亦或是案例太过陈旧,缺乏吸引性。信息检索课的实践教学时间要占用到总课时的一半,这样的教课效果可能最好[ 3 ]。因此,实践教学必须要提上日程,依据面对的授课学生专业的不同,教师也应对实践教学内容进行调整,如果要求以医学生本专业内容按其本人兴趣写一个综述性小论文,教师应以现场提问的方式教会学生选用什么样的检索词才能更好的检索出与自己兴趣相关的文献综述,进行现场检索演示,这样与学生互动,进行直接面对面的检索与提问,更有利于提高学生的实践动手能力,也有利于提高他们学习这门柘城的积极性。当学生发现信息检索课有利于自己专业学习能力提高时,会促进其更自觉的好好学习信息检索这门课[ 4 ]。因此,怎样更好的将医学的专业学习和信息检索课更好的联系在一起呢?下面就将循证医学思维运用到信息检索的教学中,以期对信息检索教学现状出现的问题实现改革。
二、基于循证医学的信息检索教学改革
(一)循证医学对信息检索课教学内容的丰富
现今医学高等院校讲解的医学信息检索课主要是讲解一些检索的基础性概念以及针对学校拥有的各种专业数据库教授一些检索的基本方法和技能,但是由于学生缺乏实践操作的机会,而枯燥乏味的概念又难以消化理解,即使课堂上学生掌握了所讲解的内容,但是用不了多久就会完全忘记,导致学无所用。因此,一定要将信息检索课的知识与学生的专业背景相联系起来。循证医学遵循的原则是医学临床实际遇到的问题,必须经考究分析找出科学证据,再结合临床经验,做出的正确处理;将循证医学的思维引入到信息检索课中来,信息检索的知识可以帮助循证医学更快更准的找到文献证据,而循证医学又可以帮助学生更好的笑话理解信息检索的知识[ 5 ],二者相辅相成,达到共同的目的:让学生更好更快的掌握所学知识。譬如解决一个医学问题:要求学生在医院实习期间做一个小儿脓毒症调查。首先计划好做这项调查分为哪几个环节,具体的实施步骤等。在做实际调查前教会学生首要做的就是检索文献,查找科学依据,这就是信息检索课所需要掌握的技巧;第二,运用循证医学思维筛选文献并依据地域和环境实际因素等,得出最佳调查方案实施调查。循证医学思维运用到信息检索课的教学中来可以有助于学生更好的学习这门课程以及作出更好的科研。
(二)循证医学对信息检索课教学方法的创新:在线教学和自助教学
随着高校校园网的逐步完善,现今大学生都会熟练地运用网络进行交流,因此,采用现有网络技术对学生实施在线和自助教学会有事半功倍的效果[ 4 ]。增强学生的自主性、自律性以及学习的积极性,使得网络信息检索课不仅提供给学生内容丰富的ppt知识,还给他们提供充分发挥能动性的机会,实施自助网络教学,检索课教师加以辅助性的指导,让学生自己动手在网络数据库中自主学习,网上完成老师布置的作业和考题,这样就充分调动了学生主动学习的积极性,教师还可以根据医学院校大学生的专业特点,提供医学经典案例,锻炼学生充分发挥想象力,运用循证医学原理搜集文献[ 5 ]。后期通过查看学生搜集文献,以相关文献全面性和准确性作为评价标准,找出学生存在的不足,再一对一的进行讲解。这样的互动式的实践学习方法既有利于促进学生学习循证医学知识,又有利于他们更好的掌握信息检索课的检索技能。
(三)循证医学对信息检索课教学模式和考核方式的改革
大部分医学类院校对网络信息检索课的考核方式并没有统一,而是根据教师自行决定,有的采用网络提交作业的方式,有的采用现场笔试,但是无论何种考核方式都存在一个问题,就是常常把循证医学的内容忽略掉,试卷内容往往只包含一些检索概念及技能,并没有很好的将循证医学思维融合进来,对学生动手能力及其信息素养能力的培养也就成了空谈[6]。因此,必须将循证医学思维设计进入信息检索的考题中,这样学生才更有兴趣更好的掌握这门课程,譬如:让学生依据个人兴趣爱好写一份医学检索报告。根据个人所选内容写出检索文献的思路和检索式。依据循证医学注重实践的思路,施行网络上机随机抽取试题的考试方式,每个学生抽取的试题都不一样,考试内容随机,比较灵活。这样不但拓宽了学生的检索思路,同时也增强了学生循证医学思维的运用能力。循证医学思维运用到网络信息检索课中来提高了学生的实操和信息素养能力。
互联网地位的日益凸显,使得各高校越来越重视网络信息检索这门课程,医学院校中在循证医学的辅助下,信息检索课变得更加的多元化、立体化,学生可以更积极主动的好好学习这门课,网络信息检索课有着更光明的未来。
作者简介:
[摘要]:因特网上的信息资源,是指以数字形式记录,以多媒体形式表达,存贮在网络计算机磁介质、光介质及各类通信介质上的信息集合。对网络信息资源及其检索进行必要的研究,有助于人们快速准确地获取网上有用信息,推动社会信息化与信息社会化的双向发展。因此本文阐述了网络环境下的信息资源检索策略及其应用。
[关键词]:网络环境,信息检索,信息过滤,文本挖掘
一、引言
21世纪是一个高度信息化的社会,信息就是生产力,在各个行业信息化发展的同时,人们对信息检索的完备、准确、快捷会有更严格的要求和期望。作为文献信息中心的图书馆也迎来了一个全新的信息环境,丰富的网络信息资源为图书馆的信息服务提供了广泛的资源基础,使网络环境下的信息资源检索策略发生了重大的变化。
二、网络信息的特点
(一)数量巨大而庞杂。Internet是一个基于TCP/IP协议连接世界各国数以百万计算机网络的通讯网,是一个集各种信息资源为一体的信息资源网。政府、机构、企业、个人等都可以在网上信息,因此它己成为无所不包的庞杂信息源,并具有跨地区、分布广、多语种、高度资源共享的特点。
(二)内容范围广泛。网上的信息源几乎涵盖了人类知识的全部领域,既有人文科学、社会科学、自然科学、工程技术信息,也有大量生活服务、娱乐消遣等方面的信息。
(三)信息类型丰富。其主要形式有网络出版,包括电子期刊、网上图书、电子工具书等;各种动态信息主要包括新闻、广告、股市行情、天气、交通、会议等;还有大量的书目数据库、联机数据库、软件资源以及个人主页、电子邮件等。这些信息都是数字式、多媒体,既有文本的信息,也有大量的图形、图像、音频、视频信息。
(四)动态性强。网上信息具有高度动态性,各种信息处在不断生产、更新淘汰的状态,同时连接在一起的各网络、网站、网页都时时刻刻在变化。网络信息还具有交互式特点,如BBS、聊天、游戏等。
(五)信息组织特殊、控制性差。因特网上信息的组织以超文本技术链接,构成立体网状文献链,把不同国家地区、不同服务器、各种网页、各类不同文献的相关信息都通过节点链接起来,使得检索相关文献、相关信息非常方便,加强了信息间的关联度,形成了一个网状结构。
(六)有序与无序,集中与分散并存。互联网上的信息没有统一控制,虽然从局部来说某个网站、某个数据库是有控制的、相对集中的、有序和规范的,但总的来说互联网的信息没有统一的控制,信息质量良荞不齐,信息也处于分散、无序、不规范的状态之中。
三、网络环境下的信息资源检索策略及其应用
科学技术的日新月异和用户需求的不断提高促使网络检索工具相应发展,网络环境下的信息资源检索策略及其应用可以分为以下几个方面:
(一)信息过滤技术及其应用
Internet开放式的环境,为人们检索和利用信息提供了极大的方便,但同时,网络环境也为人们及时准确地检索到所需信息带来了麻烦。信息过滤技术就是在这样的背景下开始受到人们的重视,它的目的就是让搜索引擎具有更多的“智力”,让搜索引擎能够更加深入、更加细致地参与到用户的整个检索过程中,从关键词的选择、检索范围的确定到检索结果的精炼,帮助用户在浩如烟海的信息中找到和需求真正相关的资料。
在用户的检索过程中,信息过滤可以通过多种途径实现。第一,关键词的选择。当用户要检索不太熟悉的领域时,系统可以通过提供机读类词表的方法方便用户选词,也可以通过后控词表等方法自动扩大或缩小(通常是通过近义词表扩大)检索范围,提高查全率和查准率;第二,利用过滤模型。过滤模型是目前Internet上信息过滤主要方法,它是通过设计过滤软件并附加到网络信息检索的程序中以增加过滤功能。这主要表现在两个方面,一方面,搜索程序在进行信息搜索时可通过过滤功能过滤掉一些认为价值不大或没有价值的信息;另一方面,用户也可根据自己的需求选择服务项目与内容,通过过滤机制快速找到所需的信息资源。其方法是根据需求设置过滤条件,如不希望获取的网址、某类主题的内容、某种类型或范围的信息等,程序在运行时一旦触发条件,则可将有关信息删除或拒之门外,而其他信息仍可输入。
(二)文本挖掘技术及其运用
文本挖掘是知识管理研究领域的新兴分支之一,为文本信息的整理、分析、挖掘提供了有效的手段。传统的信息检索或信息访问,主要根据用户提供的查询条件从文档数据库中检索出相关的文档信息。为了提高信息访问的准确性,检索系统增加了相关处理,如文档分类、自动文摘、主题词自动抽取等方法,使用户能够方便查找到所需信息。在文本挖掘处理中,大多采用神经网络模型描述文本及文档数据库各概念之间,以及概念和文档之间、文档与文档之间的相互关系在信息检索中,无须分析文档中概念之间的相互关系,只要依据用户的查询,返回相关文档集合。但是,文本挖掘不仅能够区分不同的概念,还能够分析不同概念结点之间的相互关联关系。
1、文本内容挖掘在检索中的应用。文本内容挖掘是指从文档内容及其描述中获取知识的过程,由于用传统的信息检索技术对文本文档的处理不够深入,因此,可以利用文本内容挖掘技术来对网络信息检索中的文本文档处理部分进行进一步的完善。
2、文本结构挖掘在网络信息检索中的应用。文本的信息组织方式采用了一种非平面结构,一般来说文本的信息组织方式是根据内容来进行组织的。但是由于文本的这些结构信息比较难以处理,所以搜索引擎一般不处理这些信息,而是将文本页面作为平面机构的文本进行处理。但是,在文本结构挖掘中,通过对文本文档组织结构的挖掘,搜索引擎可以进一步扩展搜索引擎的检索能力,改善检索效果。
3、文本行为挖掘在网络信息检索中的应用。文本行为挖掘是一种通过挖掘总结出用户的检索行为的模式。用户的检索行为一直是信息检索中重要的研究内容,通过文本行为挖掘,不仅可以发现多数用户潜在共同的行为模式,而且还可以发现单个用户的个性化行为,对这些模式进行研究,可以更好地对搜索引擎的检索效果进行反馈,以便进一步改进搜索策略,提高检索效果。
(三)全文检索技术及其运用
我国对全文检索技术的研究已经有一段时间了,也取得了一定的成果。主要集中在汉字全文检索、超文本全文检索、网络环境下的全文检索技术等方面。全文检索作为一种发展迅速的检索技术,近年来已得到广泛的关注并走向市场。有学者提出的“汉字全文检索系统的关键技术与实现”,在对中西文全文检索系统进行分析比较的基础上,提出了一种新的索引建立方式,并在此基础上,实现了支持模糊提问的全文检索。同时独立设计了自己的数据结构和算法,以及利用VisualC++在Windows环境下加以实现。全文检索技术的运用包括:1、检索主题要求对全文检索效果的影响:通过适当扩大检索范围或多字段联组检索来改善检索主题专指度过高;缩小检索主题范围,提高查找专指度,采取适当的检索策略,来限制检索主题范围太宽;提高检索主题要求的明确性;2、组配检索式对全文检索效果的影响,导致在确定检索词时,不仅仅要考虑到各检索词本身的切题与匹配。在这方面虽然取得一些成绩,但是国内的全文检索软件全是商品化的,其技术都不公开,导致低水平重复;汉语本身有难度,国内目前还没有公开的词库及可用的自然语言理解模块,重复研究的现象比较严重。
(四)自然语言处理技术及其运用
自然语言处理(naturallanguageprocessing,简称NLP)是语言信息处理的一个重要分支。所谓自然语言处理就是计算机对自然语言的形、音、义等信息的理解及词、句子、篇章的输入、输出、存储和识别等多方面的加工。尤其侧重于研究计算机对于句子、篇章的处理。
自然语言处理在网络信息检索中的应用方式主要有以下几种:
1、自动标引
由计算机实现文献标引,分为抽词标引和赋词标引两种类型,前者是从文献中自动抽出能表征文献主题的词作为标引词,而后者则在此基础上引入预先编制的词表来规范自动抽取出的词,不过这种词表从其生成来看与规范语言词表本质上是不同的,自动标引的目的是赋予文献自然语言标引词,以使检索时直接用自然语言词进行匹配查找。
2、自动文摘
利用计算机来完成文献文摘的编制。其一般过程为:(1)原始文献的录入,使之转化为机读形式;(2)确定每个单词和句子的“意义”与权值的测量标准;(3)通过计算每个单词和句子的权值来分析输入计算机内的文献,选出一组最能代表文献主题内容的句子;(4)排列和打印句子,形成文摘。
3、文本检索
文本是文献题名或文摘、文献的正文。文本检索就是不对文献进行标引,而是以自然语言表达检索课题。它需要借助计算机的自动匹配功能直接在篇名、文摘、正文中查找。文本检索要掌握字符串匹配、截词检索、位置逻辑检索等技术。
四、结论
总的说来,变化是因特网发展的永恒主题,也是网络信息检索的发展主题。随着因特网技术的发展,网络信息检索将不断的改进和完善,越来越满足人们的网络信息的获取需求。
[参考文献]:
1黎小妮网络信息资源检索研究图书馆学刊2006(5)
2王平网络环境下信息资源及信息检索遵义科技2006(3)
3陈剑网络信息资源检索存在的问题及解决对策情报资料工作2005(5)
关键词:信息检索 信息分析 信息提炼 立体印刷
中图分类号:TM63 文献标识码:A文章编号:1674-098X(2016)09(c)-0100-02
在新的生活环境下,每个人都需要从各种各样的信息源中收集、提炼有用信息,为正确决策提供参考。一方面,人们可以利用网络方便、自由、快捷的、查询信息;但另一个方面,由于网络环境的开放性,信息更新的快速性,使得信息资源出现分散、异构、无序的特性,极不利于人们有效开发和利用这些资源。面对信息急剧增长、技术不断更新的新局面,需要我们对信息检索技术进行深入的研究,从而提高网络信息资源的利用率,尤其是科研工作者必须增强获取、选择和利用信息的能力。
1 信息检索概述
信息检索是将信息按一定的方式组织起来,并根据信息用户提交的查询条件检索出相关文档的过程和技术。信息检索涉及数据库技术、图书和情罂蒲А⑷斯ぶ悄堋⒆匀挥镅源理、机器学习等众多知识和学科领域[1]。信息检索作为一门学科,主要研究信息的获取、表示、存储、组织和访问。
1.1 信息检索的意义
信息检索是对信息进行集中表示、存储、组织加工、统一管理,使用户更容易得到所需要的信息,进而对信息进行加工,根据分析得出新的思路和方法,实现信息激活和增值。有效的信息检索可以节省科技人员的时间,提高工作效率;帮助人们进行知识更新;继承和借鉴前人劳动成果,促进科技的快速发展;协助管理者做出正确的决策。
1.2 信息检索的四要素
信息检索包含四个要素:信息意识、信息源、信息获取能力、信息利用[2]。信息意识是信息检索的前提,指人们借助信息系统获取所需信息所做出的能动反映,使人们对信息的敏感程度、选择和运用信息能力;信息源是信息检索的基础,如专著、期刊、报告、学位论文、会议记录、专利、标准、统计数据、政府出版物、档案文献信息等;信息获取能力是信息检索的核心,是指人们对信息的了解、查找、整理加工;信息利用是信息检索的关键,即对信息进行有效的加工和利用。
1.3 检索语言及方法
检索语言是为沟通文献标引与文献检索而编制的人工语言,是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道。检索语言主要包含分类、主题、代码和自然四类语言[3]。分类语言是指用各种分类号来进行检索的标识,按学科性质进行系统排列,包括主题、科学、图书和专利分类语言;主题语言是直接以表达文献主题的词语作为检索标识,包括关键词、标题词、单元次和叙词语言等;代码语言是指将事物的某一方面特征用代码系统来标引和排列的检索语言,例如,分子式索引系统;自然语言是指未经规范化处理的检索语言。
信息检索包括手工和计算机检索,常用的检索方法有拉网法、引文法、顺查、逆差和抽查法、排除、限定和合取法。检索途径归为两大类:一类是用信息的外部特征,如责任者、题名、某种序号、机构名等作为检索标识;另一类是用描述信息内容的分类号、关键词、主题词等作为检索标识。通常直接输入检索字段直接点击搜索,但需要精确查找目标文献时,要利用高级检索方式设置一些查询条件,如查询范围、时间、方式(模糊和精确)、字段逻辑关系的编辑等。
2 信息检索流程
信息检索过程可分为以下步骤:课题的确定――选择合适的数据库――初步拟定检索式检索――调整检索策略(考虑准确性)――命中结果分析――批量下载――信息分析。下面以立体印刷技术的相关资料的搜集为例介绍信息检索过程。
2.1 检索工具选择
对于日常信息的搜索,通常采用百度、谷歌等网站,但对于专业文献的检索则需要专门的数据库,每个数据库都有自己的特点。
(1)馆藏书目查询:书目是将图书、期刊按一定规则收录,并有序编排的检索工具。通常包含题名、责任者、主题词、分类号、索取号、ISBN/ISSN号、出版社等字段,输入检索词即可检索,大多数高校图书馆都有自己的馆藏书目数据库,检索、下载。
(2)中国学术期刊全文数据库:目前世界上最大且连续动态更新的数据库,内容覆盖工程技术、自然科学、农业、哲在新的生活环境下,每个人都需要从各种各样的信息源中收集、提炼有用信息,为正确决策提供参考。一方面,人们可以利用网络方便、自由、快捷的、查询信息;但另一个方面,由于网络环境的开放性,信息更新的快速性,使得信息资源出现分散、异构、无序的特性,极不利于人们有效开发和利用这些资源。面对信息急剧增长、技术不断更新的新局面,需要我们对信息检索技术进行深入的研究,从而提高网络信息资源的利用率,尤其是科研工作者必须增强获取、选择和利用信息的能力。
1 信息检索概述
信息检索是将信息按一定的方式组织起来,并根据信息用户提交的查询条件检索出相关文档的过程和技术。信息检索涉及数据库技术、图书和情报科学、人工智能、自然语言处理、机器学习等众多知识和学科领域[1]。信息检索作为一门学科,主要研究信息的获取、表示、存储、组织和访问。
1.1 信息检索的意义
信息检索是对信息进行集中表示、存储、组织加工、统一管理,使用户更容易得到所需要的信息,进而对信息进行加工,根据分析得出新的思路和方法,实现信息激活和增值。有效的信息检索可以节省科技人员的时间,提高工作效率;帮助人们进行知识更新;继承和借鉴前人劳动成果,促进科技的快速发展;协助管理者做出正确的决策。
1.2 信息检索的四要素
信息检索包含四个要素:信息意识、信息源、信息获取能力、信息利用[2]。信息意识是信息检索的前提,指人们借助信息系统获取所需信息所做出的能动反映,使人们对信息的敏感程度、选择和运用信息能力;信息源是信息检索的基础,如专著、期刊、报告、学位论文、会议记录、专利、标准、统计数据、政府出版物、档案文献信息等;信息获取能力是信息检索的核心,是指人们对信息的了解、查找、整理加工;信息利用是信息检索的关键,即对信息进行有效的加工和利用。
1.3 检索语言及方法
检索语言是为沟通文献标引与文献检索而编制的人工语言,是连接信息存储和检索两个过程中标引人员与检索人员双方思路的渠道。检索语言主要包含分类、主题、代码和自然四类语言[3]。分类语言是指用各种分类号来进行检索的标识,按学科性质进行系统排列,包括主题、科学、图书和专利分类语言;主题语言是直接以表达文献主题的词语作为检索标识,包括关键词、标题词、单元次和叙词语言等;代码语言是指将事物的某一方面特征用代码系统来标引和排列的检索语言,例如,分子式索引系统;自然语言是指未经规范化处理的检索语言。
信息检索包括手工和计算机检索,常用的检索方法有拉网法、引文法、顺查、逆差和抽查法、排除、限定和合取法。检索途径归为两大类:一类是用信息的外部特征,如责任者、题名、某种序号、机构名等作为检索标识;另一类是用描述信息内容的分类号、关键词、主题词等作为检索标识。通常直接输入检索字段直接点击搜索,但需要精确查找目标文献时,要利用高级检索方式设置一些查询条件,如查询范围、时间、方式(模糊和精确)、字段逻辑关系的编辑等。
2 信息检索流程
信息检索过程可分为以下步骤:课题的确定――选择合适的数据库――初步拟定检索式检索――调整检索策略(考虑准确性)――命中结果分析――批量下载――信息分析。下面以立体印刷技术的相关资料的搜集为例介绍信息检索过程。
2.1 检索工具选择
对于日常信息的搜索,通常采用百度、谷歌等网站,但对于专业文献的检索则需要专门的数据库,每个数据库都有自己的特点。
(1)馆藏书目查询:书目是将图书、期刊按一定规则收录,并有序编排的检索工具。通常包含题名、责任者、主题词、分类号、索取号、ISBN/ISSN号、出版社等字段,输入检索词即可检索,大多数高校图书馆都有自己的馆藏书目数据库,检索、下载。
(2)中国学术期刊全文数据库:目前世界上最大且连续动态更新的数据库,内容覆盖工程技术、自然科学、农业、哲学、医学、人文社会科学等各个领域。可进行高级、专业、跨库检索以及期刊Ш健
(3)中国优秀博硕士论文数据库:目前国内相关资源最完备、连续动态更新的高质量学位论文数据库,包含理工、农业、医药、文史哲、法律、教育与社会科学、电子与信息科学、经济以及专题文献等。
(4)外文文摘数据库:既包含单学科数据库,如CA(化学)、PA(石油)、Georef、Medline等,又包含多学科综合数据库,如Dialog、EI、CSA、SCI、IEEE/IET、Spinger等。对于国际化的今天,外文检索已成为每个考研人员必备的技能。
(5)其他数据库:Google学术中文和外文搜索、万方、维普、知网、专利检索系统以及标准文献检索数据库等。数据库文件普遍采用CAJ和PDF格式,须下载专门的浏览器来阅读。
2.2 检索词确定
确定中文检索词:设置与论文名字相关的检索词进行检索,如,立体印刷、3D印刷、立体图像、立体印刷品;确定英文检索词:stereoscopic printing、3D printing、stereoscopic image printing、auto-stereoscopic image
2.3 检索过程及结果分析
利用以上介绍的检索方式以及各个数据库的特点,选用中国知网、Google学术、硕博士论文数据库、EI和专利网,结合设定的检索词进行文献检索,该文例子主要围绕图书、期刊、硕博士论文和专利来搜索。为了便于对文献的管理、引文编排,论文写作采用EndNote插件建立分类文献库。在搜索文献时注意尽可能将时间设定在近5年内,学位论文搜索优先,这样对研究对象的背景、现状首先有大概的了解;其次进行大量其它文献的检索,可以参考论文后的参考文献、某个领域的专家或数据库连接到的相似文献等来扩展检索。无论对于中文还是外文的搜索,不能盲目下载,必须注意文章摘要与目标对象是否有关,否则会加大有用文章筛选的工作量。
检索到的文章由于存在相似性,一定要做好分类,方便快速查找。总的来看立体印刷技术相关文献主要涉及人眼视觉理论、光栅成像、立体图像制作、光栅材料及使用、立体印刷产品质量评价和市场分析、立体印刷工艺研究以及相关设备制造等。通过以上文章的搜索我们可以对立体印刷有大致的了解,对于写综述性的论文可以按照以上点来设置章节标题,如果要进行某一点的深入研究,需要认真研读,将文章的各个点吃透,或进一步查阅相关资料。总之,文献检索不能盲目,初步检索分析后,再次具有针对性性的进行检索。
3 结语
该文围绕信息检索技术展开讨论,首先,简单的介绍了信息检索的含义、目的、意义、检索要素和方法等,让大家对此有直观的认识。其次,结合立体印刷技术综述报告的例子,详细的阐述了文献的查找渠道、提炼、分析和总结过程,对以后工作和学习中有效的进行信息检索具有一定的参考价值。
参考文献
[1] 刘双魁。信息检索与利用[M].上海:东南大学出版社,2010:8.
[2] 祁延莉。信息检索概论[M].北京:北京大学出版社,2013:7.
1.1信息载体多样化、信息存储手段数字化。随着计算机技术、数字化技术、信息加工和存储技术的发展,信息载体逐步由传统的纸质载体向磁性载体、电子载体等多种载体形式发展。信息的存储手段也相应发生了革命性的变化。由以数字化的全文、文摘等方式向用户提供的服务越来越多,越来越普遍,在很大程度上替代了传统的印刷型文献的服务范围。
1.2信息检索工具逐步由印刷型向数字化、电子化的数据库转变传统检索工具多为印刷型,随着科学技术的发展,检索工具逐步转为数字型。国际上大型检索数据库的建立已有30多年的历史,如Dialog系统和Medline系统已具有很大的规模,用户遍及全世界。
1.3信息检索方式发生了很大变化操作平台Windows化,数据链接超文本化,通信手段网络化,计算机检索已成为目前检索技术发展的主要特征。图书馆不仅是传统的印刷型文献信息中心,而且正逐步成为数字化信息中心。目前大部分高校开通了远程网络数据库,或建起了网络数据库的镜像站点。信息检索方式由手工转为计算机检索,发生了根本性的变化。文献检索课实习方式也要随之发生变化。
2.文献检索课实习内容改革
2.1手工检索实习仍要保留,但要降低比重随着计算机、网络技术的迅猛发展,作为文献检索课实习的两大组成部分的手工检索实习和计算机检索实习的地位正在发生重大变化。计算机文献检索系统的快捷、灵活、方便等优点,正逐步占领信息检索的统治地位。但计算机检索是近几年才发展起来的,收录年限较短,文献覆盖面较小,仍不能完全取代手工检索,因此,还需保留手工检索教学与实习。手工检索实习方面,重点是让学生掌握检索工具书的具体使用方法。一般的检索工具书是按分类法检索语言和主题词检索语言来组织其文献信息的。所以有必要让学生了解分类法和主题词这两种组织文献信息的科学方法。通过实习,把收集到的文献信息资料进行分类,这是一种对信息的组织管理能力,也是对信息的评价过程,通过这种分类,学生对信息包含的概念,信息增量、信息特性,就会有更清楚、深刻的认识。同时,从分类途径检索信息也是信息获取的重要手段。对于主题词,一方面,可以对收集、检索到的文献信息资料用主题词的方法进行组织、概括、管理;另一方面可以利用检索工具书的主题索引来检索信息,使学生具备从收集、摘录的信息中概括出主要的观点,能综合主要的观点来重建新的概念的能力。可以设计作业来训练学生运用这两种科学方法检索、组织信息的能力。
2.2侧重计算机检索实习
2.2.1增加计算机方面的基础知识介绍与实习。随着计算机、网络技术的飞速发展和多媒体技术的广泛应用,信息检索手段的自动化和网络化程度不断提高,信息传播的深度与广度达到了前所未有的水平。文献检索实习离不开计算机,离不开计算机网络,文献检索实习中首先应增加计算机基本应用技能练习,为掌握中外计算机信息检索系统的使用方法和技巧打下结实基础。
2.2.2增加网络、通讯的基本知识和使用方法的实习。增加网络、通讯的基本知识和使用方法的实习,特别是网络信息的传输、交流与利用,如FTP、E-mail、BBS等。增加网络信息资源的种类与特点,网络数据库和Internet信息利用方面的知识,对著名的网络数据库、虚拟图书馆、专业检索网站、网上电子期刊检索、网络信息作重点介绍。尤其是培养学生使用互联网搜索引擎。目前,针对学生毕业论文的写作重点介绍一些专门的信息检索系统。比如一些著名的检索工具的网络版:Dialog联机检索系统,STN联机检索系统;comKI工程的系列产品:中国期刊全文数据库、中国优秀博硕士学位论文数据库等;超星电子图书、书生电子图书等;springer数据库,Ebsco数据库等。
2.2.3网络资源查询工具及其使用方法等予以介绍与实习。计算机检索实习的另一个重点就是网络信息资源检索,其主要内容就是介绍检索网络信息资源的一些重要的搜索引擎及其使用方法,如:Google、Excite、Infos-eek、Yahoo!、网易(NetEase)、搜狐(Sohu)、新浪(Sina)等进行关键词、网页、分类目录和网站搜索的能力,使学生能快速地查找所需信息。要让学生通过以上的学习,能够比较熟练地掌握网络的基本知识和使用方法,掌握常用社会科学及农业数据库的使用,学会正确选择数据库,运用机检的基本方法和技巧,构造检索表达式,比较不同检索表达式的不同检索结果,积累检索经验,掌握机检的一般规则和技巧。对网络信息可以自如地检索、阅读、下载、保存。通过信息资源的收集、整理、阅读、鉴别和科技论文的写作,重点培养学生的自学能力、科研创新能力。
3.实习方法改革
除手工检索仍按传统方法实习外,在计算机网络技术环境下,文献检索课实习应以网络为基础,制作多媒体课件,利用网络和多媒体进行实习演示。手工检索实习与计算机检索实习比重为3比7或4比6较好。对不同专业重点讲解不同数据库,如给经济管理专业的学生重点讲授中文期刊数据库(清华同方)、中文科技期刊数据库(重庆维普)、万方数据库、EBSCO数据库之外,要重点介绍《中国经济信息网》的使用方法、技巧。以课件形式详细演示各数据库打开方式、检索策略、检索步骤及注意事项等。每人一台计算机,也可以几人一组,共同协作完成某课题,可作示范性打印,并要求写出检索报告。在教学讲授之后,要紧接着安排实习,加深对课堂讲授知识的印象。对不同专业设置不同课题,有针对性的进行实习。要求学生熟练掌握本专业主要数据库的使用方法,会用搜索引擎查找所需的各类信息,会利用E-mail,BBS、Netmeeting提问、答疑、交流,进行交互式、讨论式教学,让学生自己动手、动脑,主动地思考问题,最大限度地发挥学生的能动性。同时要求学生把毕业选题作为实习课题,手工检索与计算机检索同时使用,写出实习报告,阐述毕业选题及目前国内外研究现状,确定毕业课题立足点和研究方向,并附检索到的文献。只有这样,才能跟上时展,把学生真正带到快、精、广地获取文献信息的前沿。
4.文献检索课实习改革支撑条件
4.1要具备计算机、网络基础设施
文献检索课实习中的手工实习部分,应配备好足够的文献检索工具书,建立传统文献检索实习室;计算机检索部分要求在网络环境下,采用先进的机检教学设备,良好的网络环境,单独建立计算机检索实习室或利用电子阅览室作为实习基地,开展光盘检索、网络教学,增加计算机检索实习学时。要建立有一定规模的多功能电子阅览室至少要有50台计算机,建立小光盘局域网,同时联接校园网及INTERNET才能满足机检教学实习顺利进行的要求。
关键词:信息素养;高职院校;文献检索课
在当今知识社会和信息时代,信息素养是大学生必须具备的基本素质。目前在高职院校中培养大学生信息素养主要的途径之一就是文献检索课程。随着高职院校的快速发展,尤其是信息技术的不断发展,互联网的不断普及,对于大学生信息获取、信息分析、信息利用能力的要求也越来越高。如何改进和创新文献检索课程的教学,有效提升大学生信息素养,是高职院校面临的一个重要课题。
1 文献检索课是开展大学生信息素养教育的重要途径
信息素养的定义最早是由美国信息产业协会主席Paul Zurkowski于1974 年提出来的,他把信息素养定义为:“人们在解决问题时利用信息的技术和技能”。美国图书馆协会在其1989年的报告中明确信息素养的概念,为:“个体能够认识到何时需要信息,能够检索、评估和有效地利用信息的综合能力”。随着信息社会的发展,终身学习的能力是我们必须具备的基本素养。而终身学习能力在很大程度上取决于自身信息获取、分析和利用的能力,即信息素养。高职院校培养的是应用型人才,其理论教育相对较少,这就要求所培养的人才要有较强的自学和独立研究能力,因此,培养信息素养尤为重要。
目前在高职院校中培养信息素养的主要形式和主要渠道就是文献检索课程。文献检索课程的教学目标是增强学生信息意识,培养学生独立获取、收集、分析、处理信息的能力,改善知识结构,为自主学习、继续学习和终身学习打下良好的基础。其核心是培养学生的信息意识和全面提高学生的信息能力。同时,文献检索课整个教学过程不仅仅是让学生去寻找知识、识记知识,还有意识地培养学生的创造性思维,培养学生提出问题、分析问题及解决问题的能力,这种思维和能力的培养将为其现在的学习和日后的工作奠定良好的基础。
高职院校图书馆作为文献资料和信息中心,是为教学和科研服务的学术机构, 在学校中占据着重要的地位。 同时,图书馆也是大学生汲取知识,开阔视野,陶冶情操的重要场所。随着网络的日益普及和自动化、电子化程度的提高,高职院校图书馆的服务内容、手段和方式都发生了巨大变革,图书馆教育职能得到了拓展,其教育和信息服务功能已上升到主导地位。开展信息素质教育,培养学生的信息意识和获取利用信息的能力成为图书馆新的工作重点。因此,加强文献检索课程建设,将信息素养教育贯穿全部教学过程,普及信息观念意识,增强大学生的信息素养,是高职院校图书馆面临的一个重要课题。
2 高职院校文献检索课教学的现状及存在的问题
我国高职院校文献检索课程兴起于21世纪初,多年来为培养学生的信息素养发挥了重要的作用。但是由于种种原因,目前文献检索课的教学还存在着不少问题,主要体现在以下几个方面。
高职院校对文献检索课的重视程度,远不如本科院校。高职院校注重学生的专业技能的培训,实训是教学的重点。一般采取“2+1”的人才培养模式,前两年在校学习,第三年到企业实习实训。因此,学生的课时相对比较紧张,文献检索课多作为公共选修课,其教学经费的投入、教师的安排、教学计划的编制等都不如其他学科受到学校的重视,学生选修的也不多。
2.2 教学内容单一,与专业学习结合较少
文献检索课在教学内容的选择上也普遍存在问题。有些教学内容中是模仿本科院校的内容,不符合高职院校学生的知识层面。并且,据调查了解,各高职院校基本上都以公共选修课的形式来开设文献检索课,面向全院学生,不分专业和年级。教学只能兼顾所有专业,侧重介绍一些基本理论,基本的检索技能以及图书馆购置的电子资源等,很少涉及信息法律和信息道德的教育,也无法与专业学习相结合,不能满足学生的专业化、个性化的信息需求,缺少对学生的吸引力,学习效果难以保证。
2.3 教学方法单一,实践教学不足
文献检索课的定位应该是一门实用的方法课,教授的应该是文献检索方法,在教学过程中应该侧重学生操作技能的培养和实际应用能力的提高。但是,目前文献检索课的授课虽然大部分采用了多媒体的现代教学手段,但教学模式仍然是以课堂讲解为主,动手实践为辅,这种教学模式难以发挥学生学习的积极性与主动性,也不符合文检课的教学目标,教学效果不佳,不利于大学生信息素养的培养和提高。
2.4 师资力量薄弱
文献检索课的实践性要求任课教师不仅要掌握图书馆学、情报学等相关理论知识,具有较好的计算机应用能力,而且要具备一定的专业知识背景。目前多数高职院校的文献检索课的教师是由图书馆员兼职。他们当中大多数人虽然比较熟悉文献检索的基本知识以及文献检索的方法,但对各专业课程相关的知识却较为匮乏,不能有针对性地开展教学工作。并且,由于得不到重视,文献检索课的教师缺少必要的进修、培训机会,知识不能得到及时更新。这些都在一定程度上制约了大学生信息素养教育的发展。
3 加强文献检索课程建设,提高大学生信息素养
3.1 高度重视,加强宣传
首先,高职院校的领导层要充分认识到信息时代大学生学习文献检索课程,提高信息素养的现实作用和长远意义,以及文献检索课程对于学生学习其他课程和提高综合素质的特殊作用。要高度重视文献检索课程的教学,将其纳入学校的课程体系和教学计划中,为文献检索课程建设提供政策支持和加大资金投入。
其次,采取板报宣传、网络宣传和专题讲座等多种形式,广泛宣传信息素养的重要性以及文献检索课程的目的和意义,营造一个推广信息素养教育的大环境,使广大师生提高认识,增强兴趣,共同参与到文献检索课程的教学活动中去。
3.2 更新文献检索课程的教学理念
文献检索课程的教学必须树立信息素养教育的理念。传统的文献检索课教学思想已经不符合时代的要求。通过文献检索的方法来拓宽学生的视野,提高学生的自学能力和研究能力才是文献检索课的重要理念。文献检索课程的教学目标应该定位在培养学生的信息素养上,提升学生在信息时代自主学习的能力,使文献检索课程教学由培养检索技能提升到提高信息素养,将信息素养育与终身学习相结合。
3.3 调整文献检索课程的教学内容
一个人的信息素养主要体现在信息意识、信息能力和信息道德三个方面。传统的文献检索课程教学侧重于文献检索理论、数据库的使用、检索技能的培训等,很少涉及到信息意识、信息法律和信息道德的教育。因此,高职院校文献检索课程的教学内容要增补这些方面的内容,教导学生在获取和利用信息时要自觉遵循信息道德和信息法规,培养学生严谨正直的科学态度。
同时,由于网上信息资源的日趋丰富,图书馆也正由传统型向数字化方向的发展,因此,高职院校应确立以网络信息检索与利用为主体的教学内容,在介绍文献检索的理论和常用数据库使用方法的基础上,着重讲解计算机检索的策略和技巧,把馆藏文献利用、网络信息资源利用和计算机检索联系在一起。
3.4 完善文献检索课程的实践教学
由于文献检索课程实践性很强,高职院校应注重学生实践能力的培养,加强实践环节,要根据不同的专业相应地增加实习课时。可将课堂讲授与上机实习相结合,穿行,讲授1—2种数据库即布置一些典型课题让学生上机实习,针对课题查找相关资料,撰写检索报告等,让学生进一步熟悉和掌握检索的具体步骤、方法和技巧,从而逐步提高学生分析课题和收集利用信息资料的能力。
此外,还可以把文献检索课程与学生毕业设计或实习相结合,增加文献分析和综述的写作内容;布置和指导学生参加社会实践活动,带着问题去调查研究等,从而真正达到“学以致用”的教学目标,切实提高大学生的信息检索能力和分析解决问题的能力。
3.5 加强文献检索课程的师资建设
教师的素质直接影响学生的学习兴趣和教学效果。一名合格的文献检索课程教师,除掌握一定的文献情报知识,具备情报信息操作能力,还必须熟悉计算机操作技能,有较强的教学组织能力和语言表达能力。目前,各高职院校都特别缺乏此类复合型的文献检索课程教师。因些,必须大力加强师资队伍的建设。一方面,高职院校图书馆可以引进一些图情专业和计算机专业的人才来充实师资力量,使师资队伍结构更加合理和完善;另一方面,学校还应加大经费投入,为文献检索课程教师提供进修和学习深造的机会,促使师资队伍的整体素质不断提高。教师本人也要树立终身学习的观念,不断提高自身素养,积极参与科学研究、科技查新、课题信息服务等,并将实践经验运用到教学中,理论联系实际,这样才能有效提高教学效果,实现提升学生信息素养的教学目标。
4 结语
提高大学生信息素养是信息时代的需要。文献检索课是培养大学生信息素养的重要途径,文献检索课程的建设直接影响到大学生信息素养教育水平的高低。高职院校图书馆必须适应新时期高职教育和时展的需要,不断地改革和创新,提高文献检索课的教学实效,切实增强大学生的信息素养,提高他们的学习能力,为实现高职教育的人才培养目标作出应有的贡献。
参考文献
[1]徐万胥,刘向永。美国当代信息技术教育思潮评价[J].中国电化教育,2002,(11):72-74.
[2]邢燕丽。信息素质教育改革与大学生创新能力培养[J].图书馆工作与研究,2009,(3):93-96.
[3]刘培兰。信息检索通识课程创新教学模式研究与实施对策[J].图书馆学研究(理论版) ,2010,(7):71-74.
[4]李杉杉,周静珍。新形势下文献检索课由检索技能型向信息素养型模式转变的探讨[J]. 科技情报开发与经济2010,(28):8-11.
[5]谈政。高职院校信息检索课教学现状与改革探讨[J].职业时空,2011,(7):37-38.
桶排序法,先把被排数据所分布的区间[Dmin,Dmax](在这里Dmax,Dmin分别为被排数据的最大,最小值)划分成N个大小相等的子区间,称子为“桶”,然后将N个数据根据其大小分配入相应的“桶”内(桶[1],桶[2],…,桶[N])。借签桶排序中将数据根据其大小分配入相应“桶”的思想,我们在检索时将已排好序的数据也根据其大小将其分配入相应的“桶”内,然后再在“桶”内进行二分检索。假设按升序排列的N个数据已存放在data数组的元素data[0]~data[N-1]中,构造一个HASH函数为:
(式中Dmax=data[N-1],Dmin=data[0],N为数据个数)
二、基于HASH函数的二分检索算法HS
算法HS使用二个数组,data数组的元素data[0]~data[N-1]中存放按升序排列的N个数据,address数组的元素address[1]~address[N]中用来存贮经HASH函数转换后得到相同地址的数据个数。
算法HS
HS1[清address数组]将ddress[1]~address[N]都置0
HS2[Dmax中置最大值、Dmin中置最小值]Dmaxdata[N-1],Dmindata[0]
HS3[i置初始值]i0
HS4[求数据data[i]的HASH变换后的地址ad]ad
HS5[地址“碰撞”记数器address[ad]加1]address[ad]address[ad]+1
HS6[修改i]ii+1
HS7[比较i与N-1]若i<=N-1,则转HS4,否则转HS8。
HS8[address[0]置初值1]address[0]1
HS9[j置初始值]j1
HS10[求地址发生“碰撞”的数据在DATA数组中的首地址]address[j]=address[j]+address[j-1]
HS11[修改j]jj+1
HS12[比较j与N]若j<=N则转HS10,否则转HS13。
HS13[输入一个被检索的数据X]
HS14[对被检索数据X用HASH函数得地址ad]
HS15[确定“块”的下界low,上界high的值]lowaddress[ad-1],highaddress[ad]-1
HS16[在“块”内进行二分检索]在给定的下界与上界之间进行二分检索,若找到,则返“检索成功”信息,否则返加回“检索失败”信息。
HS17()[本算法结束]
三、平均检索长度的分析
在本检索算法中,首先将被检索数据X经HASH函数转换出一个地址,根据这个地址将被检索的数据直接定位到相应的“块”中,然后在“块”中进行二分检索。因此通过对所有“块”内二分检索法的平均检索长度的计算就可求出本算法的平均检索长度。二分检索法的平均检索长度为:
下面我们来求本算法的平均检索长度。假设在N个数据均匀分布的情况下,经过本检索算法中HASH函数转换,每一个地址出现的概率相同,都等于1/N,因此,有m个数据转换得到相同地址的概率为:
(m=1,2,…,N)
参考文献[1]的附录中已证明:(1)
所以本检索算法的平均检索长度为(2)
由上式(1)和式(2)两个公式即可求得本算法的平均检索长度,其平均检索长度小于1.352(当N>100时)。
四、算法分析与实验结果
1.本算法的创新之处在于通过HASH函数可将被检索的数据X直接位置定位到相应的“块”(通过HASH函数转换后的地址相同的数据区间)中,再在“块”中进行二分检索。从而不再需要建立索引顺索表检索算法中的索引表,也就省去了索引顺索表检索算法中查找索引表确定所在“块”的平均检索长度。
2.此方法突破了HASH表的平均检索长度是装填因子(=(表中填人的记录数)/(哈希表的长度)的函数,而不是N的函数的弱点。
3.在理想情况下,即数据完全是均匀分布的情况下,本算法的平均检索长度可达理论极限值ASL=1。即使是在最坏的情况下,当N个数据经HASH函数转换后的地址均相同,所有数据均落在同一个“块”中,其平均检索长度ASL也只会下降到二分检索法时的平均检索长度。
4.本算法对于均匀分布的数据是极为有效的,通过计算得出其平均检索长度小于1.352(N>100时),因此检索效率很高。
5.本算法中的步骤HS1~HS12仅仅是为检索作的准备工作,相当于初始化的工作,只需在检索开始时做一次即可。
6.实验结果。为了对本检索算法的检索效率进行验证,我们用VB6.0编写了本算法以及二分检索法的程序,将二种检索算法的平均检索长度进行实际测定,实验中所用的数据由VB6.0的随时函数产生,数据的范围为(0~10000),实验结果如下表所示:
VB6.0程序二种检索算法平均检索长度对比表
我们在实验中测定平均检索长度时,通过程序对所有数据逐个检索,统计出检索完所有数据需进行比较的总次数再除以数据总数后得出。上表中当N=100时,本算法实际测定的值(1.38)与理论计算(1.352)略有误差,原因是我们用VB6.0中的随机函数产生的随机数在数据量较小时分布不一定很均匀。从表1中可以看到:当数据量稍大一些(N>100),本算法的平均检索长度的实测结果完全与理论分析一对致,并且远小于二分检索法的平均检索长度。本算法的平均检索长度随着数据量N的增加几乎不变。
[摘要]构造一个新的HASH函数,结合索引顺序表和二分检索法的思想,提出了一种高效率的信息检索算法,通过理论计算和实验证明此算法的平均检索长度小于1.352(N>100)。
一、前言
计算机的日益普及和计算机技术日益成熟,使得计算机在工业控制监测中的应用渐渐深入。但工业应用不同于其它方面,它要求有较强的实时性。现在有很多的DOS软件在运行过程中通过挂接外部中断方式实现DOS应用软件与外设的实时通信,这种方法实现起来十分简单。而在Windows中应用程序能否也能够利用外部硬中断实现外设与Windows应用程序的实时通信呢?答案是肯定的。这里的关键是要解决好中断代码与Windows应用程序相互之间交换信息的问题。
从外设发送异步的硬中断,通过中断处理程序传递一条信息给Windows应用程序。这时可以初始化相关端口,准备好数据,然后进行数据传送,从而做到实时通信。
实现Windows应用程序响应外部中断的方法有很多,如Microsoft公司自己开发的SDK、DDK软件包,使用嵌入式汇编等等。本文将介绍一种在BC++3.1的基础上利用Windows3.1拥有的一些功能实现Windows实时通信的实例。
二、中断代码的位置
在Windows中,几乎所有的异步事件都是由中断处理程序来管理的。中断处理程序包含在设备驱动程序中,由Windows在环境初始化中安装。例如,KEYBOARD.DRV、MOUSE.DRV和COMM.DRV均含有中断处理程序,以处理相应的键盘、鼠标和串行口的异步中断。可以仿照标准设备驱动程序,编写中断处理代码,以响应外设的通信请求,从而完成一次实时通信。
中断代码既可以包含在应用程序的可执行代码中,也可以包含在动态连接库(DLL)中。包含在应用程序中的代码只能在一个程序中使用,而在动态连接库中的代码则可以在Windows系统中所有的应用程序所共享。这样不仅在整个Windows系统中只有一个中断代码的副本,提高了内存的使用效率,更重要的是可以防止由于同时存在多个中断代码的副本而发生冲突。本文将在DLL中编制中断处理程序。
当动态连接库被装入时,要调用DLL库的入口点LibMain(),利用这一点可以执行一些初始化工作,可以分配一些内存块,可以初始化一些全局变量或者静态变量,可以安装中断服务程序的代码等等。例如:
voidinterrupt(oldIsr)(--CPPARGS)
/*旧的中断服务程序地址*/
LibMain(HANDLEhInstance,WORDwDataSeg,WORDcbHeapSize,L
PSTR
lpszCmdLine)
{
…
oldIsr=getvect(IRQNum);
/*IRQNum指中断号*/
setvect(IRQNum,newIsr);
/*newIsr指新中断服务程序代码*/
return(1);
}
函数setvect()既可在实模式下,也可在保护模式下设置中断处理向量。
上述代码也可以放在一个由用户设置的引出(export)函数中,在应用程序中用户可以调用此引出函数来安装中断服务程序代码。
由于中断可以在任何时刻发生,中断代码必须驻留在内存中,并且在应用程序运行的过程中一直处于某一固定内存中。这一点无论是在实模式还是在保护模式下都是一致的。
在DLL的模块定义文件中应注意:
1.CODE语句为固定代码段,即FIXED;
2.EXPORTS语句要引出被应用程序和其它DLL用作入口点的函数。
三、通信机制
编写实时通信例程关键在于必须认识到,异步事件对应用程序的触发是异步发生的,不在Windows的消息处理机制和多任务范围内。为了使通信例程能够正确地工作,通信例程必须通知Windows有异步事件发生,且不能打断应用程序的任务管理或消息流。要作到这一点,通信例程必须通过调用PostMessage或PostAppMessage函数向应用程序的消息队列中加入一条消息。
需要注意的是,在DLL中调用PostMessage(HWNDhwnd,…)时,必须先确定hwnd的实际值,可以通过使用引出函数的办法来实现,如下所示:
staticHWNDhWndApp;
voidFARPASCALSetIsrWin(HWNDhwnd)
{
hWndApp=hwnd;
}
然后在应用程序的窗口函数中,对WM-CREATE消息进行处理时调用此函数来初始化DLL中的静态变量hWndApp:
CASEWM-CREATE:
…
SetIsrWin(hwnd);/*hwnd指应用程序窗口句柄*/
定义一个在应用程序中使用的消息:
#defineISRM-RUPTWM-USER+255最后在DLL中的中断服务程序代码中,调用PostMessage即可完成Windows应用程序和中断服务程序代码相互的信息交流:
voidinterruptnewIsr(--CPPARGS)
{
…
PostMessage(hWndApp,WM-RUPT,wParam,lParam);
…
}
四、程序实例
本示例先安装在DLL中的外中断服务代码,通过386/AT总线上的中断申请线(IRQ12)外触发,由中断服务代码发送一条消息WM-RUPT通知Windows应用程序外设有实时通信请求,应用程序收到这条消息后,在窗口用户区显示一条信息,表明已和外设联络上,并同时鸣叫一声喇叭。