当前位置:大学毕业论文> 本科论文>材料浏览

关于图书馆类论文范文检索 跟基于资源本体的图书馆知识检索平台功能设计方面本科论文范文

主题:图书馆论文写作 时间:2023-12-03

基于资源本体的图书馆知识检索平台功能设计,该文是关于图书馆类本科论文范文和资源本体和图书馆和检索方面专科毕业论文范文.

图书馆论文参考文献:

图书馆论文参考文献 人力资源会计论文论文检索报告文献检索网站电脑知识和技术期刊

摘 要在知识经济时代,用户知识管理需求逐渐增加,高校图书馆开始进行文献资源整合、提供知识组织与检索的探索.文章以武汉大学图书馆馆藏书目为样本,在分析图书馆资源整合需求、馆员数据素养需求和用户需求的基础上,提出基于资源本体的图书馆知识检索模型,设计知识检索平台原型,实现了面向用户的个性化推荐、用户自服务、知识联级检索及展示、专业知识关联服务等功能.文章对用户体验进行分析,指出下一步的知识检索研究方向.关键词 图书馆知识检索 资源本体知识推荐个性化服务引用本文格式楼雯,姜晓烨,陈雨晨,等.基于资源本体的图书馆知识检索平台功能设计[].图书馆论坛,2017 (11):97-105.Functional Design of Library Knowledge Retrieval Platform Based onResource OntologyLOU Wen, JIANG Xiao-ye, CHEN Yu-chen, DONG KeAbstract In the age of knowledge economy, the need for knowledge management by library users has ever beengrowing. University libraries he started to integrate information resources and explore how knowledge should beorganized and could be retrieved. Using samples from the collection of the Wuhan University Library, and byanalyzing the need of integration of library resources, data literacy need of librarians and users´ needs, thisarticle proposes a prototype of knowledge retrieval platform based on resource ontology. The retrieval platform canmake personalized recommendations based on users´ individual preference and enable users to self-servicethemselves. Knowledge can be retrieved and presented in flexible ways. Related terms of specific subject fields canbe intelligently linked up. The article also makes analysis on user experience and provides the future directions ofresearch on knowledge retrieval.Keywords library; knowledge retrieval; resource ontology; knowledge recommendation; personalized service0引言

知识组织与检索一直是信息服务的重要形式和研究命题….知识经济时代,用户需求的不只是文献和信息,还包括文献和信息中包含的知识,并希望呈现出知识之间的关联.为适应用户需求,图书馆对文献的组织与检索升级为对知识的组织与检索l21.处于发展前沿的数字图书馆发展案例,如大学数字图书馆国际合作计划、美国记忆、日本NDL Search等都采用了知识组织技术,以用户为中心、以数据为基础设计图书馆知识检索平台.

在图书馆知识检索平台建设上,美国图书馆界重视资源发现系统的发展,提倡向导式知识服务.我国图书馆界紧跟知识服务趋势,公共图书馆(如上海图书馆、国家图书馆旧])和高校图书馆(如武汉大学图书馆在学科服务、资源整合、移动媒体等方面作了很多探索.从资源整合和检索看,多数资源检索系统把纸质资源和电子资源分开单独检索,部分检索系统对纸质资源和电子资源进行了一定程度的整合,在检索结果展示方面具备查询扩展和引导功能.但是,绝大多数资源检索系统面向MARC数据和书目数据库,而没有采用语义关联技术,导致检索结果限于主题词之间的关联,无法更多地呈现知识之间的关系或满足读者检索的特定需求.因此,有必要利用语义网技术重新组织图书馆资源,构建知识检索平台.本文在分析资源整合需求和用户需求的基础上,以武汉大学图书馆馆藏“美洲各国军事”图书为研究对象,设计基于资源本体的图书馆知识检索平台的新功能.1 图书馆知识检索平台功能需求分析1.1 图书馆资源的数据整合需求

知识检索的对象是资源,整合资源要考虑资源类型和资源结构.资源类型包括图书、期刊、会议录、学位论文、标准文献、参考工具书、光盘等实体馆藏,以及电子图书、电子期刊、多媒体教学资源库等数字文献.不同类型的资源采用不同的数据结构进行描述,其中图书和期刊的数据格式较相似,标准文献、产品样本等文献的数据格式则和书刊有较大不同.如何对不同的资源、数据结构进行整合是本文需要思考的问题.

在知识检索方法上,大数据时代的资源整合较多依靠关联数据.我国学者在图书馆资源聚合、揭示和推荐研究上已深入到语义内容层次.比如,利用关联数据聚合资源,利用标签云揭示资源,利用内容融合协同推荐学术资源.在实际应用上,部分研究只是利用现有平台实现个人知识库管理或建设学科导航,部分研究设计了学术资源融合推荐方法和学术资源推荐框架,但未实施.这是因为研究集点是图书馆资源的形式整合,共享的对象是链接,而不是内容整合.比如,学科导航就没有达到内容语义聚合的强度关联.知识检索系统对文献处理的最小单位不是文献记录,而是数据,因此,不管何种文献类型都离不开数据结构不变的宗旨.文献的数据结构包括结构化数据、半结构化数据和非结构化数据三种类型,所有文献都可以将其中的数据归并入这三类数据结构之中.因此,知识检索平台设计涉及的数据收集、处理、分析、展示等过程都应按照数据的结构类型分别处理,从而达到内容层面的语义整合.1.2图书馆员的数据素养需求

资源整合内容的变化推动图书馆员工作的转型,要求图书馆员具有较强的数据素养.一方面,图书馆用户,尤其是图书馆员的数据素养在数据时代显著提升.图书馆员不再只做基础的标引编目,学科服务、科技查新、阅读推广活动设计等都是新时代图书馆员的工作内容,如果图书馆资源在新时代依然以MARC数据、数据库进行组织,以书目检索、主题检索为目标,那么图书馆员的知识水平和数据素养就无法体现出来.另一方面,图书馆资源整合更多地面向内容整合,而不是形式整合,图书馆员的工作则是对资源的融合和二次数据整合.这要求新时代的图书馆员不仅需要理解数据、知识,还要有从数据中提取出语义的能力,这对图书馆员的数据素养提出了更高的要求.1.3用户从适应图书馆到驱动图书馆的角色转变

用户与图书馆服务的协作关系有两种模式:用户适应型和用户驱动型.用户适应型服务模式主要向用户提供适应其认知结构的信息,特点是“先提供服务、再逐步改进”.比如,图书馆网站改版、书目荐购、参考咨询和学科服务都离不开用户的参与、建议和协助,图书馆采用问卷调查或随机访谈等方法来调查用户满意度,调查内容包括信息检索平台的设计、可视化方式的呈现等,为改进做准备.这种服务模式有两个弊端:一是用户被动参与:二是服务改进周期较长.

用户驱动型服务模式通过激活用户的认知结构来主动参与和改进图书馆服务.图书馆面向用户开放服务,并协调用户参与到知识服务的每一个步骤中.用户驱动型服务模式需要一个既能快速计算又能调动图书馆每个资源的知识服务平台,既要使用机器可以理解的语言记忆用户的特定需求,又要考虑到用户下一步是否需要关联到的知识,推荐出的知识还要立刻关联到更多相关知识.目前接近用户驱动型服务模式的方式,一是利用基于词频的共现程度挖掘方法进行用户推荐,将用户检索到的信息在另一个窗口或框架中展示,但实际上还是用户被动的接受知识:二是用户每进行一次输入,服务就会询问是否解决问题等,这是利用心理测评方法和人工机器人进行设计的,弊端是用户的耐心受到考验.如何更有效地在得到用户反馈的同时,还能提高体验感,是图书馆检索平台研究的重点和难点.本文认为,从用户最初使用时就参与到知识检索中,自动记录用户信息以预测用户所想,可以提高用户参与度,从而性地提高用户体验感.2知识检索模型与功能设计2.1 基于资源本体的图书馆知识检索模型设计

本文按照“用户 软件 硬件 数据”的传递路线,采用“自顶向下”的技术方式设计基于资源本体的图书馆知识检索模型,如图1所示.

在模型中,图书馆员和用户作为图书馆资源构建的控制者和参与者,承担绝大部分的实际操作,尤其突出用户参与度.在实际运行中,图书馆员和用户利用表示层与图书馆知识检索系统联系起来,图书馆员负责对系统进行控制、对数据进行管理、对信息进行加工等,用户利用表示层对数据进行管理并检索知识等.表示层与逻辑层的联系主要是通过资源层和语义输出模块进行,资源层需要保存数据采集器、图书馆员和用户提供的数据和信息,为逻辑层提供基本数据的存储功能,同时为知识检索的快捷和方便建立索引,并提供检索所用的原始数据和知识的存储功能.因此,资源层是基础,逻辑层是方法,表示层是互动.

模型包括三个层次,即表示层、逻辑层和资源层,分别代表软件、硬件和数据.在表示层中,信息采集模块负责数据收集,包括基本信息采集、资源采集和兴趣采集三个模块.数据管理模块负责前端数据存储和逻辑层面的数据管理,包括用户管理、资源层管理和数据管理的管理.知识检索模块提供给用户查看检索结果的呈现方式,由检索输入和检索输出两部分组成.在资源层中,基础库的功能是存储基础数据,为其他部分作基础保障,包括人员数据库、资源数据库、数据库管理库三部分.知识库主要用于存储逻辑层中最终形成的概念关系网络,分为三元组库和网络库.

资源本体是专门为馆藏资源设计的本体,针对馆藏资源的外部特征,强调概念与概念之间的明确关系,并利用信息计量法等定量方法确定具体关系值,提高了本体在信息检索时的精准关联性.邱均平和楼雯的《基于CSSCI的情报学资源本体构建研究》详细描述了资源本体的构建过程,它是本文逻辑层运行的一部分.逻辑层是图书馆知识检索模型的核心层,其中语义描述模块的功能是提供图书馆知识检索系统的描述规则,是图书馆资源构建的最底层规则,为知识的规范化提供依据.语义描述模块的语义规则定义是对属性规则和值规则的定义.语义提取模块分为语义概念提取模块和语义关系提取模块,语义提取过程分解为基于异构数据结构的资源语义化过程,再进行多任务的语义查询过程.语义存储模块的作用是储存逻辑层在处理语义信息时耗用的临时文件,其中的数据、信息、知识都是临时性存储,而永久存储在语义存储模块中的词库包括停用词库、基础词性库、组词规则库和特定词库.由于主要负责存储功能,语义存储模块是逻辑层中与资源层交互最多的模块,但又需要从语义提取模块中得到结果,将语义描述模块中的规则进行规范化处理的存储,提供给语义查询模块和输出模块进行进一步操作,因此语义存储模块占据逻辑层的重要地位.语义输出模块承担着查询结果的可视化展示的功能.语义查询模块将查询结果集传递给语义输出模块,语义输出模块通过可视化方法将查询结果传递给表示层的知识检索模块.2.2平台设计与实验数据处理

知识检索平台采用B/S模式,在Windows7环境下运行,使用MySQL进行系统数据的存储和管理.在可视化展示上,利用D3.js这一强调人机交互式的脚本工具进行知识可视化格式编辑.在逻辑层中,系统利用开源分词代码进行分词,利用信息论的方法(如互信息、上下文信息)、语法分析规则进行概念提取,利用Apriori算法、聚类分析、计量分析方法(如共词分析、耦合分析、共引分析)进行语义关系分析,利用OWL语言和Protege中OWL-Plugin插件实现语义标注,利用SPASQL查询语言对检索内容进行匹配和提取,利用Lucene建立索引.

在实验过程中,随机选取武汉大学图书馆中中国图书馆分类号为E7(美洲各国军事)的223条书目记录作为实践对象,下载题录数据,在逻辑层中的运行过程见图2.首先,识别题录数据的内部特征和外部特征.系统号、著者、出版发行项、分类号、题名为外部特征,主题、内容简介(网络摘 要)为内部特征.对应上文所述数据结构,外部特征为结构化数据,可以经过简单的汇总、消歧、过滤操作等直接存储为核心词.内部特征为非结构化数据,主题词可以作为半结构化数据,经过分隔符分词可以作为核心词,内容简介则需要经过分词.分词后的所有结果,再利用楼雯在《馆藏资源语义化关键技术及实证研究》中所述的概念提取技术提取出核心词.外部特征得到的核心词可以利用信息计量学的共现分析法等计算得到两两核心词之间的具体关系(即相似度),内部特征得到的核心词则需要利用词在文本中的相互关系和共现次数等方法计算得到两两核心词之间的具体关系.考虑到这种具体关系不能在语义描述语言中得到完整表达,按照《基于CSSCI的情报学资源本体构建研究》的方法将具体关系按阈值分类,如图2所示,形成三元组,作为最后的形式化表达和检索结果的展示备用.3图书馆知识检索平台功能展示3.1 面向个体用户的个性化推荐

图书馆知识检索平台提供的知识可以为特定用户进行针对性设计,意味着图书馆为用户提供的个性化推荐不需要用户告诉图书馆其特定需求,图书馆可以根据用户的信息行为分析用户可能喜爱的、感兴趣的知识点,分析的结果不仅会呈现在用户个人图书馆或界面中,还会应用于对检索内容的推荐和检索结果的展示.

用户的关注历史统计用户的兴趣爱好,以及借阅、浏览、检索、下载等信息,进行分析后,形成标签视图(见图3)进行展示.本例用户的借阅信息包括美国旅游和专业书籍(如信息经济学),但浏览信息集中在美国军事整体情况上,检索信息集中在军备技术上,下载信息集中在西点军校的内容上,该用户的兴趣爱好也显示出对历史、科普等的关注.而在关注历史中,统一分析这些内容,得到包括旅游、专业书籍和军事的全部重点信息.

3.2用户自服务

图书馆知识检索平台旨在让用户做知识的主人,主要体现在:(1)用户不仅可以管理,还可以管理自己的浏览、下载和检索历史.(2)用户成为资源构建的主导者,可以采集、加工、编辑资源.在资源采集方面,利用通用的资源荐购功能.资源编辑包括:一是资源荐购中的资源编辑,用户可以再次编辑尚未审核的资源:二是在检索结果页面中添加资源编辑功能,可以编辑检索到的资源,这是“图书馆资源2.0”概念(如图4所示).对爱好管理信息的用户来说,这是一项特色服务.(3)系统在用户首次登录时,弹出窗口搜集用户的兴趣爱好,以便后期为用户提供相关服务,用户可点击自己感兴趣的热点或词汇,并且可以在关注历史页面(如图3右侧所示)对兴趣爱好进行修改.3.3知识关联检索及展示

查准、查全是检索系统追求的目标.相较于传统检索,知识检索在查准率、查全率上更具优势,检索结果既包括用户最想知道的信息,即查准率,也提供密切相关的其他信息(既包括文字、语词层面的信息,也包括内容、语义层面的知识),从而保证查全率.为提高检索系统的查全率和查准率,应充分利用知识组织成果,采用语义网技术改进检索过程的交互和检索结果的展示,实现知识关联检索.

本文设计的知识检索平台提供多级关联展示服务,其中初级关联展示与检索词最为字面匹配的检索结果,中级关联展示与初级关联展示结果语义相关的检索结果,高级关联展示与中级关联展示结果语义相关的检索结果,这种包含且递进的展示方式体现了知识的语义关联性.本例中,用户使用分类号检索词“E7”进行检索,在检索结果展示中,系统保留本身具有的5种视图模式,即封面视图、简洁视图、详细格式、题名作者、题名.新功能设计仅以扩展两种视图举例,在封面视图中,增加语义查询扩展的联想功能,如鼠标划过某一字段,可弹出有关该字段的语义相关内容,而不仅仅是字面匹配内容,如图5、6、7所示.在图5中,用户鼠标划过题名“巴顿将军战争回忆录”,知识检索结果中包括同为美国军政界的人物的相关书籍,如威廉·米切尔、诺曼·施瓦茨科普夫、西奥多·罗斯福,鼠标划过弹出窗口的图片,可看到相关作者及其题名.

在图6中,用户鼠标划过著者项“伍德沃德”,知识检索结果不仅包括伍德沃德撰写的其他书籍(如《800天三次出兵》),还包括该书内容(即奥巴马领导的内阁)联想出的相关内容,如白宫、FBI,鼠标划过弹出窗口的图片,可看到相关作者及其题名.

在图7中,用户鼠标划过著者项“岩波喜店”,知识检索结果不仅包括岩波喜店出版的其他书籍(如《核④丁夕lJ力》),还包括该书内容(即)所联想出的相关书籍(如《在日米罩》),以及与《在日米罩》内容相关的美军在东亚的军队管理情况(如《东亚安全与驻韩美军》),鼠标划过弹出窗口的图片,可以看到相关作者及其题名.

3.4专业知识服务

任何类型的图书馆都有自己的特色馆藏,用于提供特色服务.图书馆知识检索平台的构建,首先建立类目体系或重构类目结构,这些类目多以单一主题特色为基础而建立,建立过程中产生的主题内容聚类、互联就是针对单一主题形成的专业知识,恰当利用这些知识,不仅不会浪费建立成本,还会间接提高专业知识服务质量.如图8所示,检索词E7相关内容,以网络图的形式展现,点击各个节点,可进行扩展和链接查询.4效果与展望

因知识产权、联网等条件所限,在用户测试和调查时,只能使用单机运行的原型系统,所以调查人数有限.检索系统在用户退出时会弹出服务结果反馈窗口,由此可得到用户的体验反馈数据.2016年1~10月,笔者先后在武汉大学图书馆、华东师范大学图书馆、上海交通大学图书馆随机邀请60位用户(包括40位学生、12位图书馆员和8位教师)参加调查,为他们创建账户,观察他们在使用检索系统时的反应,得到表1所示的反馈结果.

从表1看出,用户对检索平台的可视化展示效果较为满意.超过三分之二的用户认为图表设计(图表好看、种类丰富)和检索体验(互动功能、轻松愉快的过程)优秀:超过60%的用户认为查准率(找到我想要的)和推荐能力(发现新的知识、联想丰富)较优秀,说明检索结果展示为用户带来了全新体验.在查询速度方面,存在两种不同评价,8位用户填了“等待时间过长”之类的评语,说明系统在语义信息组织的每个步骤上需要优化:12位用户认为查询速度较快,12位用户均为图书馆员,猜测他们相较于其他用户,更了解实现语义关系检索所需要花费的时间成本.

构建图书馆知识检索平台要落实到具体的构建对象、技术和方法,本系统选择本体技术作为图书馆知识检索系统的构建技术,重点考虑本体中概念和概念之间的关系在图书馆知识检索模型各个模块中的融合方法:在数据管理层面,重点考虑概念和概念之间的关系在数据库中的存储结构,利用本体语言对语义分析结果进行语义标注,构建了以提取概念和提取关系为目的的不同结构数据的语义分析方法.以资源本体为构建技术的图书馆知识检索系统的实现,不仅实验了图书馆知识检索模型的可用性和适用性,而且本体作为信息语义化的主要手段,为其他类型资源、图书馆、语义化手段提供了示范性的参考.利用资源本体技术作为系统构建底层技术,将用户角色带入图书馆知识检索的各个功能,使用户可以最大限度地发挥主观能动性.利用可视化技术和方法突破了传统检索结果展示以列表为主的局限,标签云、网络图等新型图谱以及高互动性的操作功能不仅给图书馆用户带来了新的视觉体验,也有助于用户发散思维,引导用户精确查找、全面查找.本文主要从语义网技术的角度进行知识检索平台的功能设计,事实上更多的技术方法和手段,如概念图、认知地图,同样能够在实现语义知识关联、体现用户认知、满足用户知识需求方面有所应用,这是本研究进一步开展的方向.

参考文献

[1]周宁21世界信息组织与检索的可视化、智能化发展方向[J].现代图书情报技术,2002(4):4-5.

[2]邱均平,楼雯.基于共现分析的语义信息检索研究Ⅱ]中国图书馆学报,2012 (6):89-99.

[3] CADAL项目管理中心.数字图书馆知识组织服务标准EB/OL].[2()16-11-13]. http://www.cadal.cn/d/zs_zz.pdf

[4]宋琳琳,李海涛.大型文献数字化项目元数据互操作

调查与启示[].中国图书馆学报,2012 (5):27-38.

[5]陈瑜,尹铭莉.日本国立国会图书馆新检索服务“NDL Search”介绍及分析[]图书馆杂志,2013(5):27-38.

[6]朱前东美国高校图书馆资源发现系统评价实践与分析——以美国2所高校图书馆为例[].国家图书馆学刊,2015 (1):94-99.

[7]JaguszewskiJ M, Williams K New roles for new times:Tranorming liaison roles in research libraries [EB/OL].2016-11-16l. http://www. arl org/ storage/ documents/publications/nrnt-liaison- roles-revised.pdf 2013.

[8]夏翠娟,刘炜,陈涛,等.家谱关联数据服务平台的

开发实践[].中国图书馆学报,2016 (3):27-38

[9]曹宁,张炜.国家图书馆数字资源整合的探索与实践[]国家图书馆学刊,2015 (2):30-35.

[10]罗怀凤,郑循刚.论我国高校图书馆跨库检索系统建设的不足和完善[].图书馆,2f)15 (5):108-110

[11]王新才,王海宁高校图书馆期刊文献保障实证研究——以武汉大学为例[].中国图书馆学报,2015(5):4-15

[12]兰小媛高校图书馆智慧型学科服务平台功能需求研究[].图书馆建设,2014 (2):70-73.

[13]刘剑楠.数字图书馆资源集成检索平台的分析研究——以美国高校图书馆为例[]图书馆学研究,2014 (13):62-66,12.

[14]魏群义,侯桂楠,霍然.移动图书馆理论研究与实践应用综述[].图书情报知识,2012 (1):80-85

[15]任瑞娟,濮德敏,王剑宏,等基于Drupal实现多类型学术资源的语义化组织与关联化聚合[].情报科学,2015 (5):63-67.

[16]沈奎林,邵波,卢明标签云在学术资源揭示中的研究与应用——以中国知网数据库中图书情报类核心期刊论文关键词为例[].图书馆论坛,2013 (3):36-42

[17]罗铁坚,程福兴,周佳.融合奇异值分解和动态转移链的学术资源推荐模型[].中国科学院大学学报,2014 (2):257-266.

[18]陈家翠,王美琴利用Sakai平台建立个人学术资源管理系统]].图书情报工作,2010 (8):120-122.135.

[19] Timothy Rasinski. Creating Fluent Readers[J]. Educational Leadership, 2004 (3): 46-51.

[20] Enrique Frias Marinez, Sherry Y Chen, Xiaohui Liu.Evaluation of a personalized digital library based on cognitivestyles: Adaptivityvs adaptabilitym.lnternational Journal of Information Management, 2009(29) :48-56

[21]邱均平,楼雯,余凡,等.基于资源本体的馆藏资源语义化研究]]图书馆论坛,2013 (6):1-7

[22][24]邱均平,楼雯.基于CSSCI的情报学资源本体构建研究]].情报资料工作,2013 (3):57-63.

[23]楼雯.馆藏资源语义化关键技术及实证研究[]中国图书馆学报,2013(6):27-40.

作者简介楼雯,博士,华东师范大学经济与管理学部信息管理系讲师;姜晓烨,陈雨晨,华东师范大学2016级图书情报专业硕士;董克,博士,武汉大学信息管理学院讲师.

收稿日期2017-03-09

此文点评,此文为关于资源本体和图书馆和检索方面的图书馆论文题目、论文提纲、图书馆论文开题报告、文献综述、参考文献的相关大学硕士和本科毕业论文.

喜马拉雅听书和高校图书馆数字资源建设
摘 要喜马拉雅听书作为国内发展最快、规模最大的在线移动音频分享平台,其优质的资源内容和良好的平台设计,吸引和培育了用户的忠诚度和黏性 其与图书馆数字资源在资源内容和阅读载体方面相互补充,弥补了高校图书.

信息碎片化时代体育媒体知识付费平台的构建
【摘要】在信息碎片化的背景下,信息传播逐渐变得泡沫化,信息过载成为当下无法回避的现实问题,此时,知识付费应运而生,其目的是尝试将有价值的内容从过载的信息中甄别出来,满足受众更高的需求 由此,将体育媒体.

知识付费平台一览
2016年,知识付费的用户迅速增长,知识付费产品面临井喷 2016年,有知识付费意愿的用户暴涨了 3 倍,知识付费用户达到近 5000 万人 在今年互联网女皇的互联网报告中谈到中国时,重点谈到包括游戏.

知识生态系统带来图书馆知识的新机遇
董诗博(黄河科技学院 河南 郑州 450000)摘 要众所周知,知识管理的更高层次阶段便是所谓的知识生态系统,即从生态系统、生态学理论和知识特性分析,在特定时空范围内,由知识资源、服务与创新活动以及他.

论文大全