当前位置:大学毕业论文> 硕士论文>材料浏览

自动生成方面毕业论文模板范文 与阅读推广推荐书目的自动生成方面毕业论文模板范文

主题:自动生成论文写作 时间:2024-01-21

阅读推广推荐书目的自动生成,该文是自动生成毕业论文怎么写与书目和自动生成研究和推广方面毕业论文题目范文.

自动生成论文参考文献:

自动生成论文参考文献 论文目录怎样自动生成论文目录如何自动生成参考文献自动生成论文的目录怎么自动生成

明均仁,周 知,陈 雪

摘 要 书目推荐作为阅读推广的重要手段,在培养用户阅读习惯、增强用户阅读兴趣方面有着重要的作用.文章针对书目推荐中存在的脱离用户需求、用户接受度低的问题,提出基于群体智慧的自动化书目推荐方法.通过将实验结果与武汉大学图书馆书目推荐结果进行比对与分析,发现基于群体智慧的书目推荐能更好地满足推广需求,更全面地覆盖用户兴趣,也适于大规模推广.

关键词 阅读推广 书目推荐 高校图书馆

引用本文格式 明均仁,周知,陈雪. 阅读推广推荐书目的自动生成研究[J].图书馆论坛,2017(10):94-99,113.

0 引言

书目推荐一直是阅读推广的重要手段,被图书馆等阅读推广机构广泛采用[1-3].蒋逸颖等调查显示,湖南开展阅读推广的26所高校中,有14所利用书目推荐形式[4].章忠平调研发现,开通新浪微博的省级公共图书馆全部采用书目推荐形式进行阅读推广[5].目前推荐书目的来源主要包括:(1)由专家或专家团体推荐书目,这里的专家或专家团体既可以是政府文化教育部门或全国性学术团体,也可以是领域内的著名学者,还可以是图书馆员或领域内有一定专长的人士[6-7].该方式是当前推荐书目编制的主要形式.(2)基于图书畅销度的自动化书目推荐,具体形式包括参照图书畅销榜、馆藏借阅榜等进行书目推荐[8].尽管这两种方式产生了大量推荐书目,对阅读推广起到了促进作用,但从书目编制的效率和效果看,各有不足:(1)基于专家或专家团体的推荐书目编制方式,由于依赖于专家自身的阅读体验与认知,可能导致书目的覆盖范围有限、图书不受推广对象欢迎,编制效率较低;(2)基于图书畅销度的书目推荐编制方式,一方面无法保证图书质量,另一方面推荐的书目数量有限,难以覆盖广大阅读推广对象的阅读兴趣.

针对上述问题,本研究提出基于群体智慧的推荐书目编制方法:首先,基于海量用户的阅读数据产出候选推荐书目及简明提要资料;然后,由人工进一步筛选、审核,并完成简明提要内容的组织以及推荐书目的排序.这种方式在提升编制效率的前提下,能够保障推荐图书的内容优质、读者接受度高,进而改善阅读推广效果.

1 面向阅读推广的书目推荐要求

面向不同的阅读目的,推荐书目编制需要遵循不同的原则.比如,编制面向个体的推荐书目,需要以个性化的阅读兴趣为基础;而为帮助实现某一专业学科知识的系统学习而进行的推荐书目编制,需要以学科的研究范围为边界进行选取,并讲究书目的阅读顺序.面向阅读推广这一目标进行的推荐书目编制,需遵循四大要求.

(1)以群体兴趣为基础.阅读推广活动中的书目推荐要面向大众群体,本质是非个性化推荐.目前的推荐工作通常以单个用户的数据或用户间关系为基础进行个性化推荐,满足个体用户需求.但从阅读推广的目的来看,书目推荐需具有普适性,以被大部分用户接受.以群体兴趣为基础编制推荐目录更能反映整体用户的偏好,因此,阅读推广中的书目推荐应以群体兴趣为基础.

(2)图书内容质量高.阅读推广有明确的价值定位,即提升公民的自我学习能力,进而提升整个社会的公民素养.从价值导向中可以看出,阅读推广的意义是通过倡导阅读的方式提升公民素质.因此,面向阅读推广的书目推荐,需要推荐的书目要有质量保证,在思想深度和价值引导方面有助于读者的素质提升.

(3)图书的接受度高.阅读推广的另一个重要目标是改变潜在读者的非阅读行为,即让不阅读的民众接受阅读[9].因此,阅读推广效果的一个重要评价指标是用户阅读量变化[10-11].由此可见,只有推荐接受度较高的图书,读者才更倾向于采纳与阅读,最终达到改变阅读行为的目的.

(4)推荐角度多样化.作为现代图书馆的重要职能之一,阅读推广活动开展频率较高,线上线下的书目推荐频率也较高,每次活动中推荐的主题均有较大差异,书目变化较为频繁.因此,需要在自动化推荐方案中,根据主题或目标群体的不同,提供各种角度的推荐书目;针对不同的情感、主题诉求,多角度地开展书目推荐.

2 基于用户生成内容的书目推荐模型

按照前文提出的推荐书目编制要求,在自动化书目推荐实现中,需要有针对性地设计用以衡量群体兴趣、图书质量、用户接受度的指标,并在推荐中将这些指标融合为一个综合指标,从而判断是否应该将图书纳入推荐书目.此外,为满足推荐角度多样化的要求,需要对图书进行全面标引,以便于推荐书目编制者高效选择图书.基于此,本文构建基于用户生成内容的书目推荐模型,见图1.用户生成内容(UGC)采用广义概念,既包括用户创作、发布、分享等显性内容,也包括基于用户行为数据挖掘得到的隐性内容[12].

2.1 数据源

该模块的功能是构建用于生成推荐列表的基本数据库.从推荐书目的指标看,推荐需要兼顾书籍的评分、质量与接受度,多个数据源的信息融合会弥补单一信息源的片面性.例如,同样是书目评分,京东、亚马逊的图书信息评论会涵盖大量的装帧、版本等信息,而豆瓣图书多是关于主题内容的评分,新浪微博书目推荐则会集中反映其当下热度及相关运营状况.更重要的是,单一数据源通常存在数据稀疏的问题,对图书的收录不够全面,或者由于评价人数过少,造成评分数据随机性较大,难以反映书目的真实情况;而多源数据可以对缺失的或不完整的信息进行增补,提升书目推荐的全面性.

2.2 数据预处理

该模块包括5个环节:基本信息抽取、标签相关性判断、基于UGC的主题抽取、评分数据抽取和热度数据抽取.图书基本信息包括ISBN号、作者、出版社、标签、评分和评价人数.由于跨多个数据源进行图书推荐候选集构建,需要对数据资源进行去重处理,因此抽取ISBN号作为数据源的唯一标识码,而作者、出版社信息则可作为特定主题推荐的参考选项.用户标签反映群体对资源的认知,数据预处理时应当对高频标签和阅读推广活动的主题进行相关性判断,据此推荐主题相符的图书.相关性判定可以选择包括词向量、活跃度指数在内的多种方法.除了利用标签数据作为主题标注选项,还可以利用其他数据源中的UGC数据进行图书主题抽取,补充用户标签的不足.同时,对评分数据和热度数据进行处理,抽取各数据源中的图书评分数据,并统计各数据源的评论数量.

2.3 资源整合

该模块的作用包括两方面:一是将同一本图书的不同来源数据整合到一起;二是在此基础上将不同来源的数据进行融合.

(1)多源数据整合.书目资源的重要信息分布在不同数据源,同一书目资源在不同数据源中由于字段名称、描述信息等标准不一,其数据差别往往较大.只有对多源数据进行有效整合,才能获得关于资源的统一描述.在多源数据整合过程中,面临的主要问题包括描述语法不统一、元数据格式不统一等,如电商网站中对书目的评论字段名为“商品评价”,而豆瓣读书的评论字段为“短评”或“书评”等.因此,需对多源采集的元数据字段进行名称合并,利用ISBN号作为统一标识码,整合一本书在各个数据源的信息,并标注来源,为下一步数据融合做准备.

(2)多源数据融合.数据融合的目的是将从多个数据源获取的不同形式、相同内容的数据相互补充,起到优势互补的作用,进而全面反映书目各个指标的信息.多源数据融合模块主要完成的工作是为异构数据加权[13],即对不同数据源的UGC数据进行融合,准确表示书目信息.本模块的融合工作主要包括三方面:评分融合、热度融合与主题融合.在评分方面,电商平台中用户对书目的评价如果不深入书目内容,而是侧重版本、装帧或物流等信息,则考虑对该条评分进行剔除或降权处理;同时,对打分的标准进行统一,统一使用十分制或者五分制.在热度方面,电商平台中使用销售数或评价数作为热度依据,而书评平台如豆瓣读书等则使用评论数作为热度依据;应以多个数据源的评论数据的平均值,作为书目的热度.在主题方面,如果数据源中包含标签数据,则以高频标签数据作为图书的主题标引项;如果没有,则从用户短评中利用主题模型进行主题识别,对多个表示主题的关键词进行合并去重,以最后的词向量代表书目主题.

2.4 候选推荐书目生成

根据面向阅读推广的书目推荐要求,主要考虑图书的主题相关性、用户接受度、内容质量三个方面,设置相关性权值、热度权值和质量权值.三个权值的乘积即为候选书目的总权值,具体的数值在多源数据融合环节中得到.依次计算候选集中所有书目的总权值,降序排列生成候选推荐书目列表.图书的总权值计算公式如下:

wi等于wrel-i×wpop-i×wrat-i(1)

其中,wi是图书i的总权值,wrel-i是相关性权值,wpop-i是热度权值,wrat-i是质量权值.相关性权值的含义为,图书的主题和阅读推广活动主题的相关性的相似程度.根据多源数据融合的结果,图书主题可以表示成一个主题词构成的向量,而阅读推广活动的主题同样可以用一组关键词进行表示.利用余弦相似度方法计算两个词向量的相似度,其结果就是这一书目在本次阅读推广活动中的相关性权值.

在热度权值方面,利用多源数据融合后的评论人数数据,以月度为单位进行时间分割.如果以历史沉淀总量数据作为热度权值,会表现出新近出版的图书热度过低而出版时间较久的图书热度虚高的失真情况.因此,适宜以书目每月阅读人数作为热度权值,参与总权值的计算.

在质量权值方面,以多源数据融合后的评分数据,代表该图书的质量.首先根据阅读推广活动价值导向的基本要求,把评分低于特定阈值的书目剔除出推荐候选集,以免造成质量一般但短期过热的图书进入推荐列表;然后对过滤后的图书以其评分代表其在该项上的权值.

2.5 人工筛选与编辑

书目推荐是图书馆的重要工作.学科馆员在长期活动中积累了丰富的经验,人工筛选工作可利用专家经验对推荐列表进行优化与调整,更好地满足阅读推广活动的具体要求,平衡推荐列表中各种题材、类型的图书,让最后的结果更加符合阅读推广的目的.此外,图书馆在进行书目推荐时,往往以自身馆藏为依托.对于此种情况,可以在候选推荐书目的基础上,以馆藏与否作为过滤条件,将未*的图书过滤掉.

3 基于豆瓣读书的书目推荐原型系统构建

为验证前述模型的可行性和效果,以社会化标注网站“豆瓣读书”为数据源进行面向阅读推广的书目推荐原型系统实现.通过与武汉大学图书馆编制的以“日本文化”为主题的推荐书目进行对比,评价原型系统的效果.

3.1 豆瓣读书数据采集与预处理

本研究侧重方案效果验证而非具体技术细节,因此只选取“豆瓣读书”进行实验,而没有进行多源数据采集.“豆瓣读书”是我国最大的社会化图书标注网站,沉淀了大量用户阅读记录,适合于推荐实验.

本研究2016年8月17日至9月20日,共采集479,872名用户对354,458本图书的阅读记录,形成原始数据集.本实验需要图书的每月热度数据,该数据在豆瓣读书上的书目详情页无法直接采集,因此,需采集海量用户的阅读记录,据此建立图书到用户的映射.

首先采集豆瓣读书热门用户“柏邦妮”“安东尼”“艾小柯”等的被关注列表,共得到479,872名用户的URL;进入每一个用户的阅读详情页,获取每名用户的读书记录,并获取用户阅读每本书的时间字段,在数据预处理阶段计算每本书的每月阅读量.在图书详情页中采集ISBN、作者、评分、高频标签4项重要信息.ISBN作为书目的唯一标识码,评分、高频标签作为推荐质量指标依据和相关性判定的依据,作者则作为图书馆员在阅读推广活动中的参考项目.基本数据采集结果如表1所示.

在获取基本数据的基础上,进行数据的预处理,包括标签规范化与每月图书热度计算.标签的质量影响主题标引效果,需要消除高频标签之间语义混乱与重复等问题,处理工作包括将繁简体表述、英文首字母大小写统一,对语义重复的标签进行拆解合并.在热度计算方面,对每本书进行每月热度计算.海量用户详情页中的每本书的阅读以月份为分段时间进行加总,作为热度指标计算依据.

3.2 推荐书目生成

根据权值计算公式,计算每一本图书的推荐总权值.以武汉大学图书馆“品书知日本”阅读推广活动为实验对象[14],推荐有助于了解日本文化、社会、历史的图书.首先,相关性权值wrel-i方面,以该活动的主题为判断依据,筛选书目高频标签中包含“日本”的图书.如果没有,则认为该图书与本次阅读推广主题无关.以“文学”“艺术”“社会”“历史”“生活”5个主题作为本次推广活动的相关重要主题,构建5维的词向量,即了解日本这一主题需要从文学、艺术、社会、历史、生活方面进行认知.以这5个词构建图书的主题向量,为简化计算采取0与1的表示方式,即该图书如果包含指定的高频标签则在向量中的这一项为1,否则为0;将图书与阅读推广活动的主题进行相似度计算,得出每本图书的相关性权值.热度权值wpop-i方面,使用数据预处理中的每月书目热度数据.根据数据调查发现书目热度的半衰期较长,当月热门的图书和下一月的热门图书重合度较高,由于该活动举办于2016年6月27日,则以6月书目热度数据代表权值.质量权值wrat-i方面,由于面向阅读推广活动中书目推挤工作对质量的要求,首先过滤掉评分在8.0分以下的图书,避免质量一般而热度过热的图书入选,然后对剩余的图书以其评分作为质量权值参与总权值的计算,生成以“日本”为主题的书目推荐列表,列表结果见表2.

3.3 效果评价

对比本文基于群体智慧的推荐榜单与武汉大学图书馆推荐榜单,以评价本文推荐方法.武汉大学图书馆的榜单中列出18本图书,因此,本文在推荐列表中截取总权值最高的18本进行对比.二者对比情况见表3.

两个列表有重合图书4本,包括《白夜行》《嫌疑人X的献身》《人间失格》《菊与刀》.其中,前两本是当红社会派推理作家东野圭吾的代表作品,质量好,口碑好,接受度高;《人间失格》为著名作家太宰治的代表作,质量、热度较高;《菊与刀》深入探讨日本战后社会现状、民族性格,是了解日本的重要书目,两个榜单均有提出.

推荐存在差异的书目共28本.从质量角度看,差异的图书在各个数据源均有较高的评分,内容上得到用户和专家认可,这一现象说明阅读推广价值导向的本质.然而从用户接受角度看,本研究基于群体智慧的推荐榜单取得更好的效果.比如,对日本著名文学家村上春树,图书馆推荐的图书《奇鸟行状录》相比于本研究推荐的《当我谈跑步时我谈些什么》《挪威的森林》等作品,在阅读量和口碑上均无突出优势,其豆瓣读书的评价人数仅为《挪威的森林》的十分之一左右;《源氏物语》文学艺术性强,但是文字艰深晦涩,难以让普通读者产生阅读兴趣,篇幅过长的作品还有《银河英雄传说》,超过1000万字,均不适宜作为阅读推广的推荐对象.

从推荐的多样性角度看,本研究推荐书目更加全面.图书馆基于专家的推荐过于集中在文学作品方面,小说占推荐总数90%以上,类型较为单一,难以从不同角度吸引读者.而本研究推荐的书目涵盖更多主题,包括体现日本风格的生活类、艺术类图书.比如,近藤麻理惠的《怦然心动的人生整理魔法》一定程度体现了日本文化的价值观,平面设计大师原研哉的《设计中的设计》体现了日本风格的哲学与美学特征.多主题的推荐榜单内容更加丰富,作者群体涉及领域更多样,更能吸引不同类型的用户群.同时,本研究推荐榜单中的图书在各大电子商务网站均十分畅销,说明读者接受度高,可以更好地满足阅读推广活动的要求.

4 结语

书目推荐是阅读推广非常重要和有效的手段,为提升其编制效率和效果,本研究提出群体智慧的半自动化编制策略,并以豆瓣读书数据源为基础进行原型系统实现.对比分析本文原型系统生成的推荐书目与武汉大学图书馆推荐的书目可知,原型系统不但能大幅提升编制效率,而且还能保证推荐书目的内容质量较高,从而验证了策略的可行性和有效性.然而本研究也具有一定的局限性:(1)基于用户生成内容的图书主题标引上过于简单,主题与图书的相关度仅分为相关和不相关两类,未作更细致的区分,导致推荐书目生成中对相关性的衡量过于简单,进而可能影响推荐书目的质量.(2)在原型系统构建中,并未以多源数据为基础,导致实证研究不够全面,且在效果衡量上仅采用了定性分析的方式,缺乏定量分析.针对这些问题,拟在今后的研究中继续完善:(1)完善图书主题标引策略,对其进行相关程度细分.(2)完善原型系统,将京东图书、卓越亚马逊等电子商务网站的数据纳入系统的基础数据,并以多所高校图书馆及公共图书馆为依托,基于阅读推广的实际效果进行更系统的实证研究.

参考文献

[1] Sala R T,Valios V C. Book-Trailers as Tools to Promote Reading in the Framework of the Web 2.0[J]. New Review of Children’s Literature and Librarianship, 2016,22(1): 53-69.

[2] Hossain Z. Towards a lifelong learning society through reading promotion:Opportunities and challenges for libraries and community learning centres in Viet Nam[J]. International Review of Education,2016,62(2): 205-219.

[3] Kennedy R,Bearne E. Summer reading challenge 2009 impact research report[R]. Leicester:UKLA(United Kingdom Literacy Association),2009.

[4] 蒋逸颖,杨思洛. 湖南省高校图书馆阅读推广活动调查分析[J]. 高校图书馆工作,2016,36(3):92-96.

[5] 章忠平. 省级公共图书馆新浪微博书目推荐服务调查分析[J]. 图书馆论坛, 2014(4):92-96.

[6] 王茉瑶, 徐建华,卢正明. 全民阅读活动推荐书目研究[J]. 图书馆工作与研究, 2012(12):106-110.

[7] 白君礼,张麦仓. 读者书目推荐摭谈[J]. 图书馆杂志, 2009(10):24-26.

[8] 陆书红. 基于书目推荐视角下的公共图书馆与社会阅读[J]. 图书馆工作与研究, 2012(5):90-92.

[9] 谢蓉,刘炜,赵珊珊. 试论图书馆阅读推广理论的构建[J]. 中国图书馆学报,2015(5):87-98.

[10] 王素芳,孙云倩,王波. 图书馆儿童阅读推广活动评估指标体系构建研究[J]. 中国图书馆学报,2013(6):41-52.

[11] Matthews J. Evaluating summer reading programs: Suggested improvements[J]. Public library, 2010, 49(4): 34-40.

[12] 赵宇翔,范哲,朱庆华. 用户生成内容(UGC)概念解析及研究进展[J]. 中国图书馆学报,2012(5):68-81.

[13] 化柏林. 多源信息融合方法研究[J]. 情报理论与实践,2013(11):16-19.

[14] 品书知日本.[EB/OL]. [2016-12-01]. http://mp.weixin..com/s?__biz等于MzAwOTIyNTQ4MQ等于等于 &mid等于2654465146&idx等于1&sn等于d92db41f02189564cc 5ce461e800e97e&scene等于0#wechat_redirect.

作者简介 明均仁,武汉工程大学管理学院副教授,中国科学技术信息研究所博士后;周知,武汉大学信息管理学院博士生;陈雪,许昌学院图书馆副研究馆员.

收稿日期 2017-01-10

(责任编辑:吴卫娟)

回顾述说,此文是一篇适合不知如何写书目和自动生成研究和推广方面的自动生成专业大学硕士和本科毕业论文以及关于自动生成论文开题报告范文和相关职称论文写作参考文献资料.

阅读推广视域下图书馆公共文化服务
谢 芳(广东省深圳市民治街道文化体育中心 广东 深圳 518000)摘 要在建设现代化公共文化服务体系的过程中,图书馆的阅读推广对于推进社会知识普及以及促进阅读公平有着重要的作用 本文阐述了阅读推广视.

图书馆精细化阅读推广模式
摘 要阅读推广服务是发展图书馆建设的重要内容,这是由于知识信息化时代,阅读书籍已经成为很多人生活中不可缺少的休闲娱乐项目之一,做好阅读推广能够提高读者的阅读效率,并且能够及时修正阅读不规范的现象 阅读.

公共图书馆如何更好地开展青少年阅读推广工作
摘要当前,如何帮助社会公众养成良好的阅读习惯是亟需全社会思考的问题 在这个过程之中,作为社会文化资源载体之一的公共图书馆而言,应当通过各类阅读专项活动的开展与组织,以便实现对社会公众阅读习惯的培养,使.

公共图书馆少儿阅读推广活动策划策略探析
【摘 要】在公共图书馆的飞速发展下,更应将重点放在少儿的身心健康发展中,积极开展少儿阅读活动,促进少儿的身心健康发展 同时,在少儿阅读活动开展的过程中对促进公共图书馆的发展也有着极大的作用 【关键词】.

论文大全