当前位置:大学毕业论文> 本科论文>材料浏览

关于数据挖掘类本科论文开题报告范文 跟基于R软件的数据挖掘应用相关论文写作技巧范文

主题:数据挖掘论文写作 时间:2024-03-17

基于R软件的数据挖掘应用,本文是关于数据挖掘类硕士学位论文范文与数据挖掘和数据挖掘应用和软件方面毕业论文提纲范文.

数据挖掘论文参考文献:

数据挖掘论文参考文献 论文免费查重软件软件论文数据挖掘论文常用工具软件论文

[摘

要] R软件集成了多种数据分析和可视化方法,具有强大的分析能力和出色的扩展性,因此被广泛应用于数据挖掘之中.通过聚类分析和分类回归树方法给出了R软件在数据挖掘中的应用.从简洁的脚本设计和出众的分析效果展示了 R 软件的基本特点及其在数据挖掘中的优势.

[关

键 词] R软件;数据挖掘;聚类分析;分类回归树

[中图分类号] F407.67

[文献标志码] A

[文章编号] 2096-0603(2017)18-0045-01

  近年来,随着电子商务、社交网站、移动终端应用开发的兴起,企业对用户基本数据、行为数据、网络痕迹数据等信息的掌握逐渐成为其在信息领域的核心竞争力,“用数据说话、用数据决策”已成为企业未来发展的基石.然而,传统数据在全样抽取时存在时效性差、不适合处理实时数据的缺陷,因此,如何从数据中挖掘出有价值的信息就显得十分重要.

  一、数据准备

  数据文件包括通用型文件如纯文本文件、Excel等,通过加载不同的功能模块,R软件还可以读取多种数据文件.通过安装 RODBC、RJDBC和RMySQL可以获取对 ODBC、JDBC和Oracle 数据源的访问能力.由于实际应用中往往需要对异构数据源进行挖掘,R 软件提供的针对各种数据源的访问接口具有很强的适用性.

  二、数据挖掘建模

  (一)聚类分析

  k-means是经典的基于划分的聚类方法,其基本思想是使聚类性能指标最小化.所用的聚类准则函数是聚类集中每个样本点到该类中心的距离平方之和,应使其最小化.为此,首先根据给定聚类数K,为每个聚类确定一个初始聚类中心;其次将样本集里的各个样本按最小距离原则分配到最邻近的聚类,并使用每个聚类中的样本均值作为新的聚类中心,如此重复直到聚类中心不发生变化;最后可获得K个聚类.

  R软件中可以用k-means()函数来进行聚类.聚类可视化采用判别投影绘制函数plotcluster(),把数据对象映射平面空间,展示聚类之间的异构性.以数据集iris为例.所用代码见表1.

表1 k-means聚类分析代码

  (二)分类回归树分析

  R软件提供的分类回归树函数有很多种,为简化获得的分类回归树模型,避免产生过度拟合,常采用的分类回归树函数为rpart(),rpart()可以建立一个分类回归树,并且可以选择最小误差的预测.利用rpart包中的bodyfat数据集建立分类回归树,然后用该分类回归树预测,所用代码见表2.

表2 分类回归树分析代码

  优秀的数据挖掘工具一方面要求丰富的数据挖掘功能,另一方面也需要优化的算法和用户体验,R软件具备构建实用性强的数据挖掘系统的各种条件,且具有开源的特点,交互方式提供可视化界面,还支持数据挖掘工作流的任务定义与执行,简化了编程人员的操作.此外,可通过自定义脚本来进行分析功能及其他诸如C语言、ja语言的调用等.因此,R语言未来将在大数据的挖掘领域有更广泛的应用.

  参考文献:

  邵峰晶,于忠清.数据挖掘原理与算法[M].北京:中国水利水电出版社,2003.

此文点评,该文是一篇大学硕士与数据挖掘本科数据挖掘毕业论文开题报告范文和相关优秀学术职称论文参考文献资料,关于免费教你怎么写数据挖掘和数据挖掘应用和软件方面论文范文.

电子病历中数据挖掘技术的应用
【摘要】 现代科学技术的不断更新和进步,为当前医院的发展,提供了良好的前提条件 将数据挖掘技术积极应用在电子病历之中,将能够针对电子病历中的各项数据进行全面细致的分析和研究,做好数据总结处理工作 本文.

基于线性链表的关联规则数据挖掘技术在数字图书馆中的应用
数据挖掘(Data Mining) 是通过分析每个数据,从大量数据中寻找其规律的技术,一般是指从大量的数据中自动搜索隐藏于其中的有着特殊关系性(属于Association rulelearning)的.

数据挖掘和分析在网站运营管理中的应用
摘要伴随互联网的深入发展,电子商务类网站的运营建设凸显出越来越重要的作用 网站建设是一整套内容,既包括前期策划,也包括后期的维护、更新和升级 一个网站要想运营管理得好,需要做好譬如网站宣传策划、网络营.

基于数据挖掘技术解决业务指标预测的方案
摘要信息中心目前涉及的业务有固定电话、宽带、GPS、无线市话、信息服务、数字电视、IPTV电视、无线 宽带…… 每年的基础收入将近1亿,随着经营压力不断增加,能否准确预测下一年的收入成为关键问题 如何.

论文大全