1500字范文,内容丰富有趣,写作好帮手!
1500字范文 > Rattle :基于R的数据挖掘工具:功能概览

Rattle :基于R的数据挖掘工具:功能概览

时间:2019-01-13 18:25:28

相关推荐

Rattle :基于R的数据挖掘工具:功能概览

Rattle的界面,依次排列的是菜单,工具栏和标签栏。

1.Rattle的标签栏

一个完整的数据挖掘过程包括以下几个步骤(CRISP-DM,1996)

(1) 理解问题

(2) 理解数据

(3) 准备数据

(4) 建立模型

(5) 模型评估

(6) 运用

基于这个流程,Rattle开发了一个方便的标签栏,可以便捷的完成操作。

这个标签栏从左到右依次排列,各自完成数据挖掘的一个相关步骤。

Data:选择数据源,输入数据。

Explore:执行数据探索,理解数据分布。

Test:提供各种统计检验。

Transform:变换数据的形式。

Cluster:数据聚类,包括系统聚类,k-均值聚类,和双聚类(biclustering)。

Associate:关联规则方法。

Model:内容最丰富的一个标签。包括多种方法:决策树,支持向量机,线性模型,

神经网络,随机森林,提升(Boost)。

Evaluate:模型评估,它会提供一个实际结果和预测结果进行比较的误差矩阵。

Log:数据挖掘过程的纪录。它可以给出所进行的Rattle操作的R代码,利用这个标签,可以学习R的数据挖掘过程,也可以把纪录以文本形式输出,在R 平台中实现R和Rattle的交互。

2.Rattle的工具栏和菜单

Rattle工具栏上最主要的一个按钮是Execute按钮(执行)。所有的操作都要点击Execute来完成(对应的快捷键是F2)。

Report按钮,可以完成当前操作的格式化报告(以开放的标准ODT格式)。

Export按钮,可以输出来自Rattle的各种对象,特别的,完成Moel标签的相关操作后,它会以PMML格式保存当前模型。

Rattle工具栏和标签栏完成的大部分工作,使用菜单也可以完成。菜单很平凡,特别要指出的一点是,setting菜单中的Use Cario Graphics Device这一项要选中,这样图形才会以Rattle图形设备的形式输出,否则,会作为R图形输出。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。