数据挖掘工具Weka教程

1、数据挖掘工具WEKA教程,广东外语外贸大学杜建丰,WEKA教程,WEKA简介数据格式数据准备属性选择可视化分析分类预测关联分析集群分析扩展WEKA,课程的总体目标和要求:熟悉WEKA的基本任务,了解WEKA的功能为数据挖掘实验准备流程数据选择算法和参数执行评估实验结果,WEKA有了新的算法WEKA是新西兰的新名称,WEKA的主要开发人员来自新西兰。WEKA大学WEKA团队于2005年8月在第11届ACMSIGKDD国际会议上获得了数据挖掘和知识导航领域的最高服务奖,WEKA系统被广泛认为是数据挖掘和机器学习历史上的里程碑,是当今最完整的数据挖掘工具之一。WEKA每月下载次数超过10,000次

9、2001-04-04幸运的是,WEKA还提供了许多其他软件(如Excel)支持的CSV文件支持。现在打开bank-data.csv。可以使用WEKA将CSV文件格式转换为ARFF文件格式。ARFF格式是WEKA最支持的文件格式。WEKA还提供了通过JDBC访问数据库的功能。浏览器界面“浏览器”提供了许多功能,是WEKA最常用的模块。首先熟悉界面,然后使用它预处理数据。,3,准备数据(续),Bank-data数据每个属性的含义如下:id:auniqueidentificationnumberage:ageofcustomerinyears(numeric)sex3360

10、male/femaleregion:inner_CIImortgage:doesthecustomerhaveamortgage(yes/no)Pep:didthecustomerbuyaPep(个人参与计划)我们根据不同的功能将此界面分为8个区域。区域1中的多个选项卡用于切换不同的挖掘任务面板。本部分仅使用“Preprocess”,其他面板的功能将在稍后介绍。区域2是一些常用按钮。包括打开、保存和编辑数据的功能。您可以在此将bank-data.csv保存为bank-data.arff。在区域3中选择筛选器后,可以筛选数据或转换数据。数据预处理主

11、要是使用它完成的。区域4显示了数据集的一些基本情况。3,准备数据(续),数据集的所有属性都列在区域5中。您可以选择某些属性,然后选择“Remove”将其删除,也可以在删除后使用区域2中的“Undo”按钮进行搜索。区域5上方的按钮行用于快速选择。在区域5中选择属性时,区域6将显示此属性的摘要。摘要对于数字属性和公称属性是不同的。图像显示数字属性income的摘要。区域7是区域5中选定属性的直方图。如果数据集的最后一个属性(分类或回归操作的默认目标变量)是类变量(其中“pep”完全相同),则直方图中的每个矩形将根据该变量的百分比分为不同颜色的段。要更改段的条件,只需从区域7上方的下拉框中选择其

12、他分类属性即可。如果从下拉框中选择“NoClass”或数字属性之一,则此属性为黑白直方图。区域8是状态栏,您可以查看Log以确定是否存在错误。右边的WEKA鸟移动时,WEKA正在进行挖掘。您还可以右键单击状态栏以回收JAVA内存。3,准备数据(预处理1),删除无用的属性通常对于数据挖掘任务来说,ID等信息没有用处,应将其删除。在区域5中,选择属性id,然后单击Remove。将新数据集另存为“bank-data.arff”,然后重新打开。接下来,演示RemoveType。离散化我们知道,某些算法(如关联分析)仅在所有属性都是公称形式的情况下处理。此时,我们需要离散数值属性。此数据集中有三个变量

13、是数值:“age”、“income”和“children”。其中children只有四个值:0,1,2,3。此时可以直接修改ARFF文件,然后将attributechildrennumeric更改为attributechildren0,1,2,3。在Explorer中重新打开bank-data.arff,注意在选择了children属性的情况下,区域6中显示的Type更改为Nominal。3、准备数据(预处理2)、分布式(继续)age和income的分离可以使用WEKA中名为Discretize的Filter完成。过滤器树出现在区域2的“Choose”中,单步查找WEKA.fi

14、lters.unsupported.attribute.discretize,然后单击。“Choose”旁边的文本框现在应该显示“discretize-b10-m-0.1-rfirst-last”。单击此文本框将显示一个新窗口,允许您修改离散参数。将AttributeIndices的右侧更改为“1,4”,但不单独调整第一个属性和第四个属性(请参阅区域5属性名称左侧的数字)。由于您计划将这两个属性都分成三个段,因此请将“bins”更改为“3”。其他方块不需要变更。单击“确定”返回Explorer,您会看到age和income离散了组件类型的属性。要取消“离散化”命令,请单击区域2中的Undo。通过此操作获得的数据集将保存为bank-data-final.arff。3,准备数据(预处理3),转换属性类型NominalToBinary筛选器将所有nominal类型的属性转换为

THE END
1.R语言数据分析入门与数据挖掘基础(资料+交流群)哔哩哔哩R语言数据分析入门与数据挖掘基础(资料+交流群),bilibili课堂,哔哩哔哩课堂,哔哩哔哩,Bilibili,B站,弹幕https://www.bilibili.com/cheese/play/ss1536?search_query=%E4%BA%92%E8%81%94%E7%BD%91%E8%A7%86%E9%A2%91
2.数据挖掘算法基础教程数据挖掘教程数据挖掘算法基础教程 数据挖掘概览 数据挖掘的定义 数据挖掘(Data Mining)是一种从大量数据中提取有用信息的过程,这些信息以模式、关联、趋势或异常的形式存在,能够帮助决策者理解数据的潜在价值,从而做出更明智的决策。数据挖掘不仅仅是应用统计学和机器学习算法,它还涉及数据预处理、模式识别、模型验证和解释等多个步https://blog.csdn.net/weixin_42749425/article/details/140331488
3.教程丨手把手教你做数据挖掘!(附教程&数据源)读完这篇教程,想不会数据挖掘都难!https://mp.weixin.qq.com/s?__biz=MzAxMzA2MDYxMw==&mid=2651570168&idx=3&sn=f712f0ea32c12d7b9cbe59859574f50d&chksm=80574092b720c98430d29fc0cc69ecc300c1929ad5de91ced873c4276799f036fcc1fa7cef47&scene=27
4.数据挖掘基础教程(豆瓣)《数据挖掘基础教程》全面介绍数据挖掘的原理、方法和算法。主要内容包括数据挖掘的基本概念、数据挖掘算法的数据类型、输入和输出、决策树、数据挖掘的预处理和后处理、关联规则挖掘、分类和回归算法、支持向量机、聚类分析及多维数据可视化。 《数据挖掘基础教程》讲解深入浅出,并辅以大量实例,随书光盘提供了大量数据集以https://book.douban.com/subject/3393769/
5.数据挖掘系列教程嘿boom数据挖掘系列教程 ?上一篇:Git复习步骤 ?下一篇:文本摘要 posted @2019-04-22 14:53嘿boom阅读(137) 评论(0)编辑收藏举报https://www.cnblogs.com/heyboom/p/10750117.html
6.斯坦福数据挖掘教程:第3版访问借阅管理系统 分享 作者:莱斯科夫 ISBN:9787115556691 出版社:人民邮电出版社 出版年:2021 作者:许轶 ISBN:9787313121516 出版社:上海交通大学出版社 出版年:2014 斯坦福日记 作者:许轶 ISBN:9787313144294 出版社:上海交通大学出版社 出版年:2016 数据挖掘教程 https://www.las.ac.cn/front/book/detail?id=b367f6f320408b8999f54cd987bf4577
7.数据挖掘中级教程(AnalysisServicesMicrosoftAnalysis Services 提供用于创建和使用数据挖掘模型的集成环境。您可以方便地绑定到数据源、针对同一个数据创建和测试多个模型并部署要用于进行预测分析的模型。 在数据挖掘基础教程中,您学习了如何使用 Business Intelligence Development Studio 创建数据挖掘解决方案,而且生成了三个支持目标邮递活动的模型,这些模型https://msdn.microsoft.com/zh-cn/library/windows/desktop/cc879271(v=SQL.100).aspx
8.数据挖掘基础教程pdf通俗易懂数据挖掘 基础教程 pdf 通俗易懂 人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。 经管之家是国内活跃的在线教育咨询平台! 经管之家新媒体交易平台 提供"微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UChttps://bbs.pinggu.org/jg/kaoyankaobo_kaoyan_866898_1.html
9.数据挖掘实战教程数据挖掘入门课程lingjuli的技术博客数据挖掘实战教程 数据挖掘入门课程 第一章 大数据 4V Velocity very-large 数据挖掘 从海量数据中挖掘出令人感兴趣的、有价值的信息 数据挖掘的任务 关联规则、分类、聚类、离群点检测 知识发现流程 数据挖掘——核心 数据挖掘与其他学科的关系 数据库、数学、物理https://blog.51cto.com/u_39029/8454752
10.GitHubxiaohuiduan/data教程系列简介 系列地址:https://www.cnblogs.com/xiaohuiduan/category/1661541.html 该教程为入门教程,为博主学习数据挖掘的学习路径步骤。教程为入门教程,从最简单的开始。使用的编程语言为Python3.8.1,使用JupyterNotebook作为开发环境(使不使用JupyterNotebook都没有关系)。 在学习本教程之前,你需要: 有一点pythonhttps://github.com/xiaohuiduan/data_mining
11.可靠性数据分析教程大数据分析与大数据挖掘课程 数据仓库与数据挖掘教程 第3章 数据存储 共56页.pptx 【课程简介】 本课程适合所有需要学习数据仓库与数据挖掘知识的同学,课件内容制作精细,由浅入深,适合入门或进行知识回顾。 本章为该课程的其中一个章节,如有需要可下载全部课程 全套资源下载地址:https://download.csdn.net/download/https://www.iteye.com/resource/hday02-5884525
12.SAS与数据挖掘视频教程所属分类:软件教程 立即播放 添加快捷方式到桌面 在线播放 分集下载 数据仓库与数据挖掘视频教程:数据库与数据仓库的区别 04数据仓库设计过程,OLAP服务器体系结构,Cube 03数据仓库,面向主题,整合,OLTP,OLAP,DMQ 八分钟玩转数据分析:时间序列分析 基于案例学习时间序列分析 https://www.waitang.com/view/71176.html
13.SPSSModeler18.0数据挖掘软件教程(六):聚类分析KmeansSPSS Modeler18.0数据挖掘软件教程(一):背景及软件简介 SPSSModeler18.0数据挖掘软件教程(一)1、背景介绍本人这学期担任导师《大数据应用与管理》课程助教,课程内容涉及大数据的概念、大数据下的基础算法(数据的描述性统计、回归分析Modeler进行描述性统计、回归分析、分类分析、聚类分析、关联分析。 2、SPSSModeler软件https://www.pianshen.com/article/2433751443/
14.11.1.空间数据挖掘—GIS原理在线教程1.空间数据挖掘的概念 随着空间数据库技术的高速发展,人类积累了大量的空间数据,尤其是地理信息系统、遥感、医疗影像, 计算机辅助设计(CAD)、动植物生态领域等方面的广泛应用导致空间数据急剧地产生和增加, 如美国国家航空和宇宙航行局(National Aeronautics and pace Administration,NASA)对地观测系统(Earth Observing Systhttps://www.osgeo.cn/gis-tutorial/system-excavate.html
15.数据挖掘原理方法及Python应用实践教程本书系统讲授数据挖掘的原理、主要方法及其Python实现,共分三部 分:第一部分包含第1~2章,介绍数据挖掘的基本概念、流程和数据预处理;第二部分包含第3~11章,介绍经典的分类算法(包括朴素贝叶斯分类器、决策树、k-近邻、支持向量机等)、经典的聚类分析、关联分析、人工神经网络和Web挖掘等方法;第三部包含第12~14https://thinktank.sciencereading.cn/booklib/v/bookPreview/122/248/2976381.html
16.Excel机器学习机器学习入门教程Excel数据挖掘深度学习强化学习当当火把图书专营店在线销售正版《Excel机器学习 机器学习入门教程Excel数据挖掘深度学习强化学习数据分析人工智能神经网络计算机》。最新《Excel机器学习 机器学习入门教程Excel数据挖掘深度学习强化学习数据分析人工智能神经网络计算机》简介、书评、试读、价格、图片等相http://product.dangdang.com/11398005516.html
17.数据挖掘导论数据类型mysql教程数据类型 数据集的不同表现在很多方面。例如:描述数据对象的属性可有具有不同的类型——定量的或者定性的。并且数据集可能还具有特定的性质,如包含时间序列或者彼此相关联。这因为如此,数据的类型决定我们应使用何种工具和技术来分析数据。此外,数据挖掘 数据类型 https://www.php.cn/js-tutorial-127693.html
18.数据挖掘查询语言数据挖掘查询语言 (DMQL) 由 Han、Fu、Wang 等人提出。用于 DBMiner 数据挖掘系统。数据挖掘查询语言实际上是基于结构化查询语言 (SQL)。数据挖掘查询语言可以设计为支持即席和交互式数据挖掘。此 DMQL 提供用于指定原语的命令。DMQL 也可以与数据库和数据仓库一起使用。DMQL 可用于定义数据挖掘任务。我们特别研究了如https://www.jc2182.com/dm/dm-query-lang.html
19.数据挖掘基础(黑马程序员)免费在线视频教程数据挖掘基础(黑马程序员) 本课程适合有python基础希望向人工智能领域发展的学员学习 原创视频5.0分 学习人数:17438学习难度:初级更新时间:2020-06-06 已学0%学习耗时0分钟 开始学习 课程介绍 本课程由黑马程序员精品打造,带你轻松入门机器学习。 喜欢就分享吧https://www.py.cn/course/1096.html
20.数据挖掘:实用机器学习工具与技术(原书第3版)中文/英文pdf完整版[138数据挖掘教程下载 投诉报错 书籍大小:138.4MB 书籍语言:简体中文 书籍类型:国产软件 书籍授权:免费软件 书籍类别:数据库其它 应用平台:PDF 更新时间:2017-10-11 购买链接:京东异步社区 网友评分: 360通过腾讯通过金山通过 138.4MB 广告 商业广告,理性选择广告 商业广告,理性选择广告 商业广告,理性选择广告 商业广告,https://www.jb51.net/books/581148.html
21.ResolumeArena7中文版附安装教程Resolume Arena 7中文版 附安装教程 下载地址:http://www.32r.com/soft/87181.html 软件介绍:(注释:免费=破解) Resolume Arena 7中文版是一款专业且优秀的VJ音视频软件,该软件拥有强大的音像播放能力、效果震撼的视听效果、音频的全面分析、以及还支持opengl加速合成, 让您可以在现场即兴创造、甚至不需要暂停视频https://blog.itpub.net/69984506/viewspace-2738285