博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
数据挖掘(一):引论
阅读量:6377 次
发布时间:2019-06-23

本文共 544 字,大约阅读时间需要 1 分钟。

数据挖掘又称从数据中挖掘知识知识提取数据/模式分析、数据考古和数据捕捞

1. 为什么进行数据挖掘?

日益增长的数据同其中能得到的知识量的矛盾。数据越来越多,就迫切需要从数据中提取信息的工具。简单讲就是从数据中挖掘知识

2. 什么是数据挖掘?

数据挖掘就是从数据中发现知识的过程。

知识发现过程由以下步骤的迭代序列组成:

  • 1.数据清理(消除噪声和删除不一致数据)
  • 2.数据集成(多种数据源可以组合在一起)
  • 3.数据选择(从数据库中提取和分析任务相关的数据)
  • 4.数据变换(通过汇总或聚集操作,把数据变换和统一成适合挖掘的形式)
  • 5.数据挖掘(基本步骤,使用智能化方法提取数据模式)
  • 6.模式评估(根据某种兴趣度度量,识别代表知识的真正有趣的模式)
  • 7.知识表示(使用可视化和知识表示技术,向用户提供数据挖掘的知识)

广义的数据挖掘的观点:

数据挖掘是从大量数据中挖掘有趣模式和知识的过程。

3. 可以挖掘什么类型的模式?

数据挖掘任务可以分为两类:

1.描述性:描述性挖掘任务刻画目标数据中数据的一般性质
2.预测性:预测性挖掘任务在当前数据上进行归纳,以便做出预测

clipboard.png

4. 使用什么技术?

clipboard.png

5. 数据挖掘的主要问题

  • 挖掘方法
  • 用户交互
  • 有效性与伸缩性
  • 数据类型的多样性
  • 数据挖掘与社会

转载地址:http://iyxqa.baihongyu.com/

你可能感兴趣的文章
前端存取cookie
查看>>
linux c笔记
查看>>
第四次作业
查看>>
angular 5的新特性
查看>>
tcp中设置连接超时
查看>>
java基础.1——String类
查看>>
html,css,javascript三者之间的相互关系是什么
查看>>
Educational Codeforces Round 48 (Rated for Div. 2) B 1016B Segment Occurrences (前缀和)
查看>>
SQL SERVER 2005 附加 SQL SERVER 2000数据库的办法
查看>>
echart折线图系列一:折线图基本配置
查看>>
leetcode 278. First Bad Version
查看>>
mlecms v2.2版权
查看>>
异步请求(解析json数据)
查看>>
HDU - 6409:没有兄弟的舞会(数学+思维)
查看>>
(六)6.9 Neurons Networks softmax regression
查看>>
关于快乐数的算法
查看>>
day11-RabbitMQ direct广播模式
查看>>
vue笔记三(组件)
查看>>
9月9日,We7插件商场正式上线
查看>>
WPF and Silverlight 学习笔记(五):WPF应用程序管理
查看>>