数据挖掘导读
数据挖掘 (Data Mining, DM) 又称数据库中的知识发现 (Knowledge Discover in Database, KDD),是指利用机器学习和统计分析从大型数据集中发现模式和其他有价值信息的过程。
本文记录数据挖掘 1 的学习笔记。一些数据挖掘中的名词定义如下:
- 数据的定义:分为结构化和非结构化数据。结构化例如关系数据库的含有显式的属性和取值,非结构化例如文本、图像、音频和视频;
- 知识的定义:有意义的信息或模式,具备典型性、新颖性、时效性、准确性、实用性;
- 数据挖掘的定义:从数据中提取知识;
- 数据挖掘的过程:数据预处理、算法实践、解释评估。
-
丁兆云,周鋆,杜振国. 数据挖掘:原理与应用 [M]. 1版. 机械工业出版社,978-7-111-69630-8. ↩