数据挖掘导读
本文初稿完成于大二下学期,由于授课内容 1 与机器学习课程交叉较多,因此知识体量看上去微乎其微。算是对机器学习领域的一个补充。
科学发展范式:实验(经验)科学 \(\to\) 理论科学 \(\to\) 计算科学 \(\to\) 数据科学。
一些定义:
- 数据的定义:分为结构化和非结构化数据。结构化例如关系数据库的含有显式的属性和取值,非结构化例如文本、图像、音频和视频;
- 知识的定义:有意义的信息或模式,具备典型性、新颖性、时效性、准确性、实用性;
- 数据挖掘的定义:从数据中提取知识;
- 数据挖掘的过程:数据预处理、算法实践、解释评估。
-
丁兆云,周鋆,杜振国. 《数据挖掘:原理与应用》[M]. 1版. 机械工业出版社,978-7-111-69630-8. ↩