专业的编程技术博客社区

网站首页 > 博客文章 正文

数据挖掘:数据预处理(数据挖掘数据预处理代码)

baijin 2024-10-14 08:11:09 博客文章 6 ℃ 0 评论

数据预处理的原因

§ 数据在搜集时由于各种原因可能存在缺失、错误、不一致等问题

§ 用于描述对象的数据有可能不能很好地反映潜在的模式

§ 描述对象的属性的数量可能有很多,有些属性是无用的或者冗余的



数据预处理的任务

(1)数据规范化(normalization)

(2)数据离散化(discretization)

(3)数据清洗(data cleaning)

(4)特征提取与特征选择



数据规范化

§ 数据规范化又称标准化(standardization),通过将属性的取值范围进行统一,避免不同的属性在数据分析的过程中具有不平等的地位

§ 常用方法

- 最小-最大法(min-max normalization)

- 零均值规范化(z-score)

Tags:

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表