大数据预处理有什么方法?

导读1、数据清理数据清理例程就是通过填写缺失值、光滑噪声数据、识别或者删除离群点,并且解决不一致性来进行清理数据”。2、数据集成数据集成过程将来自多个数据源的数据集成到一起。3、数据规约数据规约是为了得到数据集的简化表示。数据规约包...

1、数据清理

大数据预处理有什么方法?

数据清理例程就是通过填写缺失值、光滑噪声数据、识别或者删除离群点,并且解决不一致性来进行清理数据”。

2、数据集成

数据集成过程将来自多个数据源的数据集成到一起。

3、数据规约

数据规约是为了得到数据集的简化表示。数据规约包括维规约和数值规约。

4、数据变换

通过变换使用规范化、数据离散化和概念分层等方法,使得数据的挖掘可以在多个抽象层面上进行。数据变换操作是提升数据挖掘效果的附加预处理过程。

免责声明:本文由用户上传,如有侵权请联系删除!