数据挖掘的功能

2025-04-18 11:23:07

数据挖掘是为了从现有墙绅褡孛数据中获得信息，但它也不是万能，能够发现的知识主要是以下5种：

1.概念知识

类别特征的概括性描述知识。根据数据的微观特征发现同类事物带有普遍性的、较高层次概念的共同性质，是一种对数据的概况、提炼和抽象。

2.关联知识

主要反映一个事件和其他事件之间依赖或者关联性。如果两项或者多项属性之间存在关联，那么其中一项的属性值就可以根据其他属性值进行预测。这类知识发现方法中最有名的就是Apriori算法。

3.分类知识

主要反映同类事物的共同特征和不同事物之间的差异。

4.预测性知识

根据历史数据和当前数据对未来数据进行预测，主要是时间序列预测。

5.偏差性知识

这是对差异和阶段特例的揭示，如数据聚类的离群值等。

相较于挖掘能够发现的知识而言,数据挖掘的方法类型很多，大致可以分为7类

1.决策树方法（信息论方法）

这类方法给予信息论原理，直观容易理解。一般来说这类方法效果好，影响力大。代表算法：ID3算法、C4.5算法、IBLE算法。

2.聚类方法

比较样本距离，距离近的归为一类，距离远的分属在不同的类中。代表算法：k均值、Clara算法、变色龙算法。

3.统计分析方法

利用统计学原理对数据进行分析，这方面有大量的商业软件可以选用。

4.仿生物技术

代表算法：神经网络算法和遗传算法，当然包括两者的其他衍生或近似算法，如鸟群算法。

5.可视化技术

对传统图标功能的一种扩充，让用户对数据的剖析更清晰。

6.模糊数学方法

我最喜欢的一类方法，包括模糊评判、模糊决策、模糊模式识别和模糊聚类。可以参考我以前的有关Aforge.net的博文。

7.其他

其他就是其他，比如SVM、文件挖掘、最近邻方法等。

声明：本网站引用、摘录或转载内容仅供网站访问者交流或参考，不代表本站立场，如存在版权或非法内容，请联系站长删除，联系邮箱：site.kefu@qq.com。