如何将数据挖掘应用到PU行业?——哪些数据规整之后具有深度挖掘的意义?(上)
数据挖掘(Datamining)
从严格意义上来讲不应该仅仅是一项计算机技术,它是对数据库的逻辑辨识、规整以及总结,从中找到数据库深层次的那些一般不为所见的意义。 数据挖掘技术,能帮助企业分析企业过去、现在及将来,尤其是对未来具有很强的预见性。很多用户或技术人员也误解了“数据挖掘”只代表抽取与加载数据,其实真正“数据挖掘”的定义,是为企业预测数据库深处的重要信息,但数据挖掘工具是怎样准确地告诉你那些隐藏在数据库深处的重要信息的呢?它们又是如何作出预测的?答案就是建模。
建模实际上简单地讲,就是在你知道结果的情况下建立起一种模型,并且把这种模型应用到你所不知道的那种情况中去。建模基础有很多,所谓“建模基础”我们可以理解为一些经过人们长期的实践经验而被认为是行之有效的思考方法。注意,这里所讲的是思考方法!其实,建模就是一种方法的建立,一种思维方式的建立。建模基础,包括关联规则、序列模式、频繁序列、决策树分类、神经元网络、线性回归、Logistic回归、K-Means聚类、模糊聚类、异常检测等多种数据挖掘算法。常用的序列模式、决策书分类、线形回归等。对于不同的数据对象以及不同的挖掘要求,应该运用不同的算法模型。
本文旨在讨论哪些数据对象在规整(入库)之后具有深度挖掘的意义,应用领域为PU行业。......(未完待续)