建设工程教育网 > 专业资料 > 工艺工法 > 水利水电 > 正文
2016-06-14 11:34 来源于网络 【大 中 小】【打印】【我要纠错】
(1)信息收集。信息收集要在对项目目标和需求的充分理解的基础上进行。也就是先根据数据分析的目标和需求,确定所需要的特征信息,选择合适的信息收集方法,然后再将收集到的信息存人数据库。
(2)数据集成。数据集成既为数据共享,对不同来源、不同格式、不同性质特点的数据进行逻辑上或物理上整理。
(3)数据规约。数据规约是为提高数据挖掘效率而对数据源所进行的预处理。如果不对数据源进行规约,那么即使在少量数据上执行多个数据挖掘算法,也需要很长的时间。而在大量数据上执行多个数据挖掘算法时。几乎就无效率可言。采用数据规约可以得到数据源的规约表示。数据源规约表示与数据源相比,容量虽然小了得多,数据的完整性却保持接近。正因如此,数据规约后数据挖掘的结果几乎相同,但数据挖掘的效率却有了较大提高。
(4)数据整理。数据库中有一些数据的属性值不完整、表示方式不一致。因此,需要对数据进行再加工,用科学方法,填补丢失的数据。处理噪音数据。使数据完整、一致。
(5)数据变换。利用数学、统计学手段,将参与分析的数据,转换成为适合数据挖掘的数据形式。
(6)数据挖掘。选择合适的数据分析工具,应用规则推理、统计方法、决策树、事例推理、模糊集、遗传算法、神经网络等方法,对数据仓库中的数据信息进行处理,得出数据处理成果。
(7)模式评估。为了取得更为有效的知识,请专家数据挖掘结果。在评估的基础上反复提取,进而取得更有效的知识。
(8)成果表示。以专业的方式保存、传递、输出、共享数据挖掘成果。
1、凡本网注明“来源:建设工程教育网”的所有作品,版权均属建设工程教育网所有,未经本网授权不得转载、链接、转贴或以其他方式使用;已经本网授权的,应在授权范围内使用,且必须注明“来源:建设工程教育网”。违反上述声明者,本网将追究其法律责任。
2、本网部分资料为网上搜集转载,均尽力标明作者和出处。对于本网刊载作品涉及版权等问题的,请作者与本网站联系,本网站核实确认后会尽快予以处理。
本网转载之作品,并不意味着认同该作品的观点或真实性。如其他媒体、网站或个人转载使用,请与著作权人联系,并自负法律责任。
3、本网站欢迎积极投稿。