3.7数据仓库与数据挖掘
1)数据仓库的概念
数据仓库(Data Warehouse)是一个面向主题的、集成的、相对稳定的、且随时间变化的数据集合,用于支持管理决策。
2)数据仓库的体系结构
包括:数据源、数据存储与管理、OLAP(On-line Transaction Processing,联机事务处理)服务器、前端工具。
3)数据仓库的设计与开发
数据仓库的开发、实施步骤:
业务需求分析
逻辑模型设计
物理模型设计
数据抽取、清洗、集成、装载等
数据仓库的管理
数据的分析、报表、查询等数据的表现
数据仓库性能优化及发布
4)数据挖掘的概念
从技术上看,数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。
常用的数据挖掘技术包括关联分析、序列分析、分类、预测、聚类分析以及时间序列分析等。
5)数据挖掘的流程
问题定义
建立数据挖掘库
分析数据
调整数据
模型化
评价和解释
各省软考办 | ||||||||||