上课时间 第一周 上课节次 3 节 课 型 理论 课 题 绪论 教学目的 使学生初步认识数据挖掘与数据仓库 教学方法 讲授 重点、难点 数据挖掘与数据仓库的定义及其应用价值 时间分配 教学内容 板书或课件版面设计 1 .1 初识数据挖掘 1 .1 .1 数据挖掘的产生 数据挖掘产生的前提是需要从多年积累的大量数据中找出隐藏在其中的、有用的信息和规律。 计算机技术和信息技术的发展使其有能力处理这样大量的数据。 1 .1 .2 数据挖掘的应用价值 应用数据挖掘从大量数据中发现规律是面向某一应用的规律,具有具体的指导意义。 早期数据挖掘主要应用于商业领域,随着人们对数据挖掘了解的逐步深入,其应用领域逐步扩大到科学研究、市场营销、金融分析和体育比赛等领域。 1 .1 .3 数据挖掘的发展过程 数据挖掘是2 0 世纪8 0 年代人工智能研究项目失败后,人工智能转入实际应用时提出的,是一个新兴的、面向商业应用的人工智能研究。 1 .1 .4 数据挖掘的定义 数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。 1 .2 初识数据仓库 1 .2 .1 数据仓库的产生 2 0 世纪8 0 年代出现了数据仓库的思想,数据仓库是面向主题的、集成的、包含历史的、不可更新的、面向决策支持的、面向全企业的、最明细的数据存储、数据快照式的数据获取。 1 .2 .2 数据仓库的应用价值 传统数据库的处理方式和决策分析中的数据需求在决策处理的系统吸纳供应问题、决策数据需求的问题以及决策数据操作的问题方面不相称,导致企业无法使用现有的业务处理来满足决策分析的需要,因此决策分 析需要一个能够不受传统事务处理的约束、高效率处理决策分析数据的支持环境,这就是数据仓库存在的价值。 1.2.3 数据仓库的发展过程 数据仓库是一种新的数据处理体系结构,是企业内部各部门业务数据和各种外部数据进行统一和综合的中央数据仓库,为企业决策支持系统提供所需的信息,是一种信息管理技术。 目前世界上最大数据仓库是 NRC 公司建立的基于其 Tera data数据库拥有 24TB数据量的Wal-Mart 数据仓库系统。 1.2.4 数据仓库的定义 数据仓库是面向主题的、集成的、不可更新的、随时间不断变化的数据集合,用以支持经营管理中的决策制定过程。 1.2.5 数据仓库与数据挖掘的关系 (1)数据仓库系统的数据可以作为数据挖掘...