电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

数据挖掘实验报告_决策树和聚类分析VIP专享VIP免费

数据挖掘实验报告_决策树和聚类分析_第1页
数据挖掘实验报告_决策树和聚类分析_第2页
数据挖掘实验报告_决策树和聚类分析_第3页
使用样例数据库——食品销售公司数据库,里面包含 17 张维表,11 张事实表,具体信息如下: 维表 account: 账目表 category:类别表 currency:货币表 customer:客户表 days-check:星期表 department:部门表 employee:员工表 position:工厂位置 product:商品信息 product_class:商品类别 promotion:广告 region:区域 reserve_employee:储备干部表 store:分店表 time_by_day:时间表 warehouse:仓库表 warehouse:仓库类表 事实表 expense_fact:支出表 inventory_fact_1997:1997 年库存情况 inventory_fact_1998:1998 年库存情况 monthly_rates:每月库存出货比例 PCT Ownership fact rates:出货库存比例 salary:薪水表 sales_fact_1997:1997 销售表 sales_fact_1998:1998 销售表 sales_fact_dec_199:1998.12 销售表 warehouse_inventory:仓库存货表 使用SQL Server Business Intelligence Development Studio 对上述数据建立数据立方体,并进行数据挖掘分析,挖掘的知识类型不限,将挖掘过程和结果形成实验报告。 【实验内容】 (1) 利用给定的数据库,新建一个数据挖掘项目; (2) 依次建立数据源,数据源视图,维度,多维度数据集,挖掘机构; (3) 选择不同的算法对挖掘的结果进行分析,预测. (4) 根据以上分析,提出可以执行的决策 【实验步骤】 (1) 新建一个数据源,我们使用给定的食品加工数据库。 (2) 根据数据源,建立数据源视图; 数据库中各个表的关系如下(部分截图): (3)新建维度,选择 time_by_day (4)新建多维数据集 之后数据源视图如下(部分): (5) 建立数据挖掘结构,选择使用了Microsoft决策树析 其中customer表作为事例。 选择预测年收入 测试数据百分比选择为默认的30% 得到如下决策树 年收入依赖的数据关系为 通过分析例如当条件为:“Education = 'High School Degree' and Occupation = 'Manual' and Member Card 不等于 'Normal'”时 年收入分布如下 当条件为:“Education = 'Bachelors Degree' and Member Card = 'Normal' and Num Cars Ow ned = 0”时 年收入分布如下 当选择预测值为$3 0 k --$5 0 k 时提升图为: 拟合分数为0 .9 7 拟合较好 分类矩阵如下: 从图中可以看出$1 0 k --$3 0 预测准确率最高

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部