电脑桌面
添加小米粒文库到电脑桌面
安装后可以在桌面快捷访问

南开19春学期(1709、1803、1809、1903)《数据挖掘》在线作业(突破训练)精品VIP专享VIP免费

南开19春学期(1709、1803、1809、1903)《数据挖掘》在线作业(突破训练)精品_第1页
南开19春学期(1709、1803、1809、1903)《数据挖掘》在线作业(突破训练)精品_第2页
南开19春学期(1709、1803、1809、1903)《数据挖掘》在线作业-2一、单选题共20题,40分1、()用替代的、较小的数据表示形式替换原数据。A维归约B数量归约C离散D聚集【南开】答案是:B2、只有非零值才重要的二元属性被称作()。A计数属性B离散属性C非对称的二元属性D对称属性【南开】答案是:C3、职位可以按顺序枚举,对于教师有:助教、讲师、副教授、教授。职位属性是()。A标称属性B序数属性C数值属性D二元属性【南开】答案是:B4、()去掉数据中的噪声,这类技术包括分箱、回归和聚类。A光滑B聚集C规范化D属性构造【南开】答案是:A5、在基于规则分类器的中,依据规则质量的某种度量对规则排序,保证每一个测试记录都是由覆盖它的“最好的”规格来分类,这种方案称为()。A基于类的排序方案B基于规则的排序方案C基于度量的排序方案D基于规格的排序方案【南开】答案是:B6、分位数是取自数据分布的每隔一定间隔上的点,把数据划分成基本上大小相等的连贯集合。如:4-分位数是()个数据点,它们把数据分布划分成4个相等的部分,使得每部分表示数据分布的四分之一。A1B2C3D4【南开】答案是:C7、决策树学习:决策树算法对数据处理过程中,将数据按()结构分成若干分枝形成决策树,从根到树叶的每条路径创建一个规则。A树状B网状C星形D雪花形【南开】答案是:A8、以下属于可伸缩聚类算法的是()。ACUREBDENCLUECCLIQUEDOPOSSUM【南开】答案是:A9、()将两个簇的邻近度定义为不同簇的所有点对的平均逐对邻近度,它是一种凝聚层次聚类技术。AMIN(单链)BMAX(全链)C组平均DWard方法【南开】答案是:C10、如果规则集R中不存在两条规则被同一条记录触发,则称规则集R中的规则为()。A无序规则B穷举规则C互斥规则D有序规则【南开】答案是:C11、()是KDD。A数据挖掘与知识发现B领域知识发现C文档知识发现D动态知识发现【南开】答案是:A12、在有关数据仓库测试,下列说法不正确的是()。A在完成数据仓库的实施过程中,需要对数据仓库进行各种测试。测试工作中要包括单元测试和系统测试B当数据仓库的每个单独组件完成后,就需要对他们进行单元测试C系统的集成测试需要对数据仓库的所有组件进行大量的功能测试和回归测试D在测试之前没必要制定详细的测试计划【南开】答案是:D13、假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用等频(等深)划分成四个箱时,15在第()个箱子内。A第一个B第二个C第三个D第四个【南开】答案是:B14、决策树中不包含以下哪种结点?()A根结点(rootnode)B内部结点(internalnode)C外部结点(externalnode)D叶结点(leafnode)【南开】答案是:C15、()是说属性的最低和最高值之间没有缺失的值,并且所有的值还必须是唯一的A唯一性规则B连续性规则C空值规则D解释性规则【南开】答案是:B16、在()的数据集上挖掘将更有效,而且会产生相同或几乎相同的分析结果。A归约后B集成后C离散后D规范后【南开】答案是:A17、检测一元正态分布中的离群点,属于异常检测中的基于()的离群点检测。A统计方法B邻近度C密度D聚类技术【南开】答案是:A18、假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,问题:使用按箱平均值平滑方法对上述数据进行平滑,箱的深度为3。第二个箱子值为()。A18.3B22.6C26.8D27.9【南开】答案是:A19、OLAM技术一般简称为“数据联机分析挖掘”,下面说法正确的是()。AOLAP和OLAM都基于客户机/服务器模式,只有后者有与用户的交互性B由于OLAM的立方体和用于OLAP的立方体有本质的区别C基于WEB的OLAM是WEB技术与OLAM技术的结合DOLAM服务器通过用户图形借口接收用户的分析指令,在元数据的知道下,对超级立方体作一定的操作【南开】答案是:D20、以下哪项关于决策树的说法是错误的?()A冗余属性不会对决策树的准确率造成不利的影响B子树可能在决策树中重复多次C决策树算法对于噪声的干扰非常敏感D寻找最佳决策树是NP完全问题【南开】答案是:C二、多选题共10题,20分1、现实世界的数据一般是()。数据预处理技术可以改进数据的质量,提高挖掘过程的准确率和效率。A脏的B...

1、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
3、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。

碎片内容

确认删除?
VIP
微信客服
  • 扫码咨询
会员Q群
  • 会员专属群点击这里加入QQ群
客服邮箱
回到顶部