doc文档 最新数据仓库和数据挖掘题库

教育专区 > 教学研究 > 教学计划 > 文档预览
10 页 1267 浏览 18 收藏 4.7分

摘要:一、填空题(2×10=20分)1、数据仓库就是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合。2、元数据是描述数据仓库内数据的结构和建立方法的数据,它为访问数据仓库提供了一个信息目录,根据数据用途的不同可将数据仓库的元数据分为技术元数据和业务元数据两类。3、数据处理通常分成两大类:联机事务处理和联机分析处理。4、ROLAP是基于关系数据库的OLAP实现,而MOLAP是基于多维数据结构组织的OLAP实现。5、调和数据是存储在企业级数据仓库和操作型数据存储中的数据。6、数据抽取的两个常见类型是静态抽取和增量抽取。静态抽取用于最初填充数据仓库,增量抽取用于进行数据仓库的维护。7、维度表一般由主键、分类层次和描述属性组成。对于主键可以选择两种方式:一种是采用自然键,另一种是采用代理键。7、雪花型模式是对星型模式维表的进一步层次化和规范化来消除冗余的数据。8、数据仓库中存在不同综合级别的数据。一般把数据分成4个级别:早期细节级当前细节级、轻度综合级和高度综合级。9、数据仓库的概念模型通常采用信息包图法来进行设计,要求将其5个组成部分(包括名称、维度、类别、层次和度量)全面地描述出来。10、确定了数据仓库的粒度模型以后,为提高数据仓库的使用性能,还需要根据用户需求设计聚合模型。11、粒度是对数据仓库中数据的综合程度高低的一个衡量。粒度越小,细节程度越高,综合程度越低,回答查询的种类越多。12、数据仓库的数据量通常较大,且数据一般很少更新,可以通过设计和优化索引结构来提高数据存取性能。13、聚类分析包括连续型、二值离散型、多值离散型和混合类型4种类型描述属

温馨提示:当前文档最多只能预览 5 页,若文档总页数超出了 5 页,请下载原文档以浏览全部内容。
本文档由 匿名用户2022-08-29 23:36:46上传分享
你可能在找
  • 数据仓库与数据挖掘期末综合复习第一章1、数据仓库就是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合。 2、元数据是描述数据仓库内数据的结构和建立方法的数据,它为访问数据仓库提供了一个信息目录,根据数据用途的不同可将数据仓库的元数据分为技术元数据和业务元数据两类。 OLAP技术的有关概念:OLAP根据其存储数据的方式可分为三类:ROLAP、MOLAP、HOLAP6、数据仓库按照其开发过程,其关键环节包括数据抽取、数据存储与管理和数据表现等。
    4.7 分 27 页 | 2.00 MB
  • 业务驱动任何需求均来源于业务,业务决定了需求,需求分析的正确与否是关系到项目成败的关键所在,从任何角度都可以说项目是由业务驱动的所以数据仓库项目也是由业务所驱动的.但是数据仓库不同于日常的信息系统开发, 除了遵循其他系统开发的需求,分析,设计,测试等通常的软件声明周期之外;他还涉及到企业信息数据的集成,大容量数据的阶段处理和分层存储,数据仓库的模式选择等等,因此数据仓库的物理模型异常重要,这也是关系到数据仓库项目成败的关键 .数据仓库的结构总的来说是采用了三级数据模型的方式:概念模型:也就是业务模型,由企业决策者,商务领域知识专家和IT专家共同企业级地跨领域业务系统需求分析的结果.逻辑模型:用来构建数据仓库的数据库逻辑模型
    4.9 分 5 页 | 20.96 KB
  • 131003姓名学号[MISSINGIMAGE]实验课程数据挖掘指导教师刘建伟实验项目实验设备及器材数据集成、变换、归约和离散化计算机一台实验日期2016-55同实验者一实验目的掌握数据集成、变换、归约和离散化二实验分析从初始数据源出发 ,总结了目前数据预处理的常规流程方法,提出应把源数据的获取作为数据预处理的一个步骤,并且创新性地把数据融合的方法引入到数据预处理的过程中,提出了数据的循环预处理模式,为提高数据质量提供了更好的分析方法, 保证了预测结果的质量,为进一步研究挖掘提供了较好的参考模式。
    4.8 分 4 页 | 96.81 KB
  • ——老子这里简单谈谈数据库连接引擎那点事儿在数据库实际操作过程中,我们很少涉及到数据库引擎对象的事情,一般情况在创建数据库的时候都使用默认的InnoDB数据库引擎,那么到底什么是数据库引擎,有什么样的数据库引擎 ,在实际使用的过程中都有什么主意事项,为什么InnoDB作为默认的数据库引擎,都是我们需要特别注意但是不需要太多操作的问题! 1.什么是数据库引擎数据库引擎定义了数据库存储数据的数据结构特点,主要通过指定的数据库引擎对象来限制数据库操作数据不同方式的效率、锁和事务的支持、数据全文检索的支持、数据集的缓存操作等等特性。
    4.8 分 2 页 | 13.11 KB
  • 数据银行认证模拟题目备注:1.因答案顺序可能存在差异,请确认答案内容后根据推荐答案进行选择。 2.认证题目是不断更新的,极有可能出现相似题面但指向不同答案,答题时请确认题目及答案是否一致3.模拟题目仅供参考,如有雷同纯属巧合单选题(目前已整理137题)1、“新增上传素材中,人群匹配结果数量不得小于 (B)A、正确B、错误(应该是2000条,数据不少于5000条。)
    4.8 分 123 页 | 164.86 KB
  • .2.现有关系数据库如下:学生(学号,姓名,性别,专业,奖学金)。课程(课程号,名称,学分)。学习(学号,课程号,分数)。 用关系代数表达式实现下列1-4小题:1.检索"英语"专业学生所学课程的信息,包括学号、姓名、课程名和分数。П学号,姓名,课程名,分数(σ专业='英语'(学生∞学习∞课程))。 2.检索"数据库原理"课程成绩高于90分的所有学生的学号、姓名、专业和分数。П学号,姓名,专业,分数(σ分数>90∧名称='数据库原理'(学生∞学习∞课程))。
    3.0 分 7 页 | 78.50 KB
  • 北大青鸟中关村数据库Oracleforupdateof和update区别forselect*fromTTable1forupdate锁定表的所有行,只能读不能写2select*fromTTable1wherepkid fromTable1ajoinTable2bona.pkid=b.pkidwherea.pkid=10forupdateofa.pkid只锁定Table1中满足条件的行forupdate是把所有的表都锁定forupdateof根据of
    5.0 分 1 页 | 14.31 KB
  • 作业七索引/视图/同义词/序列一、实验目的掌握索引和视图的管理,掌握同义词和序列的应用。二、实验内容创建、使用和管理索引、视图、同义词、序列。 查看该表的索引定义Step4执行下列语句会出错,请解释原因insertintoemployeevalues(61,'Mike',2800);Step5原因:在name上面建立了索引,而name为Mike的数据已经存在
    5.0 分 7 页 | 104.58 KB
  • 数据库系统概论平时作业2得分一、单项选择题(本大题共20小题,每小题2分,共40分)在每小题列出的四个备选项中只有一个是符合题目要求的,错选、多选或未选均无分。 1.下面列出的数据管理技术发展的三个阶段中,哪个(些)阶段没有专门的软件对数据进行管理? (A)Ⅰ.人工管理阶段Ⅱ.文件系统阶段Ⅲ.数据库阶段A.只有ⅠC.Ⅰ和ⅡB.只有ⅡD.Ⅱ和Ⅲ2.在关系数据库中,表(table)是三级模式结构中的(B)A.外模式B.模式C.存储模式D.内模式第(3)至
    3.0 分 8 页 | 67.00 KB
  • 3.0 分 7 页 | 15.14 KB
本站APP下载(扫一扫)
活动:每周日APP免费下载全站文档
本站APP下载
热门文档