第 1 页:单选题 |
第 4 页:应用题 |
第 5 页:设计与应用题 |
21现有一个大型咨询公司的数据库应用系统,每个部门都要生成大量的全局报表并执行少量的更新操作。随着数据量的增加,系统出现了性能瓶颈。鉴于各个部门地理上是分散的,公司希望采用分布式数据库技术解决该问题。下列数据分配方式中最适合该应用的是( )。
A.集中式B.分割式C.复制式D.混合式
参考答案:C
参考解析:集中式是指所有的数据片断都安排在一个场地上。分割式是指所有全局数据只有一份,它们被分割成若干片断,每个片断被分配在一个特定的场地上。全复制式是指全局数据有多个副本,每个场地上都有一个完整的数据副本。混合式是指全局数据被分为若干个数据子集,每个子集都被安排在一个或多个场地上,但是每个场地未必保存所有数据。以上四种分配方式各有千秋,但复制式在每个分场都有完整的的数据,这样大大减少了各部门对全局数据的访问。因此采用复制式数据分配能够提高每个场地的响应速度。
22设某数据库服务器中配置有2300GB和1块500GB的硬盘,为了保证可靠性,数据库管理员在3块硬盘上建立了RAID5。建立RAID5后,可用的磁盘空间为( )。
A.1100GBB.600GBC.300GBD.500GB
参考答案:B
参考解析:Raid5需要3块硬盘,并把数据和相对应的奇偶校验信息存储到组成raid5的各个磁盘上。其中任意N一1块磁盘上都存储完整的数据,也就是说有相当于一块磁盘容量的空间用于存储奇偶校验信息。因此可用空间为300+300=600G。
23下列哪一条不是数据仓库的基本特征( )。
A.反映当前准确数据
B.数据是相对稳定的
C.数据是集成的
D.数据是面向主题的
参考答案:A
参考解析:数据仓库有四个特点:
①面向主题,操作型数据库的数据组织面向事务处理任务,各个业务系统之间各自分离,而数据仓库中的数据按照一定的主题域进行组织。主题是一个抽象概念,是指用户使用数据仓库进行决策时所关心的重点方面,一个主题通常与多个操作型信息系统相关;
②集成的,面向事务处理的操作型数据库通常与某些特定的应用相关,数据库之间相互独立,并且往往是异构的。而数据仓库中的数据是在对原有分散的数据库数据抽取、清理的基础上经过系统加工、汇总和整理得到的,必须消除源数据中的不一致性,以保证数据仓库内的信息是关于整个企业的一致的全局信息;
③稳定的,操作型数据库中的数据通常实时更新,数据根据需要及时发生变化。数据仓库的数据主要供企业决策分析之用,所涉及的数据操作主要是数据查询,一旦某个数据进入数据仓库以后,一般情况下将被长期保留,也就是数据仓库中一般有大量的查询操作,但修改和删除操作很少,通常只需要定期的加载、刷新;
④反映历史变化,操作型数据库主要关心当前某一个时间段内的数据,而数据仓库中的数据通常包含历史信息,系统记录了企业从过去某一时点(如开始应用数据仓库的时点)到目前的各个阶段的信息,通过这些信息,可以对企业的发展历程和未来趋势做出定量分析和预测。
24分布式数据库系统的“分片透明性”位于( )。
A.全局模式与全局概念模式之间
B.分片模式与分配模式之间
C.全局概念模式与分片模式之问
D.分配模式与局部概念模式之间
参考答案:C
参考解析:分布式数据库系统按不同层次提供的分布透明性有:分片透明性、位置透明性、局部数据模型透明性。其中分片透明性是分布式数据库中最高层次的分布透明性,位于全局概念模型和分片模型之间。用户编写程序只须对全局关系进行操作,不必考虑数据的分片及存储场地。当分片模式改变时,只须改变全局概念到分片模式的映象,而不会影响全局概念模式和应用程序,即实现了分片透明性。
25事务日志用于保存( )。
A.程序运行过程B.程序的执行结果C.对数据的更新操作D.数据操作
参考答案:C
参考解析:事务日志是一个与数据库文件分开的文件。它存储对数据库进行的所有更改,并记录全部插入、更新、删除、提交、回退和数据库模式变化等操作。事务日志是数据备份和数据恢复的重要文件,也是使用SQL Remote或[复制代理]复制数据所必需的。
26在并行数据库中,有关系R(A,B.和S(A,C.,需要将它们根据A属性拆分到不同的磁盘上。现有查询SELECT B FROM R,S WHERE R.A=S.A。下列拆分方式中最适合该查询的是( )。
A.轮转法B.散列划分C.范围划分D.列表划分
参考答案:B
参考解析:轮转法:对关系顺序扫描,将第i个元组存储到标号为Di mod n的磁盘上,该方式保证了元组在多个磁盘上均匀分布。散列划分:选定一个值域为{0,1,…,n-1}的散列函数,对关系中的元组基于划分属性进行散列,如果散列函数返回i,则将其存储到第i个磁盘。范围划分:根据表中某个属性取值区间划分成不同的子区间,然后根据表中的属性值所属的不同区间将表分成不同的子表。根据属性A对表进行散列划分,然后在每个划分内部执行select语句,会大幅提高查询效率。
27在对某商场的顾客进行流失预测分析时,先取得一个顾客样本集S,其模式为(id,a1,a2,…,an,c),其中id为顾客的唯一标识,ai(i=1,2,…,n)为顾客的属性,如年龄、性别、消费时间间隔等,c的取值为{流失,未流失}。现有算法A对样本S进行处理,输出结果为P,P能根据该样本集外的顾客u的n个属性,确定u的c属性值,以对顾客的流失作出预测。那么,A和P分别是( )。
A.聚类算法,聚类工具
B.分类算法,分类器
C.关联规则算法,规则集
D.多维分析算法,OLAP工具
参考答案:B
参考解析:由于有样本集和测试集之分,又有已有的类别标签,所以属于监督学习。分类:通过学习得到一个目标函数f,把每个属性集x映射到一个预先定义的类标号y。分类属于监督学习。聚类:根据在数据中发现的描述对象及其关系的信息,将数据对象分组,组内的对象相互之间是相似的,而不同组中的对象则不同。组内的相似性越大,组间差别越大,聚类就越好,属于无监督学习。关联规则挖掘:发现隐藏在大型数据集中的有意义的联系。多维分析是指各级管理决策人员从不同的角度、快速灵活地对数据仓库中的数据进行复杂查询多维分析处理。根据题意显然是符合分类。所以选B。
28设在SQLServer 2008某数据库中建有如下会员卡表:
CREATE TABLE Table_Card(
CardID char(4)PRJMARY KEY,
StartDate datetime NOT NULL,
Score int NOT NULL DEFAULT 0,
State int NOT NULL CHECK(State in(0,1,2))
)
现表中无数据,某用户对此表依次进行了如下操作:
Ⅰ.INSERT INTO Table_Card
VALUES(ˊ1001ˊ,ˊ2012-1-1 12:30:01ˊ,154,0)
Ⅱ.INSERT INTOTable_Card(CardID,StartDate,State)
VALUES(ˊ1002ˊ, ˊ2012-1-1 12:30:02ˊ,1)
Ⅲ.INSERTINTO Table_Card
VALUES(ˊ1003 ˊ,ˊ2012-1-1 12:30:03ˊ,172,2)
IV.INSERT INTO Table_Card
VALUES(ˊ1004 ˊ,ˊ2012-1-1 12:30:04ˊ,135,3)
Ⅴ.UPDATE Table Card SETState=3 WHERE CardID=ˊ1001ˊ
Ⅵ.UPDATE Table Card SETState=1 WHERE CardID=ˊ1004ˊ
以上操作对Table_Card表数据产生影响的是( )。
A.仅Ⅰ、Ⅱ和ⅢB.仅Ⅰ、Ⅴ和ⅥC.仅Ⅰ、Ⅱ、Ⅲ和ⅥD.仅Ⅲ、Ⅳ、Ⅴ和Ⅵ
参考答案:A
参考解析:Ⅳ中插人字段的第四个字段“3”不满足“CHECK(State in(0,1,2))”的条件,因此插入不成功。V中更新第四个字段“State=3”同样不满足“CHECK(State in(0,1,2))”的条件,更新失败。Ⅵ中
因为没有“CardlD=ˊ1004ˊ”的记录,所以更新失败。
29在SQL Server 2008中,若希望数据库用户ACCT具有创建数据库对象的权限,较为适合的实现方法是( )。
A.使ACCT只在dbcreator角色中
B.使ACCT只在public角色中
C.使ACCT只在db_owner角色中
D.使ACCT只在db_ddladmin角色中
参考答案:A
参考解析:dbcreator角色具有创建、删除、修改和还原数据库对象的权限,所以可以使ACCT只在dbcreator角色中。
30数据挖掘可以简单地理解为从大量的数据中发现或挖掘知识。设某公司的客户关系管理系统中有客户表A(CID,v1,v2,…,vn)。给定一个训练集s(v1,v2,…,vn,C.,其中c为客户类别、vi(i=1..n)为客户其他属性。若对表A中任一客户x,要使系统能判定x所属的客户类别,较合理的方案是( )。
A.将x对应的元组中的特征向量(v1,v2,…,vn)与训练集s中的元组进行匹配,从而判定x所属的客户类别
B.对训练集s设计适当的算法,构造一个分类器M,将x对应的特征向量(v1,v2,…,vn)作为M的输入,用M判定X所属的客户类别
C.采用关联规则挖掘算法构成一个关联式分类器M,用M判定x所属的类别
D.采用适当的聚类算法,对表A中的所有元组进行聚类,将每个元组归入训练集S各元组的c列所给出的客户类别中,从而实现X所属客户类别的判定
参考答案:B
参考解析:对于训练集S,测试集A利用数据挖掘中的分类算法,通过训练集构建一个分类器,将测试集A作为分类器输入,经过分类器后会得到相应的类别号。即使相同的类别编号的训练集也可能对应不同的属性集,所以单纯的通过对属性集差别的比较来识别类别不准确,故A错。关联规则挖掘是发现交易数据库中不同商品之间的联系,而本题是对数据进行分类,与题意不符,故C错。D项属于无监督学习算法,对类别并没有规定明确的前提条件,与本题所给的条件无关。综上可知,选项B正确。
相关推荐:
北京 | 天津 | 上海 | 江苏 | 山东 |
安徽 | 浙江 | 江西 | 福建 | 深圳 |
广东 | 河北 | 湖南 | 广西 | 河南 |
海南 | 湖北 | 四川 | 重庆 | 云南 |
贵州 | 西藏 | 新疆 | 陕西 | 山西 |
宁夏 | 甘肃 | 青海 | 辽宁 | 吉林 |
黑龙江 | 内蒙古 |