还剩17页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
大数据练习题库(附参考答案)ict
1、关于网络虚拟交换技术的描述,哪一个是错误的?A、基于软件的虚拟交换技术不依赖硬件的高级功能,迁移更灵活B、可以由物理交换机来实现虚拟机间的数据交换C、基于智能网卡的交换可以降低服务器CPU的消耗D、基于物理交换机的虚拟交换迁移灵活,虚拟机迁移不影响虚拟机的快照技术应用答案D
2、在Fusioninsight LibrA中,下面对analyze使用的描述错误的是()O、analyze语句可收集与数据库中表内容相关的统计信息,统计结果存储在A系统表PG_STATISTIC中B、建议对一个刚执行过大批量插入操作的表执行analyze语句,以便使LibrA内的优化器模块根据这些统计数据获得更优的输出,进而影响业务性能C、执行计划生成器会使用PG_STATISTIC表中的统计数据,以生成最有效的查询执行计划D、analyze语句中使用-pop选项,可避免当数据库中数据量过大时内存紧张答案D
3、哪种负载均衡模式支持IPV6能力?、都一样AB、经典型C、独享型D、共享型答案C
4、下列哪个选项可以来判断Hbase表是否存在?A、table.containskeytableNameB、admin,getTab1eTab1eNameC、adminTableExistsTableNamevalueOftabieNameD、adminTableExiststableName答案D
5、以下()组件采用Active-Active高可用模式A、GTMB、WLMC、CN
49、当为多组提供不同业务的弹性云服务器提供虚拟负载均衡时,可在同一虚拟负载均衡上添加最多个监视器,每个监视器用来关联一组提供相同服务的弹性云服务器、10AB、2C、5D、15答案A
50、对象存储服务中单个租户支持创建的桶的最大数量A、90B、80C、100D、50答案C
51、一个对象的离群点得分是该对象周围密度的逆这是基于—的离群点定义、概率AB、密度C、邻近度D、聚类答案B
52、HDFS的设计是以一为主要应用场景A、一次写入、一次读取B、多次写入、多次读取C、一次写入、多次读取D、多次写入、一次读取答案C
53、云硬盘备份的数据会存放至以下哪个云服务中?A、云硬盘服务B、对象存储服务C、裸金属服务器D、弹性云服务器答案B
54、负载均衡系统是基于cookie的会话保持,http cookie的有效期为0小时?A、48B、12C、24D、4答案C
55、当机器学习把训练样本自身特点当作所有潜在样本特点,导致泛化性能下降,这种现象在机器学习中称为
(一)oA、误差B、偏差C、过拟合D、欠拟合答案C
56、自动作业(AutoOps)作业管理不支持以下哪个执行策略?A、手动执行B、定时单次执行C、随机执行D、周期执行答案C
57、以下哪个选项不是ECS实例的类型?A、计算密集型B、弹性伸缩型C、内存密集型D、通用型答案B
58、非OBS管理员用户如果要具有指定OBS权限,都要由()来统一授权A、VDC管理员B、VDC业务员C、VDC只读管理员D、自定义角色用户答案A
59、用户修改物理专线时,可以修改以下哪些参数?、对端地址AB、区域C、带宽D、名称答案D
60、Redis中数据排序的性能优化不包含以下哪个选项?、如果要排序的数据数量很大,尽可能使用store参数将结果缓存AB、减少待排序链中元素的数量C、增加集群中Master节点D、使用limit参败只获取需要的数据答案C
61、Fusioninsight HD支持通过:方式提交Oozie作业、Sheell命令AB、Java APIC、Java APID、Rest API答案ABCD
62、以下关于Hbase文件存储模块描述正确的有、应用在Fusioninsight HD的上层应用AB、HFS封装了Hbase与HDFS的接口C、为上层应用提供文件存储、读取、删除等功能D、HFS是Hbase的独立模块答案ABCD
63、数据复制服务提供的实时迁移功能,适用于以下使用场景A、跨云平台数据库迁移B、云内数据库迁移出云C、云下数据库迁移上云D、VPC网络内数据库迁移答案ABCD
64、DRS是一种易用、稳定、高效、用于的云服务、数据库在线迁移AB、数据库实时同步C、数据库备份D、数据库恢复答案AB
65、关于python中函数调用的目的,下列说法正确的是—A、减少程序文件所占用的内存B、提高程序的执行效率C、提高程序的可读性D、提高程序的开发效率答案BCD
66、HDFS不适用于以下()场景A、流式数据访问B、大量小文件存储C、大文件存储与访问D、随机写入答案BD
67、可以在云管平台的()界面直接申请创建Redis实例A、分布式缓存DCS服务界面B、弹性伸缩管理界面C、eSight管理界面D、ServiceStage管理界面答案AD
68、ElasticSearch支持的gateway类型有?A、HDFSB、本地文件系统C、Amazon83D、Amazon85答案ABC
69、以下能表示为布尔类型“真”值的是()A、tB、VC、JD、丁答案ABCD70Zookeeper可以为Fusioninsight HD中的()组件提供分布式管理支持A、HiveB、LoaderC HbaseD、Spark答案ACD
71、弹性负载均衡支持()协议A、TCPB、HTTPC、UDPD、HTTPS答案ABCD
72、HBase适用于下列哪些应用场景?、图片数据存储AB、银行交易系统C、消息中间件D、商品数据存储答案:ABD
73、在创建租户的同时可以对()部分进行设置A、选择资源池B、设置资源配额C、申请云服务D、部署应用答案AB
74、账号登录策略有()、会话超时策略AB、用户启用策略C、用户锁定统计周期D、用户锁定时长答案ACD
75、整库迁移支持的源端数据源类型有()A、HiveB、MySQLC、DWSD、Oracle答案ABCD
76、如果要设计好一个数据库,需要考虑()方面、合理的数据分布AB、必要的表分区设计C、适当的存储模式D、良好的数据库逻辑设计4答案ABCD
77、下面()属于Kafka的使用场景A、流量削峰B、应用解耦C、异步处理D、日志处理答案ABCD
78、以下选项中属于数据科学家必备的核心能力包括
(一)oA、数据的ETL转换B、数据产品开发能力C、基于数据提出好的研究假设或问题,并完成对应的试验设计D、数据库/数据仓库的维护答案BC
79、云计算平台的特点()A、大型的集中计算B、基于互联网C、虚拟化D、按需使用答案ABCD
80、以下关于VDC管理权限说法正确的是()A、VDC管理员可以创建一级VDC以及以下VDC,并设置配额B、用户组创建成功后,VDC管理员可以给用户组关联或者解关联项目C、VDC管理员具有所属VDC及下级VDC运营管理的权限,以及对所属VDC及下级VDC云服务资源的申请和管理权限D、VDC管理员可以查看本省资源性能容量的详情和统计分析报表,自动化生成和发布答案BCD
81、只有数据资源处于()状态,才可以更新、注册AB、发布C、已创建D、更新答案ABD
82、项目VDC下用户角色包括()A、VDC管理员B、VDC业务员C、VDC只读管理员D、OBS只读用户答案ABCD
83、物理资源监控可以对资源的数据进行查看、历史性能数据AB、实时性能数据C、虚拟机数据D、应用数据答案ABCD
84、物理资源监控-网络资源监控可以对资源进行监控、路由器AB、防火墙C、交换机D、负载均衡答案ABCD
85、创建CCE集群时创建安全组A、集群名称-cce-master-随机数B、集群名称-cce-node-随机数C、集群名称-cce-control-随机数D、cce-control-随机数答案BC
86、以下说法正确的是A、代维管理员可以进入被代维的多个一级VDC进行代维,其权限相当于一级VDC管理员B、运营管理员可负责全局的云服务进行管理,如云服务定义、上线、发布等管理C、VDC管理员负责本级及下级VDC管理,为下级VDC设置资源配额、Region范围、资源池范围、云服务权限等D、运营管理员可以创建、查看、删除、导出应用等答案ABC
87、关于Kafka的Peoducer,如下说法正确的是A、Producer生产数据时需要先连接ZooKeeper,而后才连接BrokerB、可以同时起多个Producer进程向同一个Topic进行数据发送C、Producer是消息生产者D、Producer生产数据需要指定Topic答案BCD
88、关于数据订阅订阅数据变更类型,正确的是A、deleteB、insertC、updateD、replace答案ABCD
89、下列选项属于Fusioninsight数据安全性A、操作系统安全加固B、组件数据加密C、数据完整性校验D、用户权限认证管理答案BC
90、对象存储服务Object StorageService,OBS是基于对象的海量存储服务,为客户提供的数据存储能力、海量AB、安全C、高可靠D、低成本答案ABCD91Kafka Consumer写数据的总体流程是,Consumer连接指定的TopicPartition所在的LeaderBroker,用主动的方式从Kafka中获取消息、正确AB、错误答案A
92、租户是进行资源分配的单位,一个租户下可以创建多个一级VDC、正确AB、错误答案B
93、ElasticSearch所采用的排序方式,是通过Value找Key,而在全文搜索中Value就是我们要搜索的关键词,通过Value找到对应的文档、正确AB、错误答案A
94、数据核验可以通过自动和手动执行核验过程,可以选择sql或存储过程A、正确B、错误答案A
95、HBase过滤器能将列名或列值设置为过滤条件,同时支持多个过滤器配合使用、正确AB、错误答案A
96、导入数据字典的excel中,字典类型代码在系统中不存在且在excel中不存在,否则导入失败、正确AB、错误答案A
97、Hive中union all操作符用于合并两个或多个select语句的结果集,结果集中,不允许有重复值A、正确B、错误答案B
98、修改视图时可以修改视图的表空间A、正确B、错误答案B
99、二级索引为Hbase提供了按照某些列的值进行索引的功能,二级索引先查表索引,在定位到数据表中的位置,不需要全表扫描A、正确B、错误答案A
100、使用裸金属服务器VHA的约束与限制不支持Windows镜像、正确AB、错误答案AD、DN答案C
6、在分类问题中,经常会遇到正负样本数据量不等的情况,比如正样本为100万条数据,负样本只有1万条数据,以下最合适的处理方法是一oA、将负样本重复100次,生成100万样本量,打乱顺序参与分类B、直接进行分类,可以最大限度利用数据C、将负样本每个权重设置为100,正样本权重为1,参与训练过程D、从100万正样本中随机抽取1万参与分类答案C、FusionlnsightHD系统中,不属于集群节点的磁盘分区7A、OS分区B、数据分区C、元数据分区D、管理分区答案D
8、日志管理的作用不包括下列哪项A、审计用户行为B、攻击溯源C、日志存储D、运维故障分析答案A
9、关于数据相关性,以下说法错误的是一oA、相关性体现了大数据的灵魂B、相关性思维实现了从“为什么”到“是什么”的思维转变C、相关性关注事物的因果关系D、相关性关注事物的相关关系答案C
10、下列关于存储过程的特点说法正确的是A、用户创建的存储过程或自定义函数可以重复调用,因此数据传输量少B、编写的SOL存储在数据库中,因此执行速度快C、通过指定存储过程的访问权限,因此安全系数高D、创建时编译,执行时调用,因此开发效率高答案C
11、Kubernetes创建或部署的最小单位是A、JobB、PodC、ServiceD、Docker答案B
12、假设属性income的最大最小值分别是98000元和12000元利用最大最小规范化的方法将属性的值映射到0至1的范围内对属性income的73600元将被转化为
(一)o、
1.45AB、
1.224C、
0.716D、
0.821答案C
13、距离超平面最近的几个训练样本称为支持向量,两个异类支持向量到超平面的距离之和为
(一)oA、误差B、距离C、偏差D、间隔答案D
14、如果虚拟机要和其他虚拟机通讯,下列哪个选项的操作是必须的?A、需要在物理交换机上配置端口绑定B、需要为虚拟机添加至少一块网卡C、需要将虚拟机所在的物理服务器联网D、需要在物理服务器上配置端口绑定答案B
15、云硬盘不支持哪项管理操作?A、备份B、减容C、挂载/卸载D、扩容答案A
16、
(一)表达了在当前任务上任何学习算法所能达到的期望泛化误差的下界,即刻画了学习问题本身的难度A、偏差B、噪声C、泛化误差D、方差答案B
17、发布基于Docker的容器应用,包含应用构建、配置信息的部件是什么?A、Docker imageB、Docker registryC、DockerfileD、Docker Hub答案c
18、以下哪种情况下部署的弹性云服务器之间的网络时延一定是最短的?、同一可用区内AB、同一安全组中C、同一VPC中D、同一区城内答案A
19、Hive中的解释器complier优化器optimizer、执行器executor组件用于HOL语句从词法分析、语法分析、编译、优化以及查询计划生成生成的查询计划将存储在在中,并在随后由调用执行A、HDFS、MapReduceB、内存、MapReduceC、HBase YarnD、HDFS、Yarn答案A
20、0中引入了0的概念,它为用户提供了一个统一的切入点来使用Spark的各项功能A、SparkTextB、SparkcontextC、SparkConfD、SparkSession答案D
21、关于Fusioninsight HDStreaming的Supervisor描述正确的是o、Supervisor负责资源的分配和任务的调度AB、Supervisor负责接受Nimbus分配的任务,启动停止属于自己管理的Worker进程C、Supervisor是运行具体处理逻辑的进程D Supervisor是在Topology中接收数据然后执行处理的组件答案B
22、一个租户中最多可包含级VDCA、2B、3C、4D、5答案D
23、关于创建私有镜像,下列说法错误的是?A、已过期的云服务器不能用于申请私有镜像B、软删除的云服务器可以用于申请私有镜像C、加锁的弹性云服务器不能用于申请私有镜像D、用于创建私有镜像的源弹性云服务器数据盘大小必须大于1GB且不超过1024GB答案B
24、对于Boosting算法描述错误的是A、可将强学习器降为弱学习器B、从初始训练集训练基学习器C、对训练样本分布进行调整D、做错的训练样本多次训练答案A
25、以下语言中,不是Spark API设计语言A、ScalaB、JavaC、PythonD、C++答案D
26、下面哪项不属于微服务架构的核心目标A、在线追踪B、灵活部署C、敏捷开发D、精准弹性答案A
27、Flink的哪种机制可以保证task运行失败时,其状态能够恢复?A、窗口B、时间时间C、有状态处理D、检查点答案D
28、若上传镜像过大,上传时长超过系统限定时间分钟且没有任何页面交互,平台会自动注销而导致上传镜像失败A、35B、15C、45D、20答案C
29、由于日志存储在0BS中会占用用户额外的存储空间配额,A、默认情况下,不会为用户的桶收集访问日志B、默认情况下,会为用户的桶收集访问日志C、日志数据会保存在关系型数据库中D、日志会保存在云硬盘中答案A
30、申请CCE服务后master集群默认有多少个节点?A、2B、3C、4D、5答案B
31、构造了一个词表{
1.“小明”
2.“喜欢”
3.“踢”
4.“看”
5.“足球”
6.“篮球”
7.“电影”},利用上述词表的索引号,文档{小明喜欢踢足球}可以用一个7维向量表示[—]A、11111001110100C.1111111D1101001答案B
32、关于冗余物理专线的描述,以下错误的是?A、冗余物理专线更加可靠,防止意外发生,保障业务平稳进行B、冗余专线需要用户自己设置主物理专线和备物理专线C、当一条物理专线出现故障时,系统会自动切换到另外一条物理专线中D、当两条专线接入同区域的不同接入点时,则两条物理专线互为冗余答案B
33、在DRS中,以下迁移任务命名错误的是()A、ABCedB、ab-cdC、abcdOOlD、abcdttOOl答案D
34、在有N个节点Fusioninsight HD集群中部署HBase时、推荐部署()个HMaster进程,()个Region Server进程、
3、NAB、N、NC、
2、ND、
2、2答案C
35、执行引擎的类型包括()、行执行引擎AB、向量化执行引擎C、行列混合执行引擎D、以上都是答案D
36、DAYU数据开发中,以下不属于作业优先级是()A、高B、中C、极高D、低答案C
37、关于循环神经网络设计的叙述中,错误的是
(一)A、基于参数共享思想B、循环神经网络不可应用于图像数据C、基于图展开思想D、能处理可变长度的序列答案B
38、下列哪项标准或条例对隐私保护做了规范要求()A、信息安全等级保护B、ITSECC、IS027000D、GDPR答案D
39、一般情况下,若要提高Elasticsearch检索效率,可以采取什么操作A、增加EsMaster节点B、使用Hive做底层存储C、调整索引分片数D、压缩索引答案C
40、()根据后端服务器的权重,按顺序依次将请求分发给不同的服务器、连接ID算法AB、加权最少连接C、源IP算法D、加权轮询算法答案D
41、如果需要由数据生产者决定数据发送给目标Blot的某一个确定的Task,应该选择以下()消息发布策略A、局部字段分组B、广播分组C、直接分组D、全局分组答案C
42、针对4层(TCP协议)服务,负载均衡系统是基于0的会话保持A、cookieB、sessionC、ipD、不涉及答案C
43、对连续图像的离散化采样决定了图像的(—)A、灰度值B、时间分辨率C、地面分辨率D、空间分辨率答案D
44、Flink的数据转换操作在环节中完成A、channelB、TransformationC、sinkD source答案B
45、laaS服务不提供以下那种服务能力?、中间件服务AB、网络服务C、存储服务D、计算服务答案A
46、关于垃圾邮件过滤黑白名单描述错误的是A、黑名单优先级高于白名单B、在“白名单”文本框中输入要加入白名单SMTP Server的IP地址和掩码,可以输入多个IP地址,一个IP地址一行C、在“黑名单”文本框中输入要加入黑名单SMTP Server的IP地址和掩码,可以输入多个IP地址,一个IP地址一行D、配置本地黑名单/白名单可以同时配置黑名单和白名单,也可以只配置其中的一项答案A
47、以下哪种情况可能导致云硬盘无法删除?、云硬盘为系统盘AB、云硬盘为应用创建C、云硬盘已挂载到云主机D、云硬盘经过过户操作答案C
48、伸缩组在冷却时间内,会拒绝由触发的伸缩活动A、安全策略B、告警策略C、定时策略D、周期策略答案B。