还剩17页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
大数据试题库(含答案)ict
1、您可以将全部或部分云服务器的详情信息导出至本地,文件格式为()A、.docxB、.xlsC、.docD、.xlsx答案B
2、在Linux日志安全设置中,用户操作日志不包括以下哪项()、账号创建AB、登录是否成功C、口令修改D、权限修改答案B
3、以下不属于马尔可夫随机场模型与条件随机场模型的差别的是
(一)oA、马尔可夫随机场处理条件概率,条件随机场处理联合概率B、马尔可夫随机场处理联合概率,条件随机场处理条件概率C、马尔可夫随机场是生成式模型,条件随机场是判别式模型D、马尔可夫随机场与条件随机场都是无向图模型答案A
4、云计算通过共享()的方法将巨大的系统池连接在一起A、软件B、CPUC、基础资源D、处理能力答案C
5、在云计算平台中,()软件即服务A、QaaSB、SaaSDC、PaaSCD laaSB答案B
6、关于数据服务中,app说法正确的是()A、一个APP只能申请一个API的权限B、一个用户只能创建一个APPC、一个用户可以创建多个APP,一个APP可以申请多个API的权限C、安装驱动包D、配置连接信息答案A
50、下列命令是删除文件A、dfs-rmB dfs-IsC dfs-delD dfs-clear答案A
51、Hadoop中Reducer执行阶段,同一时间执行阶段A、shuffle sortB、shffle reduceCsort reduceD、都不是同时进行答案A
52、Dockerfile中RUN指令的意思是?A、指定基础镜像B、为镜像指定标签C、容器启动时要运行的命令D、运行指定的命令答案D
53、下面关于当前告警描述错误是A、已确认已清除的告警B、未确认未清除的告警C、未确认已清的除告警D、已确认未清除的告警答案A
54、将python中的.py文件转换为.pyc文件的组件为A、解释器B、编辑器C、编译器D、虚拟机答案C
55、Hive是基于Hadoop的数据仓库软件,最大可以查询有管理级别的分布式数据A、PBB、GBC、MBD、TB答案A
56、关于应用改造上云,以下说法正确的是A、不涉及应用代码改造,只涉及系统应用配置与接口调整B、将应用接入层Web服务器,应用逻辑层即应用中间件层,包括JAVA环境、中间件、应用程序包打包在容器中,通过云平台进行自动化部署和发布C、将支撑业务应用的IT子系统计算、存储、网络、负载均衡等,从现有的物理机或虚拟机环境迁移到云平台的虚拟化环境D、主要针对新建业务应用或新建模块,利用云平台进行微服务开发,单个微服务是处理某一特定业务逻辑的最小单元,单个微服务是高内聚的,微服务之间是松耦合的答案D
57、以下不属于微服务治理策略的是()A、负载均衡B、重试C、流控D、事务答案D
58、Fusioninsight HD系统中,下面()方法不能查看到Loader作业的执行结果、通过Loader UI界面查看AB、通过YARN任务管理查看C、通过NodeManager查看D^通过Manager的告警查看答案C
59、海量数据存储与离线分析场景中,不会用到以下哪个组件?A、FlinkB、CDMC、IIDFSD、MapReduce答案A
60、以下()选项属于Fusioninsight SparkSQL的优点A、稳定和高性能B、SQL兼容性C、支持数据插入,更新和删除D、以上全部正确答案D
61、Spark适用于以下()场景A、图计算B、批处理C、实时流处理D、交互式查询答案ABCD
62、以下哪些选项是ElasticSearch主节点EsMaster功能?、参与新建索引AB、参与删除索引C、参与文档数据搜索D、参与文档数据变更答案AB
63、在产品选型时,数据中台逻辑架构中分析层要重点关注产品的特点包含()方面、强大的OLTP能力AB、批量删除能力C、强资源隔离能力D、高并发的查询能力答案CD
64、对于HBase rowkey的设计原则,如下描述正确的是()A、访问权重高的属性值放在RowKey前面访问权重高的属性值放在Rowkey后半部分C、离散度好的属性值放在Rowkey前半部分D、离散度好的属性值放在Rowkey后半部分答案AC
65、以下关于L1范数和L2范数正则化的描述中正确的是(—)、L1正则化容易增加欠拟合风险AB、L1比L2更易于获得稀疏解C、L2正则化容易增加过拟合风险D、两者都有助于降低过拟合风险答案BD
66、数据目录工具都有()角色A、普通用户B、数据管理员C、数据维护员D、系统管理员答案ABCD
67、使用裸金属服务器VHA的约束与限制正确的选项是()、支持FCSAN,不支持IP SAN与FusionStorage BlockoAB、生产存储与容灾存储不能是同一套存储C、添加同存储标记后,裸金属服务器挂载的云硬盘必须来自同一套存储D、添加同存储标记后的裸金属服务器才可以申请VHA服务答案ABCD
68、Stream算子可以执行在()组件上A、0MB、CNC、GTMD、DN答案BD
69、和弹性IP相关的操作有()A、解绑B、绑定C、延期D、释放答案ABCD、下列哪些情况下SQL自诊断可以识别,并上报告警信息?70A、大表BroadcastB、SQL语句不下推C、数据倾斜D、Hash Join中大表做内表答案ABCD
71、下列关于Fusioninsight LibrA行存储和列存储的使用场景描述正确的有()A、列存储适用于统计分析类查询(group,join多的场景)B、行存储适用于点查询(返回记录少,基于索引的简单查询)C、列存储适用于点查询(返回记录少,基于索引的简单查询)D、行存储适用于即席查询(查询条件列不确定,行存无法确定索引)答案AB
72、以下关于Zookeeper的Loader选举说法正确的是()A、当实例n为奇数时,假定n=2x+l,则成为leader节点需要x+1票B、Zookeeper选举leader时,需要半数以上的票数C、当实例数为8,则成为leader需要5票,容灾能力为4D、当实例数n为奇数时,假定n=2x+l,则成为leader需要x票答案AB73以下关于ElasticSearch描述正确的是?A、可作为NoSQL数据库使用B、可作为关系型数据库使用C、一个高性能,基于Lucene的全文检索服务D、一个分布式的RestFul风格的搜索和数据分析引擎答案ACD
74、Flink支持的时间操作类型包括以下()选项、结束时间AB、处理时间C、采集时间D、事件时间答案BD
75、关于HDFS中NameNode的作用描述的正确的是?A、管理HDFS的名称空间NameSpaceB、执行数据块的读/写操作C、配置副本策略通常为3份D、处理客户端读写请求答案AD
76、以下属于控制算子的有()A、RecursiveUnoin
8、HashJoinC、AggD Append答案AD
77、以下哪些选项属子实时检索的特点?A、高并发B、查询响应要求较高C、全文检索功能D、处理时间要求不高答案ABC
78、以下关于Fusioninsight网路安全可靠性,说法正确的是()A、阻止外部攻击者通过管理通道入侵实际业务数据B、Fusionlnight支持网路划分为三级集群业务平面、集群管理平面和集群外维护网路彼此之间实施物理隔离C、避免业务平面的高负载阻塞集群管理通道D、网路平面隔离,避免管理与业务贷款抢占,相互干扰答案ABCD
79、弹性云服务的规格设定了()资源的大小A、vcpuB、内存C、系统盘D、数据盘答案AB
80、Fusioninsight HD中,一个完整的Streaming CQL应用程序至少包含:()部分、创建输入流AB、创建输出流C、业务操作语句(例如SELECT、INSERT JI0N等)D、应用提交语句答案ABC
81、HBase的可视化web界面可以查询到什么?A、表的信息B^Region信息C、Region起始RowKeyD、以上全不正确答案ABC
82、在公安领域的大数据批量高线处理平台中,以下描述准确的是()A、经过整理后的原始数据可以根据业务主题,分为基本信息、交往圈信息,轨迹信息,行为信息等存储B、数据来源包括公安系统、社会系统互联网系统、其他如运营商系统等c、数据来源可以按照结构或类型分为视频/图像数据,文本数据数据库中数据等D、不同的数据来源可以整理后划分实时微据、增量文件、全量文件数据库等答案ABCD
83、事务的ACID特性包括A、原子性B、一致性C、隔禺性D、持久性答案ABCD
84、基于Python语言的数据分析中常用于数据可视化的第三方包是—A、MatplotlibB、SeabornC NumpyD、Pandas答案ABD
85、Fusioninsight家族包含:子产品A、GaussDB200B、Fusioninsight MinerC、Fusioninsight HDDFusioninsight Farmer答案ABCD
86、GraphBase有哪些特点?、兼容SQL语法,方便易用AB、提供多实例部属,可横向扩展C、提供灵活的图元数据更新,修改D、提供易用的Rest接口,方便数据的查询分析答案BCD
87、镜像服务主要功能是A、通过镜像创建云服务器B、由现有运行的云服务器,或由外部导入的方式来创建私有镜像C、提供常见的主流操作系统公共镜像D、管理私有镜像,例如修改镜像属性,共享镜像,复制镜像等答案ABCD
88、HBase可以使用下列哪些方法插入数据?A、putD、loadE、bulk loadF、array答案AC
89、EIP加入共享带宽的好处有()、多个IP共用一条带宽AB、方便管理C、节约成本D、提升性能答案ABC
90、大数据计算框架Flink的支持哪些资源调度方式?A、StandaloneB、YARNC、MesosD、Docker答案ABC
91、在线迁移中可能因外部因素导致迁移暂时故障,用户根据迁移日志信息解决问题后,可以通过续传功能继续迁移A、正确B、错误答案A
92、DAYU实时作业启动过后不能暂停A、正确B、错误答案B
93、镜像分为公共镜像、私有镜像、共享镜像,公共镜像为系统默认提供的镜像,私有镜像为用户自己创建的镜像,共享镜像为其他用户共享的私有镜像A、正确B、错误答案A
94、MapReduce过程中,默认情况下一个分片就是一个块,也是一个mapTaskoA、正确B、错误答案A
95、代维管理员代维申请的资源,不占用申请部门的配额A、正确B、错误答案B
96、大数据数据源只能是单一的A、正确B、错误答案B
97、ElasticSearch作为全文检索的引擎,其功能强大,也可以作为NoSQL数据库使用,能满足海量数据存储的需要,也满足主键和多级索引的实时查询A、正确B、错误答案A
98、GraphBash通过数据库引擎将数据通过ji算框架导入Hbase和Spark进行存储A、正确B、错误答案B
99、数据湖探索Data LakeInsight,简称DLI兼容标准SQLA、正确B、错误答案A
100、Hbase中OpenScanner的过程,会创建两种不同的Scanner来读取Hf ile和MetaStore的数据,Hfile对应的scanner为S toreFil eScanner,MetaStore对应的Scanner为MetaStoreScannero、正确AB、错误答案AD、一个API只能被一个APP使用答案C
7、数据库实例状态为“规格变更中”,表示实例正在A、正在修改数据库实例的数据库端口B、数据库实例的磁盘空间扩容中C、数据库代理的CPU和内存规格变更中D、数据库实例的CPU和内存规格变更中答案D
8、用户可以对对配额管理下资源池配置选择、VDC审批员AB、VDC只读管理员C、VDC业务员D、VDC管理员答案D
9、云硬盘扩容时,下列哪项是不正确的?A、在线扩容磁盘时,磁盘所挂载的实例状态必须为“运行中”或者“关机”B、配置了容灾服务CSHA/CSDR/VHA的磁盘不支持扩容C、磁盘所在后端存储类型为异构存储时,支持在线扩容D、磁盘状态为“预留”或“维护”时不支持扩容答案C
10、DAYU批量数据迁移Cloud DataMigration提供数据源之间批量数据迁移服务,帮助您实现数据自由流动A、同构B、异构C、同构/异构D、架构答案C
11、关于HDFS的文件块的描述不准确的是?A、文件块的大小设置原则:最大化寻址开销B、HDFS文件块的大小在
1.0本时是64M,在
2.0的时候是128MC、文件块片被存在哪个集群谁有权限查看修改这个文件等信息放在元缴据Metadata中D、文件块越大寻址时间越短答案A
12、SFS当前支持哪种文件访问协议A、CIPSB、FTPC、HTTPD、NFS答案A
13、在聚类分析任务中,簇内相似度
(一)且簇间相似度(—)时,聚类效果比较好A、低,低B、低JWJ9C、低,高D[WjIWJ,答案B
14、()操作可将本地文件存储至OBSA、上传对象B、下载对象C、删除对象D、修改对象答案A
15、以下不属于数据库的是
(一)oA、MySQLB、MongoDBC、HBaseD、Spark答案D
16、Agg算子的实现策略有()、A4B、3C、2D、1答案B
17、()的基本想法是适当考虑一部分属性间的相互依赖信息,从而既不需要进行完全联合概率计算,又不至于彻底忽略了比较强的属性依赖关系A、贝叶斯决策论B、贝叶斯判定准则C、半朴素贝叶斯分类器D、朴素贝叶斯分类器答案C
18、在加强数据安全技术保护方面,要注意落实数据安全技术保护与信息系统的“三同步”原则,其中不包括
(一)A、同步使用B、同步规划C、同步检查D、同步建设答案C
19、在决策树创建时,由于数据中的噪声和离群点,许多分枝反映的是训练数据中的异常,()方法处理这种过分拟合数据问题A、调和B、回归C、小波D、剪枝答案D
20、下列关于EVS硬盘,哪项不正确()?A、EVS磁盘可以挂载到单个实例B、EVS磁盘始终不受实例运行时间的影响C、将EVS磁盘挂载到实例后,可以像使用其他物理硬盘一样使用它D、可以将EVS磁盘从实例中卸载,不能将其挂载到另一个实例答案D
21、在回归模型中,(—)在权衡欠拟合和过拟合中影响最大A、更新权重w时,使用的是矩阵求逆还是梯度下降B、多项式阶数C、使用常数项D、训练样本数量答案B
22、配置桶日志记录时,以下关于日志文件存放位置说法正确的是?A、可以存放在当前桶或其他桶B、只能存放在其他桶C、启用日志管理D、只能存放在当前桶答案A
23、以下()属于VDC只读管理员权限A、对本VDC及其下级VDC中资源、用户、项目、自运维等具有操作权限B、对用户、操作日志等具有导出权限C、创建下级VDCD、管理审批流程答案B
24、容器技术是企业云战略转型的关键,同时也是云原生(Cloud Native)的核心,下列哪项不属于容器的三大好处?、资源利用率提升AB、秒级弹性C、环境一致性,简化交付D、复杂性增加答案D
25、交叉验证的目的是
(一)A、验证结果的准确性B、提高分类准确率C、增大分类的误差D、得到更稳定的模型答案D
26、0是一种基于多处理器的电脑记忆体设计,内存访问时间取决于处理器的内存位置A、NUMAB、MUMAC、NAMAD、NUNA答案A
27、以下关于Zookeeper关键特性中的原子性说法正确的是()A、客户端发送的更新会按照他们发送的顺序进行应用B、就新只能全部完成或失败,不会部分完成C、一条消息被一个server接受,将会被所有的server接受D、集群中无论那台服务器,对外展示的均是统一视图答案B
28、分析应用计算后的分析主题数据存储在()A、整合明细层B、共享层C、分析层D、贴源层答案C
29、数据在其产生、传输、存储、销毁的生命周期中不存在下列哪项风险OoA、数据使用风险B、数据生产风险C、数据传输风险D、数据存储风险答案B30以下哪个选项不能作为Kafka的ConsumerA、HadoopB DataWarehouseC、Real-timeMonitoringD、FrontEnd答案D
31、YARN调度器分配资源的顺序是A、任意机器一本地资源一同机架B、任意机器一同机架一本地资源C、本地资源一同机架一任意机器D、同机架一任意机器一本地资源答案C
32、IPS不能检测以下哪种威胁、蠕虫AB、DOSC、垃圾邮件D、病毒答案C
33、虚拟IP在云服务器主备切换中的作用是A、高可用性B、负载均衡C、容灾D、备份答案A
34、以下哪个不是系统预置用户组?A、VDC管理员B、VDC只读管理员C、代维管理员D、VDC业务员答案C
35、若采用留出法将数据集D划分为训练集S和测试集T,其中D包含1300个样本,S包含700个样本,模型在T上有60个样本分类错误,那么该模型的精度为
(一)、
95.40%AB、90%C、10%D、
4.90%答案B
36、微服务引擎提供的一系列能力中以下哪项是与微服务发现相关的?()A、注册中心B、治理中心C、配置中心D、服务监控答案A
37、以下哪项不属于Apacha顶级项目?A、FlinkB、StormC、BclipseD Spark答案c
38、关于虚拟负载均衡,正确的?A、只支持硬件虚拟负载均衡B、只支持软件虚拟负载均衡C、支持软硬件虚拟负载均衡D、无法虚拟答案A
39、kNN最近邻方法在
(一)情况下效果较好A、样本较多但典型性不好B、样本较少但典型性好C、样本呈链状分布D、样本呈团状分布答案B
40、在情感分析任务中,其目的是将无结构化的情感文本转化成计算机容易识别和处理的结构化文本,进而供情感分析上层的研究和应用服务的是一oA、情感信息归纳B、情感信息检索C、情感信息抽取D、情感信息分类答案C
41、ElasticSearch采用的搜索方式是?A、正排索引B、快速索引C、慢索引D、倒排索引答案D
42、Apriori是一种算法A、关联分析B、聚类分析C、决策树D、强化学习答案A
43、〃随机森林与Bagging中基学习器〃多样性〃的区别是—〃A、都来自样本扰动B、都来自属性扰动C、来自样本扰动和自属性扰动D、多样本集结合答案C
44、代维帐号可以进入被代维的一级VDC进行代维、1个AB、2个C、5个D、1个或多个答案D45在Fusioninsight产品中,关于Kafka Tpoic,一下描述不正确的有()OA、每个Topic只能被分成一个partition分区B、Topic的partition数量可以在创建时配置C、每个partition的存储层对应一个log文件,log文件中记录了所有的信息数据D、每条发布到Kafka的信息都有一个类别,这个类别被称为Topic,也可以理解为一个存储消息的队列答案A
46、Insert事务使用的锁模式是()A、AccessShareLockB、ShareUpdateExclusiveLockC RowExclusiveLockD、ExclusiveLock答案C
47、将数据块存储大小设置为128M,HDFS客户端在写文件时,当写入一个100M大小的文件,实际占用储存空间为()A、128MB、100MC、64MD、50M答案B
48、以下关于数据收集工具的描述,不准确的是?A、Loader是实现PusionlnsightHD与关系型数据库、文件系统之间交换数据和文件的数据加载工具B、Sqoop是一款开源的工具,主要用于在Hive与传统的数据库间进行数据的传递,可以将关系型数据库中的数据导入到Hadoop的HDFS中,也出可将HDFS的数据导出到关系型数据库中C、Loader提供了本集群内部HDFS和HBase之间的数据导入或导出D、Kettle是一款国外开源的ETL工具,纯java编写,目前仅可以在Linux上运行数据抽取高效稳定答案D
49、采集数据字典首先应该()A、启动extractorB、对数据库用户授权。