还剩22页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
数据采集初级试题与答案1+X
1、Apache服务器是实现网络协议的服务器A、FTPB、DHCPC、HTTPDD、HTTP答案D
2、以下数据中,非结构化数据不包括、图片AB、音频C、图像D、日志文件答案D
3、下面哪个不是Python合法的标识符A、int32B、40XLC、selfD name_答案B
4、在Windows中,对文件夹进行复制时会复制哪些内容A、只复制文件夹名,不复制其内容B、复制文件夹名的其下所有的文件和子文件夹C、只复制文件夹名和其下的文件,不复制其下的文件夹D、复制文件夹名和其下所有的文件和子文件夹,但不复制子文件夹下的文件答案B
5、以下选项中符合Python语言变量命名规则的是A、*iB、3_1C、AI!D、Templist答案D
6、以下xpath代码中,能够获取页面中title标签的内容的是A、//title/@textB、//title/text
51、数据采集是数据分析前的重要且首要环节,数据采集需要符合哪些特性A、多维性、灵活性、高延迟B、全面性、多维性、高效性C、低维度、高并发、高速率D、单一化、低维度、低并发答案B
52、使用httpd命令查看Apache软件的安装版本信息,命令为A、httpd-vB、httpd-versionC、httpdD http答案A
53、以下哪个网站是常用的站长工具A、ww.google,comB、too.chinaz.comC、www.sohu.comD、www.seozz.net答案B
54、Python不支持的数据类型有A、charB、intC、floatD list答案A55以下选项中,不是Python对文件的打开模式的是A、rB、+C、wD、c答案D
56、OpenSSH服务进程默认使用的端口号是A、21B、22C、24D、25答案B
57、Java应用系统中常用的日志框架不包括A、Log4jB、Logbackc、Log4j2D loguru答案D
58、Scrapy中,用于创建项目的命令是A、createprojectB startprojectC、openprojectD beginproject答案B
59、使用scrapy框架编写爬虫,setting,py文件中有些配置项需要修改,比如R0B0TSTXT_0BEY的值一般情况下设置为A、TrueB、0C、FalseD、1答案c
60、服务器端响应状态码中,表示“NOT MODIFIED文档未修改”的是、302AB、404C、304D、200答案C
61、urllib.request,urlopen方法的返回值是一个Response类型的对象,此对象具有的属性有A、msgB versionCstatusD、reason答案ABCD
62、CRM主要应用于哪些方面A、客户档案有序管理B、合同管理C、销售报表D、外勤签到E、预测销售业绩答案ABCDE
63、以下属于JavaScript核心对象的是()、String对象AB、Math对象C、Array对象D、Date对象答案ABCD
64、在HTML中,form标签的属性有()A、name属性定义表单的名称B、method属性定义表单结果从浏览器传送到服务器的方法C、action属性用来定义表单处理程序ASP,CGI等程序的位置相对地址或绝对地址D、enctype属性设置表单资料的编码方式答案ABCD
65、以下哪几项是设计手机用户界面时应注意的问题A、设计风格保持一致B、界面设计与程序逻辑的分离C、根据不同型号手机的屏幕解析度、尺寸和纵横比各不相同,自动调整界面上部分控件的位置和尺寸,避免因为屏幕信息的变化而出现显示错误D、能够合理利用较小的屏幕显示空间,构造出符合人机交互规律的用户界面答案ABCD
66、以下属于DML语句的是()A、INSERTB、ALTERC、DROPD、DELETE答案AD
67、若当前目录中只有一个名为file的文件,下列那些命令可以创建一个名为newfile新文件0A、vim newfileB、cat newfileC、cp filenewfileD catfilenewfile答案ACD
68、关于socket编程,对于服务端编程的主要步骤包括A、打开socketB、绑定到一个地址和端口C、监听客户端连接D、读写数据答案ABCD69以下属于jQuery特点的是、是一个轻量级JavaScript库AB、兼容各种浏览器C、容易扩展,插件丰富D、可以方便的为网站提供ajax交互答案ABCD
70、以下关于索引的说法正确的是A、可以加快数据的检索速度B、可以加快表与表之间的连接C、唯一性索引可以保证数据记录的唯一性D、索引不需要花费代价占用存储空间就可以实现检索速度的提高答案ABC
71、Python中,关于re模块描述正确的是A、re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回NoneB、re模块使Python语言拥有全部的正则表达式功能C、re.search匹配整个字符串,直到找到一个匹配D、以上描述都不正确答案ABC
72、在Python中提供了哪些技术用于获取网页数据、Urllib模块AB、Requests模块C、BeautifulSoup库D、Ixml库答案BC
73、根据《中华人民共和国网络安全法》,下列说法不正确的是A、网络产品、服务具有收集用户信息功能的,其提供者不需要向用户明示B、网络运营者应当对其收集的用户信息严格保密,并建立健全用户信息保护制度C、国家不允许网络运营者之间在网络安全信息收集、分析、通报和应急处置等方面进行合作D、为了获得更多有利数据,可以侵入他人网络、干扰他人网络正常功能、窃取网络数据答案ACD
74、下列属于Linux操作系统特点的是A、性能高安全性强B、便于定制和再开发C、与unix兼容D、源码公开答案ABCD
75、按照数据发生的主体不同,数据采集范围主要包括A、数据库采集B、系统日志采集C、网络数据采集D、感知设备数据采集答案ABCD
76、Python中函数是对象,描述正确的是A、函数可以赋值给一个变量B、函数可以作为元素添加到集合对象中C、函数可以作为参数值传递给其他函数D、函数可以当作函数的返回值答案ABCD
77、linux中安装软件可使用命令A、setupB、yum installC、rpmD、源代码安装答案BCD
78、TCP/IP在应用层的协议主要包括A、ICMPB、FTPC、HTTPD Telnet答案BCD
79、下列哪些可以匹配英文和汉字?A、A-Za—z0_9]+$B、A_Za_zO_9]+$C、^A-Za-zO-9]{
4.40}$D、^A-Za-zO-9]{
4.40}答案AC
80、在xpath中,元素节点可有()个子节点、零个AB、一个C、多个D、都不对答案ABC
81、支持中文的字符编码包括A、IS0-8859-1B、GBKC、UTF-8D、UNICODE答案BC
82、以下哪几项是设计手机用户界面时应注意的问题、设计风格保持一致AB、界面设计与程序逻辑的分离C、根据不同型号手机的屏幕解析度、尺寸和纵横比各不相同,自动调整界面上部分控件的位置和尺寸,避免因为屏幕信息的变化而出现显示错误D、能够合理利用较小的屏幕显示空间,构造出符合人机交互规律的用户界面答案ABCD
83、scrapy框架包含的几个关键python包有A、IxmlB、twistedC、w31ibD Parsel答案:ABCD
84、以下属于常用的日志框架的是A、Log4jB、Slf4jC LogbackD、VUE答案ABC
85、ELK由_1_._2_._3_三个开源工具组成A、ElasticSearchB LogstashC、KibanaD Logflow答案ABC
86、CRM主要应用于哪些方面A、客户档案有序管理B、合同管理C、销售报表D、外勤签到E、预测销售业绩答案ABCDE
87、对于日志类型的数据采集,常用的采集工具有A、filebeatB、logstashC、scrapyD、beautifulSoup答案AB
88、以下关于scrapy框架的描述,正确的有、Scrapy是一个开放源码的协作框架AB、scrapy框架是一种快速、简单、可扩展的方式从网站中提取所需要的数据C、Scrapy是用纯Python编写的D、scrapy框架包含的python包中不包括Ixml答案ABC
89、以下属于jQuery选择器的是A、id选择器B、.class选择器C、元素选择器D、过滤选择器答案ABCD
90、Python中,下面属于合法语句的包括A、a=b=c=lB、a.b=b.aC、a+=bD、a=b=c+l答案ABC
91、决定局域网特性的主要技术是传输介质、拓扑结构和介质访问控制方法,其中最重要的是传输介质A、正确B、错误答案B
92、DESC命令可以列出表结构、正确AB、错误答案A
93、视图是由一个或若干基表产生的数据集合,但视图不占存储空间建立视图可以保护数据安全仅让用户查询修改可以看见的一些行列、简化查询操作、保护数据的独立性、正确AB、错误答案A
94、SLF4J不是一个真正的日志实现,而是一个抽象层,它允许你在后台使用任意一个日志类库、正确AB、错误答案A
95、避免产生错误的方法就是在符号之前加上一个斜杠,构成转义字符A、正确B、错误答案B
96、HTTP请求报文结构包含请求行、请求头部、空行和请求数据4部分A、正确B、错误答案A
97、子类初始化时需要首先初始化父类的属性,初始化父类的语句是super.initA、正确B、错误答案A
98、在数据库中,有三种经典的数据模型,分别是树状数据模型、网状数据模型、关系数据模型A、正确B、错误答案B
99、在“全局配置”模式下删除VLAN10的命令为del VLANlOoA、正确B、错误答案B
100、0SI参考模型共划分为7层,从下到上依次为物理层、网络层、数据链路层、传输层、表示层、会话层和应用层A、正确B、错误答案B
101、某些情况下,单向通信也能有反方向的交互A、正确B、错误答案B
102、某些情况下,单向通信也能有反方向的交互、正确AB、错误答案B
103、静态路由是手工添加,适用于小型网络,动态路由是自动生成路径,适用于大型网络A、正确B、错误答案A
104、Linux操作系统的特性有开放性、多用户、多任务、良好的用户界面等A、正确B、错误答案A
105、在TCP/IP网络中,每一台主机必须有一个域名A、正确B、错误答案B
106、位置路径可以是绝对的,也可以是相对的A、正确B、错误答案A
107、Python中,del命令只可以删除列表中的一个元素,不能删除整个列表、正确AB、错误答案B108Spring Boot集成了原有Spring框架的优秀基因,省去了Spring繁琐的配置,使用Spring Boot很容易创建一个独立运行(运行jar,内嵌Servlet容器)、准生产级别的基于Spring框架的项目A、正确B、错误答案A
109、在Select语句中查询条件必须有在Select语句中查询条件必须有A、正确B、错误答案B
110、一个网站获取的反向链接越多越好,说明被认同的范围越广,所以反向链接追求高数量,对质量要求低A、正确B、错误答案BC、//title/textD、//title/@text答案B
7、Xpath中的可用来选取未知的XML元素?A、节点B、属性C、表达式D、通配符答案DE、删除数据表文件的命令是A、DELETE TABLEB、DROP TABLEC、DROPD、DELETE答案B
9、如果要在python中只用正则表达式,则需要引入哪个模块A、reB、IxmlC、etreeD xml答案A
10、python编写爬虫过程中,需要将爬取的网页内容转换为哪种类型的对象才可以使用etree模块的xpath方法、D0MAB、HTMLC、ElementD、Response答案c
11、XPath使用在XML文档中选取节点?A、节点B、C、路径表达式D、step答案C111定义listl=[1,1,1,3,4],可执行list setlistl,去掉重复元素A、正确B、错误答案A112>查看变量内存地址的Python内置函数是idA、正确B、错误答案A
113、优先级是进程调度的重要依据,一旦确定不能改变、正确AB、错误答案B
114、如果需要修改数据表的字段类型,其语法格式为alter table表名modify字段名新数据类型;A、正确B、错误答案A
115、Linux系统管理员的权限和普通用户的权限相同A、正确B、错误答案B
116、网页中一个id可以用很多次A、正确B、错误答案B
117、常用的关系型数据库包括Oracle,MySQL,SQL Server等A、正确B、错误答案A
118、静态路由是手工添加,适用于小型网络,动态路由是自动生成路径,适用于大型网络A、正确B、错误答案A119request响应模块,用来处理客户端发送请求的服务器响应、正确AB、错误答案B
120、Tomcat作为独立服务器请求来自于web浏览器、正确AB、错误答案A121JavaScript语言不区分大小写、正确AB、错误答案B
122、允许空值的字段上可以定义主键约束A、正确B、错误答案B123^$nnn在shell里为定义一个变量nnn的作用、正确AB、错误答案B
124、查找表结构用DESCA、正确B、错误答案A
125、在“全局配置”模式下删除VLAN肩的命令为del VLANlOo、正确AB、错误答案B126可以通过修改Apache的httpd.conf中的LogFormat修改Apache的日志格式、正确AB、错误答案A
127、数据采集以手动方式为主,避免使用自动化的手段A、正确B、错误答案B
128、城域IP网可以采用与局域网大体相同的技术,也可能采用与局域网完全不同的技术A、正确B、错误答案A
129、Python源代码程序编译后的文件扩展名为.pyA、正确B、错误答案B
130、Windows操作系统在其运行的生命周期中会记录其大量的日志信息,这些日志信息包括Windows事件日志Event Log,Windows服务器系统的IIS日志,FTP日志,Exchange Server邮件服务,MS SQLServer数据库日志等A、正确B、错误答案A131JavaScript定义变量时,必须先使用var进行声明A、正确B、错误答案B
132、网站SEO优化时,关键词密度根本不用考虑,只要不堆积就行、正确AB、错误答案B
133、在查询SQL语句中,用来表示分组的是ORDER BYA、正确B、错误答案B
134、JavaScript语言不区分大小写A、正确B、错误答案B
135、关键词密度根本不用考虑,只要不堆积就行A、正确B、错误答案B
136、数据采集,又称数据获取,是利用一种装置或程序从系统外部采集数据并输入到系统内部的一个接口、正确AB、错误答案A
137、服务器群集技术将成为服务器主流A、正确B、错误答案B
138、Python内置函数size可以返回列表、元组、字典、集合、字符串以及range对象中元素个数、正确AB、错误答案B
139、存储设备通过通用网络连接到网络设备上.主要应用于中小型网络的存储技术是NASA、正确B、错误答案A
140、JavaScript语言不区分大小写,Name与name代表相同的标识符、正确AB、错误答案B
12、在select语句的where子句中,使用正则表达式过滤数据的关键字是A、likeB、againstC、matchD、regexp答案D
13、什么是正则表达式?、任何在Python中可能的正确表达式AB、程序员经常使用的编程语言表达式的集合C、用来匹配文本字符串如特定字符、单词或字符模式的一种工具D、从Python字典中快速获取数据的一种算法答案C
14、数据库系统的最大特点是A、数据的三级抽象和二级独立性B、数据共享性C、数据的结构化D、数据独立性答案A
15、下列命令中可以起到对文件进行重命名作用的命令是A、1sB、cpC、mvD rm答案C
16、ATM的基本单位是信元,其长度为A、5字节B、53字节C、48字节D、32字节答案B
17、ELK技术栈中,用于展示数据的技术是A、ElasticsearchB、LogstashC、KibanaD、Echart答案c
18、在select语句的where子句中,使用正则表达式过滤数据的关键字是A、likeB、againstC、matchD、regexp答案D
19、使用xpath,选取属于body子节点下的最后一个div节点的表达式为A、/html/body/divfirst]B、/html/body/divlast]C、/html/body/divpositon=last]D、/html/body/divpositon=first]答案B
20、Python语言中用来定义函数的关键字是A、returnB、defC、functionD define答案B
21、Log4j定义的日志概念里不包含哪个A、LoggerB、writerC、AppenderD、Level答案B
22、正则表达式“[a-zj表示的含义是A、取所有小写英文字母以及—中的任意多个B、取“a、-、z、中的任意多个C、取“a、-、z、中的任意一个D、取所有小写英文字母以及—中的任意一个答案D
23、使用scrapy的命令可以创建一个scrapy项目A、startprojectB、genspiderC、runspiderD generatescrapy答案A
24、使用scrapy的命令创建的scrapy项目中,哪个程序是用于封装爬取数据的,类似于Java中的JavaBean对象A、middle,pyB、init.pyC、items,pyD scrapy.cfg答案c
25、HTTPS协议的默认端口号是A、80B、8080C、443D、88答案c
26、Tomcat默认发布项目的位置为()A、appsB、webappsC、WEB-INFD、classes答案B
27、以下哪一项与网站优化关键词排名无关()、网站开发语言A网站域名C、网站程序复杂度D、网站空间稳定性答案A
28、数据库管理系统能实现对数据库中数据的查询、插入、修改和删除等操作的数据库语言称为()A、数据定义语言(DDL)B、数据管理语言C、数据操纵语言(DML)D、数据控制语言答案C
29、以下聚合函数中,用来统计平均值的函数为A、countB、minC avgDsum答案c
30、json模块中,方法可以将python的字典和列表转换为json字符串A、loadB、loadsC、dumpD、dumps答案D
31、下列哪个语句在Python中是非法的A、x=y=z=lBx=y=z+1C x.y=y.xD x+=y答案B
32、在Python中,关于全局变量和局部变量,以下选项中描述不正确的是0A、一个程序中的变量包含两类全局变量和局部变量B、全局变量不能和局部变量重名C、全局变量一般没有缩进D、全局变量在程序执行的全过程有效答案B
33、检查网络联通性的命令是A、ipconfigB、routeC、telnetD、ping答案D
34、下列哪些属于规范数据信息收集的方式与要求A、自然人的个人信息受法律保护B、未经用户同意,电信业务经营者、互联网信息服务提供者不得收集、使用用户个人信息C、发现网络运营者收集、存储的其个人信息有错误的,有权要求网络运营者予以更正D、网络运营者应当对其收集的用户信息严格保密,并建立健全用户信息保护制度答案A
35、网站SEO优化时,网站进行友情链接多少个为适中()A、15个〜B、20~30个C、30~40个D、40个以上答案B
36、Hub是一种网络设备,它的中文名称叫A、调制解调器B、路由器C、集线器D、网桥答案C
37、以下不是修改表操作的是()A、drop table userB、alter tableuser addremark varchar20C、alter tableuser characterset utf8D altertableuserdrop remark答案A38以下BeautifulSoup4的描述中,错误的是A、BeautifulSoup可以进行html文档的解析,但不能实现对网页的抓取B、默认使用的是标准库解析器C、使用Ixml HTML解析器对文档的纠错能力强,但解析速度较慢D、自动将输入文档转换为Unicode编码,输出文档转换为utf-8编码答案C
39、re模块的常用方法中用于将输入的字符串整个扫描并返回第一个成功的匹配的是()A、subD、splitE、searchD compile答案c
40、能够实现数据链路层的互联设备有、网管AB、网桥C、中继器D、路由答案B
41、自由软件的含义是A、用户不需要付费B、软件可以自由修改和发布C、只有软件作者才能向用户收费D、软件发行商不能向用户收费答案B
42、以下不属于jQuery选择器的是、id选择器AB.class选择器C、元素选择器D、css选择器答案D
43、下列不属于ELK范畴的是A、LogstashB、LuceneC、ElasticSearchD、Kibana答案B
44、网络层以上的中继系统是A、转发器B、网桥C、路由器D、网关答案D
45、re模块中能够返回多个符合规则的字符串的方法是A、searchB、matchC、findallD、finditer答案c
46、以下不属于JavaScript引用数据类型的是()A、FunctionB、ObjectC、ArrayD、答案D
47、以下CSS中,不属于font属性的是()A、font-sizeB、font-weightC、sizeD、font-style答案c
48、数据库结构的描述和定义是DBMS运行的基本依据,它们存储于()A、封锁表B、数据字典C、索引D、日志答案B
49、下列表达式的值为True的是()A、5+4j2-3jB、322C、
3.2〈〃a〃.〃b”D〃abcxyz”答案CD、、Python文件的后缀名是()A、goB pyC、doD、php答案B。