江苏开放大学数据采集与预处理060749第2单元测试

试题列表
单选题
题型:单选题客观题分值2分难度:一般得分:2
1路径表达式是唯一的,只能从根节点开始搜索。
A错
学生答案:B
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
2在使用bs4库调用find方法查找节点时,只能将字符串作为参数。
A错
学生答案:B
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
3如果访问某网站的频率太高,则这个网站可能会禁止访问。
A错
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
4创建BeatutifulSoup类实例时,如果没有明确指定解析器,那么该实例肯定会选择Python标准库。
A错
学生答案:B
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
5JSONPath是一种信息抽取类库,用于从JSON文档中抽取指定信息。
A错
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
6POST请求的安全性更高,使用场合比GET请求多。
A错
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
7如果URL中包含了中文,则可以使用urlencode方法进行编码。
A错
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
8GET请求是指向指定资源提交数据进行处理请求,数据被包含在请求体中。
A错
学生答案:B
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
9登录网站时,只有浏览器发送的请求才能获得响应内容。
A错
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
10一旦服务器端出现错误,返回的状态码为403。
A错
学生答案:B
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
11Urlopen是一个特殊的opener,支持设置代理IP。
A错
学生答案:B
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
12urlopen函数返回的是一个文件对象,需要调用read()方法一次性读取。
A错
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
13服务器可以根据请求报头中的Accept,判断以返回适当的文件格式给浏览器。
A错
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
14如果路径表达式以“/”开始,那么该路径就代表着到达某个节点的绝对路径。
A错
学生答案:A
老师点评:
题型:单选题客观题分值2分难度:一般得分:2
15通常有些网站返回的数据会出现乱码,肯定是客户端没有反馈正确的编码导致的。
A错
学生答案:B
老师点评:
填空题
题型:填空题主观题答案不允许乱序分值2分难度:一般得分:2
1
一旦超过了服务器设置的时间,就会抛出一个超时异常。
学生答案:超时
题型:填空题主观题答案不允许乱序分值2分难度:一般得分:2
2
客户端发送的请求消息由请求行、、空行、以及请求数据这四个部分组成。
学生答案:请求头部
题型:填空题主观题答案不允许乱序分值2分难度:一般得分:0
3
HTTP是一套计算机网络通信的规则,由客户端请求消息和服务器端消息组成。
学生答案:请求
题型:填空题主观题答案不允许乱序分值2分难度:一般得分:2
4
路径表达式是指从某节点到某个节点或某一组节点的顺序,以字符进行分隔。
学生答案:/
题型:填空题主观题答案不允许乱序分值2分难度:一般得分:2
5
是Python内置的HTTP请求库,可以看做是处理URL的组件集合。
学生答案:urllib
题型:填空题主观题答案不允许乱序分值2分难度:一般得分:2
6
网页解析器可以从网页中提取出有价值的数据,或新的链接。
学生答案:URL
题型:填空题主观题答案不允许乱序分值2分难度:一般得分:2
7
请求的参数都显示在URL上,服务器根据该请求所包含URL中的参数来产生响应内容。
学生答案:GET
题型:填空题主观题答案不允许乱序分值2分难度:一般得分:2
8
如果要获取Response类中字符串形式的响应内容,可以访问属性获取。
学生答案:text
题型:填空题主观题答案不允许乱序分值2分难度:一般得分:2
9
要想将爬虫程序发出的伪装成一个浏览器,就需要自定义请求报头。
学生答案:请求
题型:填空题主观题答案不允许乱序分值2分难度:一般得分:2
10
是互联网上标准资源的地址。
学生答案:URL
题型:填空题主观题答案不允许乱序分值2分难度:一般得分:2
11
若客户端没有连接到网络,则使用urlopen方法发送请求后会产生异常。
学生答案:URLError
题型:填空题主观题答案不允许乱序分值2分难度:一般得分:2
12
lxml是用Python编写的库,主要用于解析和提取或XML格式的数据。
学生答案:html
题型:填空题主观题答案不允许乱序分值2分难度:一般得分:2
13
是一个用于处理字符串的强大工具。
学生答案:正则表达式
题型:填空题主观题答案不允许乱序分值2分难度:一般得分:2
14
表示XML路径语言,能够确定XML树结构中某一部分的位置。
学生答案:Xpath
题型:填空题主观题答案不允许乱序分值2分难度:一般得分:2
15
服务器响应了浏览器发送的请求,返回页面。
学生答案:HTML
简答题
题型:简答题主观题分值8分难度:一般得分:8
1正则表达式、Xpath、Beautiful Soup和JSONPath有什么区别?

答案


题型:简答题主观题分值8分难度:一般得分:8
2请简述爬虫是如何抓取网页的。

答案


题型:简答题主观题分值8分难度:一般得分:8
3请简述什么是结构化数据和非结构化数据。

答案


题型:简答题主观题分值8分难度:一般得分:8
4请简述浏览器加载网页的过程。

答案


题型:简答题主观题分值8分难度:一般得分:8
5请简述urllib和requests的异同。

答案

资源下载
下载价格10
客服QQ:1668639739
点点赞赏,手留余香 给TA打赏

评论0

请先
  • 游客 下载了资源 2016年下半年教师资格证考试《初中体育与健康》题解析
  • 游客 下载了资源 爱普生Epson L6268 驱动
  • u******* 签到打卡,获得1元奖励
  • d******* 下载了资源 江苏开放大学风景园林设计初步【调查报告作业】构成设计在风景园林设计中的运用调查报告
  • d******* 下载了资源 江苏开放大学风景园林设计初步【调查报告作业】构成设计在风景园林设计中的运用调查报告
  • d******* 登录了本站
  • 游客 下载了资源 爱普生Epson Stylus Photo R300 驱动
  • 游客 下载了资源 2009年黑龙江省申论(B卷)真题及参考答案
  • 游客 下载了资源 2012年安徽省公务员考试《申论》(A卷)真题及参考答案
  • 游客 下载了资源 2009年黑龙江省申论(B卷)真题及参考答案
  • 游客 下载了资源 2014下半年教师资格证考试《初中语文》(初级中学) (解析)
  • 游客 下载了资源 佳能Canon PIXMA G5020 驱动
  • 游客 下载了资源 佳能Canon PIXMA G5020 驱动
  • 游客 下载了资源 2016年上半年教师资格证考试《教育教学知识与能力》(小学)解析
  • 游客 下载了资源 2019年下半年教师资格证考试《初中历史》题(解析)
  • 游客 下载了资源 爱普生Epson Stylus Photo 1200 打印机驱动
点击浏览器地址栏的⭐图标收藏本页
需要托管,代写作业,论文扫码加微信
显示验证码

社交账号快速登录

微信扫一扫关注
扫码关注后会自动登录