2023年秋江苏开放大学数据采集与预处理第二次形考作业

微信小程序
资源下载
下载价格10

使用Scrapy爬虫框架爬取网页

  一、实验目的

1. 理解Scrapy爬虫框架的架构和工作流程;

2. 掌握使用Scrapy爬虫框架进行爬虫项目开发。

  二、实验内容

创建一个Scrapy项目SunHot,用于爬取阳光热线问政平台的部分信息,主要包括投诉帖子的编号、帖子的URL、帖子的标题及帖子的内容,其网址为:https://wz.sun0769.com/political/index/supervise,具体要求如下:

1. 在项目的/spiders目录下,新建用作爬虫的文件sun.py。

2. 在sun.py文件中,使用parse方法取出每个页面中帖子的链接列表,再从中迭代获取每个帖子,并交给回调函数parse_item处理。

3. 在parse_item方法中,提取上述提到的这些信息。

4. 将爬取到的数据以JSON文档的形式进行输出。

5. 将项目改为使用CrawlSpider类自动爬取。

  三、作业提交要求

完成实验报告(见附件模板),将源代码和实验报告一起压缩打包提交至学习平台。

点点赞赏,手留余香 给TA打赏

AI创作

评论0

请先

某桩的极限承载力Qu=552.6kN,安全系数K取3,桩身材料的容许抗压力为178KN试估算该桩的容许竖向承载力Ra。
某桩的极限承载力Qu=552.6kN,安全系数K取3,桩身材料的容许抗压力为178KN试估算该桩的容许竖向承载力Ra。
8分钟前 有人购买 去瞅瞅看
某厂生产甲产品。生产过程顺序经过第一、第二和第三生产车间,原材料从第一生产车间投入,加工成子半成品,第二生产车间对子半成品继续加工,加工成丑半成品,第三生产车间对丑半成品继续加工,加工成甲产成品。该厂成本计算采用按实际成本计价的逐步综合结转分步法。
某厂生产甲产品。生产过程顺序经过第一、第二和第三生产车间,原材料从第一生产车间投入,加工成子半成品,第二生产车间对子半成品继续加工,加工成丑半成品,第三生产车间对丑半成品继续加工,加工成甲产成品。该厂成本计算采用按实际成本计价的逐步综合结转分步法。
7分钟前 有人购买 去瞅瞅看
2023年秋江苏开放大学机电传动控制过程性考核作业3
2023年秋江苏开放大学机电传动控制过程性考核作业3
7分钟前 有人购买 去瞅瞅看
支持多种货币
支持多种货币付款,满足您的付款需求
7天无忧退换
安心无忧购物,售后有保障
专业客服服务
百名资深客服7*24h在线服务
发货超时赔付
交易成功极速发货,专业水准保证时效性

站点公告

答案整门打包购买,价格优惠,有需要加微信
显示验证码

社交账号快速登录