2025年秋江苏开放大学数据采集与预处理第一次形考作业

 爬取证券之星数据

  一、实验目的

掌握使用urllib库访问目标网址,BeautifulSoup库解析网页,获得网页静态加载的数据信息的方法。

  二、实验内容

创建一个爬虫项目StockStar,用于爬取证券之星的部分信息,主要包括代码、简称、流通市值(万元)、总市值(万元)、流通股本(万元)、总股本(万元),其网址为:http://quote.stockstar.com/stock/ranklist_a.shtml,具体要求如下:

1. 使用urllib库、requests库访问网站,使用bs4库、lxml库解析网页。

2. 获取数据后,用NumPy库、Pandas库将其格式化为DataFrame

3. 用Python3自带的sqlite3库,将数据本地存储在数据库中。

4. 从数据库中读取数据并创建为DataFrame,再打印数据作为展示。

  三、作业提交要求

完成实验报告(见附件模板),将源代码和实验报告一起压缩打包提交至学习平台。

资源下载
版本一
下载价格10
版本二
下载价格10
点点赞赏,手留余香 给TA打赏

评论0

请先
  • u******* 下载了资源 2023年秋江苏开放大学组织行为学第二次作业
  • 游客 下载了资源 爱普生Epson EP-901F 驱动
  • u******* 签到打卡,获得1元奖励
  • 游客 下载了资源 爱普生Epson Stylus Photo T59 驱动
  • 游客 下载了资源 佳能Canon PIXMA TR4640 驱动
  • 游客 下载了资源 爱普生Epson LQ-310 驱动
  • u******* 登录了本站
  • 游客 下载了资源 爱普生Epson PLQ-35K 驱动
  • 游客 下载了资源 爱普生Epson Stylus Pro 4000 驱动
  • 游客 下载了资源 爱普生Epson Stylus Photo R280 驱动
  • u******* 登录了本站
  • 游客 下载了资源 佳能Canon PIXMA MG6470 驱动
  • 游客 下载了资源 佳能Canon PIXMA MG6470 驱动
  • 游客 下载了资源 高中美术密卷+答案
  • 游客 下载了资源 2012年公务员考试《申论》卷(贵州、甘肃)及参考答案
  • 游客 下载了资源 2021年浙江省公务员录用考试《行测》题(C类)参考答案及解析
点击浏览器地址栏的⭐图标收藏本页
需要托管,代写作业,论文扫码加微信
显示验证码

社交账号快速登录

微信扫一扫关注
扫码关注后会自动登录