【爬虫心得】爬取IMDB Top250影片的类型入门-曦颜博客 - 咪博网

【爬虫心得】爬取IMDB Top250影片的类型入门

【爬虫心得】爬取IMDB Top250影片的类型入门

32484

4年前更新

前言

分享对于Python刚入门及爬虫刚入门的同学分享小思路。

前几天接收到一个爬虫单，在爬取过程中遇到了爬取信息错误，于是换了方法去爬取。接下来分享下遇到问题的解决方法。

客户需求

爬取IMDB Top250影片的名称、评分、类型、出品公司、出品国家、时长等
正确爬取后利用Python Web框架实现数据可视化Echarts

问题的出现

首先一开始利用requests库可完整爬取所需信息，验收时客户说影片类型爬取错误，如下示例：

影片：The Dark Knight 的样品类型有两个地方显示，如图红框是三个：

在页面下方Storyline下却显示四个，如图红框：

利用常规的右键查看网页源代码找不到该信息，后发现Storyline是动态加载的，所以弃用requests库使用selenium。

Selenium爬取过程

此处内容已隐藏，请评论后刷新页面查看.

最后

代码是初版，后续可以完善优化，如有错误，指点一下，谢谢！

| 发布于上海

© 版权声明

版权声明 1 本网站名称：曦颜博客
2 本站永久网址：https://blog.vaimibao.top
3 本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长 QQ1334669076进行删除处理。
4 本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6 本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END

技术教程教程分享
# Python # 爬虫

嘿嘿，喜欢就请我喝杯奶茶吧~

相关推荐

评论共3条

请登录后发表评论

请登录后查看评论内容