Appearance
网络数据采集 (Day61~65)
这部分内容主要介绍使用Python进行网络数据采集(网络爬虫)的知识和技术,包括数据抓取、解析、并发编程和爬虫框架等内容。
学习目标
- 了解网络爬虫的基本概念和应用场景
- 掌握使用requests库获取网络资源的方法
- 学习不同的HTML解析方式(正则、XPath、CSS选择器)
- 掌握Python并发编程(多线程、多进程、异步IO)
- 学习Selenium实现动态网页内容抓取
- 了解爬虫框架Scrapy的使用方法
章节列表
- 61.网络数据采集概述
- 62.用Python获取网络资源
- 62.用Python解析HTML页面
- 63.Python中的并发编程-1
- 63.Python中的并发编程-2
- 63.Python中的并发编程-3
- 63.并发编程在爬虫中的应用
- 64.使用Selenium抓取网页动态内容
- 65.爬虫框架Scrapy简介
通过学习这部分内容,你将能够开发高效的网络爬虫程序,获取和处理各种网络数据。