Skip to content

网络数据采集 (Day61~65)

这部分内容主要介绍使用Python进行网络数据采集(网络爬虫)的知识和技术,包括数据抓取、解析、并发编程和爬虫框架等内容。

学习目标

  • 了解网络爬虫的基本概念和应用场景
  • 掌握使用requests库获取网络资源的方法
  • 学习不同的HTML解析方式(正则、XPath、CSS选择器)
  • 掌握Python并发编程(多线程、多进程、异步IO)
  • 学习Selenium实现动态网页内容抓取
  • 了解爬虫框架Scrapy的使用方法

章节列表

通过学习这部分内容,你将能够开发高效的网络爬虫程序,获取和处理各种网络数据。