首页 > Python工程师 > 基于 Python 的静态爬虫实战
基于 Python 的静态爬虫实战
  • 基于 Python 的静态爬虫实战

  • 主讲 : Kingname
  • 本课适合Python初学者作为练手项目的第一战,通过爬虫案例帮助你更好的学习 Python开发爬虫。学完此课,你将达到爬虫初级入门水平,并能掌握数据库交互等 Web 编程相关技能。
  • ¥99.00 ¥199.00 ¥98.00
  • 立即购买 Pro会员免费学

    40人学习时长 : 5.3 小时有效期 : 80 天 有效期自支付成功后开始计算,到期后仍可观看课程视频和图文,但不再享受问答和作业批改服务。SVIP用户可享受无视有效期权限,随时随意轻松看。单课购买用户需关注课程有效期,合理安排学习计划。

基于Python的静态爬虫实战课程 基于Python的静态爬虫实战课程 基于Python的静态爬虫实战课程 基于Python的静态爬虫实战课程

基于Python的静态爬虫实战

主讲:Kingname

网络爬虫,即 Web Spider,是一个很形象的名字。目前爬虫开发的语言的主要是 Python,本套课程将会带你制作静态网页爬虫程序,如果你对高效处理数据感兴趣,那么这里就有你想要的。本课程适合Python 初学者作为练手项目的第一战,我们会通过几个爬虫案例,帮助你更好的学习 Python 开发爬虫。学完此课,你将达到爬虫初级入门水平,并能掌握数据库交互,网页分析基础等 Web 编程相关技能。

第 1 部分 课程简介 5 分钟

第 1 节 课程简介 5 分钟
课程概览

第 2 部分 Python与数据库 70 分钟

第 1 节 PyMongo 的安装及使用 20 分钟
MongoDB 的安装
Python 搭配 MongoDB的优势
PyMongo 的简介及安装
PyMongo的使用
第 2 节 MongoEngine 的安装及使用 20 分钟
ORM 介绍
MongoEngine 的安装
MongoEngine 的使用
第 3 节 Redis-Py 的安装及使用 30 分钟
Redis 安装
Redis-Py 安装
Redis-Py 使用
作业:人员信息管理系统
人员信息管理系统

第 3 部分 正则表达式 105 分钟

第 1 节 基本符号 25 分钟
正则表达式介绍
基本符号的意义
第 2 节 应用举例 40 分钟
括号的使用
提取数字
提取文本
(.*)与(.*?)的差别
第 3 节 Python的正则表达式 40 分钟
findall 的使用
search 的使用
正则表达式提取技巧
作业:百度贴吧半自动爬虫制作
百度贴吧半自动爬虫制作

第 4 部分 网络内容解析(基础) 135 分钟

第 1 节 Requests 的使用 25 分钟
Requests的介绍和安装
get 与 post 方法使用
第 2 节 XPath 的使用 30 分钟
XPath的介绍
lxml的安装
XPath的语法讲解
XPath应用举例
XPath 技巧
第 3 节 Beatiful Soup4 的介绍和使用 30 分钟
BS4介绍与安装
BS4语法讲解
第 4 节 多线程爬虫 20 分钟
多线程爬虫介绍
使用多线程技术加速爬虫
第 5 节 爬虫的常见算法(科普) 30 分钟
深度优先算法
广度优先算法
作业:东野圭吾《白夜行》小说爬虫制作
东野圭吾《白夜行》小说爬虫制作

学员服务

  • 作业批改
  • 有问必答

主讲老师

  • Kingname

    极客学院布道师

    上线14门课程,其中爬虫系列课程在线学习人数10w+。任职于某全球排名前三的IC设计公司,负责自动化测试框架的开发与维护。有多年Python开发经验,主持数十个不同规模的基于Python的项目开发。目前GitHub 上开源项目有:MarkdownPicPicker 、Remote Control等。