基本的正则表达式

成为vip会员,免费看所有精品课程
  • 目录

    目录 收起>

    本课程讲解在定向爬虫编写过程中涉及到的基本的正则表达式。实现从一段有规律的文本中根据规律提取出感兴趣的内容。

    1.Pycharm 的安装与配置 00:09:31

    介绍 Python 的集成开发环境 pycharm 的安装和配置,介绍运行和调试 Pycharm 脚本的方法。

    2.正则表达式符号与方法 00:21:51

    本课时介绍正则表达式的基本符号和基本匹配函数的使用。

    3.正则表达式的应用举例 00:06:42

    本课时通过举例介绍正则表达式在编写爬虫中的具体应用。

    4.实战——制作文本爬虫 00:08:46

    本课时会将一个网页的源代码保存在文本文件中,Python 通过读文件的方式加载这段源代码,并利用正则表达提取出感兴趣的内容。
  • 提问

    提交问题
  • 下载

  • 线路

    视频太卡?试试切换线路 √ 线路1 √ 线路2
  • 收藏

    收藏课程
  • 分享

连播

连续播放

关灯

关灯模式
视频加载太慢?

我们有两条线路可以选择,试试切换线路吧

基本的正则表达式

4课时,47分钟2015-04-23
kingname
kingname

极客学院签约布道师

课程背景:
定向爬虫的基本原理是将感兴趣的内容提取出来。目前互联网上绝大多数网页的排版结构都是根据一定的规律通过代码自动生成的,因此网页内容和结构有一定规律,正则表达式可以通过匹配这样的规律将感兴趣的内容提取出来。


核心内容:
1. Pycharm 介绍安装及配置
2. 正则表达式介绍
3. 正则表达式的基本符号
4. 正则表达式常用匹配方式
5. 正则表达式应用举例
6. 文本爬虫的制作


软件环境:Pycharm


是否提供资料:是


课程等级:中级


适合人群:
有 Python 基础,对数据挖掘感兴趣的人群。

  • 技术问答

相关课程

  • Python 初识

    本课程让新手先从总体上快速认识 Python,第一节课会用十分钟学习 Python 精华,然后从第二到第六节课会从头开始认识 Python。

    6课时 46分钟
    初级
    51038人学习
  • RESTful API 概述

    本课程介绍 RESTful 的应用场景,应该如何理解 RESTful 构架、基本的 HTTP 协议、课程将要使用的 Flask 框架,并通过一个简单的例子演示使用 Python 编写的 RESTful API。最后总结后学课程需要的前置知识并推荐阅读内容。

    4课时 21分钟
    初级
    18497人学习
  • Python语言Web开发框架web2py

    学会使用web2py创建网站

    3课时 15分钟
    初级
    39476人学习
  • Python语言基本语法

    本课讲解基本的Python语言语法。

    6课时 19分钟
    初级
    64438人学习