首页 > 大数据平台研发工程师 > PB级分布式查询引擎应用解析
PB级分布式查询引擎应用解析
  • PB级分布式查询引擎应用解析

  • 主讲 : 付力力
  • 分布式查询引擎是大数据信息采集与处理的基础,本课程从常见查询引擎分析讲解开始,到各查询引擎的使用场景,再最后通过Impala框架的使用,让用户快速学会查询引擎的使用。
  • ¥89.00 ¥99.00 ¥85.00
  • 立即购买 Pro会员免费学

    0人学习时长 : 2.3 小时有效期 : 180 天 有效期自支付成功后开始计算,到期后仍可观看课程视频和图文,但不再享受问答和作业批改服务。Pro用户可享受无视有效期权限,随时随意轻松看。单课购买用户需关注课程有效期,合理安排学习计划。

课程概述

首先介绍查询引擎的基本概念,然后依次讲解主流的查询引擎的特性和各自的适用范围,最后针对几个查询引擎的典型应用场景进行详细的分析。详细了解 Impala 的具体实现,包括架构、存储优化、查询执行过程等,并能针对具体的应用场景进行性能分析和优化。

适用人群

大数据平台研发初学者

服务保障

学习:视频、源码、PPT并举
课程:逻辑清晰,层次分明

常见问题

Q:如果有问题,我去哪里咨询?
A:关于课程的任何问题,都可以点击“右下角”的在线客服,我们会有专人为您解答。

Q:『有效期』是什么?
A:『有效期』从订单支付成功后开始计算,到期后仍然可以观看职业方向独立课程视频和图文,但不再享受问答和作业批改等服务。
Q:VIP价格是什么?
A:购买过极客学院 VIP 会员的用户,可享受职业学院课程 VIP 价格,这个价格会比现价有一定的优惠。

Q: 有的章节的知识我已经会了,可以跳过吗?
A: 可以,整个课程采用自由学习方式,不设置每个课时的前后限制要求。

Q: 课程的视频提供下载么?
A: 我们的课程视频进行加密处理,暂时不支持下载。

PB级分布式查询引擎应用解析

主讲:付力力

首先介绍查询引擎的基本。概念,然后依次讲解主流的查询引擎的特性和各自的适用范围,最后针对几个查询引擎的典型应用场景进行详细的分析。详细了解 Impala 的具体实现,包括架构、存储优化、查询执行过程等,并能针对具体的应用场景进行性能分析和优化。

第 1 部分 分布式查询引擎介绍 58 分钟

第 1 节 分布式查询引擎的基本概念 16 分钟
什么是查询引擎
分布式查询引擎的一般应用
分布式查询引擎的评价指标
第 2 节 主流查询引擎的特性对比 22 分钟
Hive
Impala
Presto
Spark
Druid
其它分析型数据库
第 3 节 不同应用场景中的查询引擎方案选型 20 分钟
在不同应用场景中的查询引擎方案选型

第 2 部分 Impala 架构详细解析 82 分钟

第 1 节 Impala 的整体架构 8 分钟
整体架构
第 2 节 Impala 的查询执行过程分析 26 分钟
Impala 的查询执行过程分析
第 3 节 Impala 的不同存储方式对比 18 分钟
Impala 的不同存储方式对比
第 4 节 Impala 的性能分析和优化 30 分钟
Impala 的性能分析和优化

学员服务

主讲老师

  • 付力力

    极客学院布道师

    神策数据联合创始人&首席架构师,曾担任百度新产品研发部、网页搜索部、基础架构部工程师。