教程大纲
该系列教程是以数据分析师技能为核心,展开讲解数据分析师的三大技能:SQL、Excel和Python。三大技能中每一项技能的内容都极其庞大,将全部内容收录在一份教程中是不现实的。同时,由于数据分析师只是侧重利用三大技能某些方面,学习全部的内容也是一件非常“不经济”的事情。所以该系列教程从数据分析师的视角建立起三方面技能的知识大纲。
该系列教程的大纲内容如下:
1. SQL教程
- SQL教程基本介绍与SQL基础知识:主要从整体上给大家展示在SQL教程中讲解的内容和逻辑框架,并对SQL的基础知识进行介绍,方便大家了解后续的教程内容。
- 数据表的增、删、改:讲解SQL中如何创建表格、修改表格和删除表格。
- SQL的单表查询:讲解单表查询范式,掌握单表查询中的语句,单表查询中的每一个语句都很重要。
- SQL的函数:从熟悉函数、字符串函数、日期函数、窗口函数和其他函数五个方面对数据分析师常用的SQL函数进行介绍。
- 子查询与表连接:介绍嵌套查询(子查询)和表连接查询,两者都是实现复杂查询的基础,并介绍SQL执行顺序。
- 练习题:基于实际的应用场景,给出较为复杂的查询练习题。
2.Excel教程
- Excel的基本介绍:介绍Excel的面板,方便大家熟悉Excel的界面。
- 数据读取与整理:介绍从文本文件导入数据,从其他数据表复制数据,将数据进行分列处理。
- 数据处理与数据分析——常用功能:介绍常用的筛选、排序、查找替换、格式调整和隐藏功能。
- 数据处理与数据分析——常用函数:介绍Excel的函数体系,并介绍单元格的地址引用和函数嵌套。
- 数据可视化——Excel内置图表:主要讲解Excel内置的各种图表,Excel的常用图表足以覆盖数据分析师的日常工作,最后给出各类图表的使用场景。
- 数据可视化——图表优化与自动化图表:通过实际的图表演示如何将Excel的内置图表进行优化,并给出随着数据逐渐增加而自动更新的图表。
- Excel课程设计:给出实际爬取的数据分析师招聘数据,对相关的数据开展分析。
3.Python教程
- Python的基本介绍:主要介绍为什么要学习Python
- Python的下载安装:Anaconda安装与使用
- Python的基础数据类型:对Python的基础数据类型进行介绍,包括基础数据类型的定义和运算
- Python的基本代码:讲解Python的入门语法、三种基本结构和函数
- Python常用库——numpy:讲解数组数据类型的创建、基本运算,矩阵和random库
- Python常用库——pandas的数据类型:介绍Series的创建、索引和运算,介绍DataFrame的创建和索引
- Python常用库——DataFrame的运算:DataFrame作为数据分析师最常用的数据类型,对DataFrame的各种运算进行详细的讲解
- Python常用库——matplotlib:介绍如何使用matplotlib绘制常用的图表,并演示如何对图表的元素进行优化
- Python常用库——seaborn:介绍如何使用seaborn绘制图表
- Python课程设计:演示如何使用Python进行大数定律和中心极限定理的实证,并演示如何使用Python实现对数据集的分析
数据分析师的基本技能图谱如下图
数据分析师快速入门——技能篇 文章被收录于专栏
数据分析入门技术篇