5天40课时 · 数据分析与可视化项目实战

Python数据分析和可视化项目实战

围绕 Numpy、Pandas、数据清洗、聚合统计、词云、关联分析、Matplotlib、Seaborn、Streamlit 数据大屏和综合项目,帮助学员掌握从数据处理到智慧决策呈现的完整流程。

5天40课时实战
8单元完整数据链路
Pandas清洗/重塑/聚合
大屏Streamlit交互展示
项目RFM/零售/金融
理论和Python实践结合

按照数据分析基本步骤讲解理论,再用 Python 库快速实现分析程序。

以Numpy和Pandas为核心

从数组计算、表格读写、索引访问,到清洗、重塑、合并和统计聚合。

可视化与数据大屏落地

使用 Matplotlib、Seaborn 和 Streamlit 构建图表、交互页面和数据大屏。

贴近业务场景项目

通过 RFM 客户细分、零售行业分析、互联网金融分析完成综合实战。

Course Overview

掌握数据分析,开启智慧决策

使用 Python 进行数据分析十分便利且高效,因此 Python 被认为是优秀的数据分析工具之一。本课程从理论和实战两个角度介绍 Python 数据分析工具,并采用理论分析与 Python 实践相结合的形式,让学员在理解数据分析基础理论的同时快速上手实现分析程序。

课程围绕 Numpy、Pandas 的数据处理和计算展开,并在后半部分进入数据可视化、Streamlit 数据大屏搭建和综合项目实战。学员将学习如何绘制图形、搭建实时交互大屏,并用 RFM 模型等方法完成客户细分和业务分析。

Python数据分析和可视化课程主视觉

Training Goals

八项能力目标,覆盖数据分析全流程

从数据读取、清洗、转换、统计、挖掘,到图表、大屏和业务项目表达。

01

搭建分析环境

掌握 Anaconda、Jupyter Notebook 的安装使用,建立可复用的数据分析工作环境。

02

Numpy数组计算

理解 ndarray 创建、访问、排序、矢量运算、文件操作、统计函数和矩阵运算。

03

Pandas数据处理

掌握 Series、DataFrame、Excel/Csv读写、索引切片、布尔索引、赋值计算和排序。

04

清洗重塑数据

完成列行操作、concat/merge、索引重置、apply/map、缺失值、异常值、重复值处理。

05

统计分析建模

掌握描述性统计、groupby聚合、频次、透视表、交叉表、环比同比、相关性和时间序列。

06

文本和关联分析

使用 jieba 分词、词频、词云,并理解 Apriori、FP-growth 与 mlxtend 关联分析。

07

数据可视化表达

使用 Matplotlib 和 Seaborn 绘制折线、条形、饼图、散点、箱型、雷达、面积等图形。

08

交互大屏和项目实战

用 Streamlit 搭建数据大屏,并完成 RFM、零售行业和拍拍贷金融分析项目。

Toolchain

工具链地图:从数据表到可交互大屏

课程工具链聚焦真实分析工作中最常用的 Python 数据处理、图表和交互展示能力。

Env

Anaconda / Jupyter

建立数据分析环境,支持交互式代码、过程记录和实验复现。

Num

Numpy

处理数组、随机数据、统计函数、字符串函数和矩阵运算。

Pan

Pandas

读写Excel/Csv,处理DataFrame,完成清洗、重塑、聚合和时间序列。

Text

Jieba / WordCloud

完成中文分词、词频统计和词云可视化表达。

Rule

Apriori / FP-growth

实现购物篮、推荐和关联规则分析。

Chart

Matplotlib / Seaborn

绘制基础图形、高级统计图形和风格化可视化作品。

Dash

Streamlit

实现文本、数据、图表、多媒体、交互控件和页面布局。

Biz

RFM / Retail / Finance

落地客户细分、零售行业分析和互联网金融数据分析项目。

Five-Day Path

5天学习路径:从数据基础到项目大屏

按数据分析工作的自然顺序推进,每天都有明确的能力目标和实践主题。

Day 1

环境、Numpy与Pandas基础

理解数据分析概念,搭建 Anaconda 与 Jupyter,掌握 Numpy 数组和 Pandas 基础数据结构。

Day 2

数据重塑和清洗

围绕 DataFrame 的行列操作、合并连接、缺失值、异常值、重复值和离散化开展练习。

Day 3

统计分析和文本挖掘

完成描述统计、聚合、透视、环比同比、相关性、时间序列、词云和关联分析。

Day 4

可视化和交互大屏

学习 Matplotlib、Seaborn 与 Streamlit,完成图表绘制和数据可视化大屏搭建。

Day 5

综合项目实战

按完整数据分析流程完成 RFM 客户细分、零售行业分析和拍拍贷互联网金融分析。

Full Syllabus

完整课程大纲:8个单元逐项展开

保留原大纲核心内容,同时整理为适合网页浏览的模块化结构。

单元 1

数据分析概念和 Numpy

建立数据分析认知,掌握环境搭建和 Numpy 数组计算基础。

环境与概念

  • 数据分析概述。
  • Anaconda环境搭建和使用。
  • Jupyter Notebook使用。
  • Python的不足之处。

数组基础

  • Numpy概述和常用类型。
  • ndarray数组创建。
  • random随机函数使用。
  • 数组访问、排序、赋值和矢量运算。

函数和计算

  • 文件操作。
  • 统计函数。
  • 字符串函数。
  • 一元函数、二元函数和矩阵运算函数。
单元 2

Pandas 基础

掌握 Series、DataFrame、文件读写、索引访问和基础计算。

数据结构

  • Pandas数据结构:Series。
  • Pandas数据结构:DataFrame。
  • 访问DataFrame。
  • 使用索引和切片。

文件读写

  • 读写Excel文件。
  • 读写Csv文件。
  • 数据排序。
  • DataFrame赋值和计算。

索引方式

  • 使用普通索引。
  • 使用切片。
  • 使用花式索引。
  • 使用布尔索引筛选数据。
单元 3

Pandas 数据重塑和清洗

处理真实数据中的合并、缺失、异常、重复和离散化问题。

结构重塑

  • 列的添加、删除和修改。
  • 行的添加、删除和修改。
  • 使用concat合并DataFrame。
  • 使用merge连接DataFrame。

转换处理

  • 重置索引和修改列名。
  • apply、map和applymap使用。
  • 分类数据离散化。
  • 连续型数据离散化。

质量治理

  • 缺失值查找、删除和更新。
  • 异常值查找和处理。
  • 重复值查找和处理。
  • 形成数据清洗方法库。
单元 4

Pandas 数据分析

用统计、聚合、透视、相关性和时间序列方法理解数据。

统计聚合

  • 描述性统计。
  • 使用groupby聚合统计。
  • 使用value_counts计算频次。
  • 数据排列名次。

业务分析

  • 数据透视表。
  • 数据交叉表。
  • 环比和同比。
  • 相关性分析。

时间序列

  • 时间序列和时间索引。
  • 时间索引重采样。
  • 升采样和降采样。
  • 面向时间维度的趋势分析。
单元 5

词云和关联分析

处理文本数据,并通过关联规则挖掘商品或行为之间的关系。

中文文本处理

  • jieba分词。
  • jieba词频和分词字典。
  • 词云可视化文本。
  • 用可视化表达文本主题。

关联分析

  • 关联分析概念。
  • Apriori算法。
  • FP-growth算法。
  • mlxtend包实现关联分析。

案例实战

  • 餐厅推荐案例。
  • 从交易数据提取关联规则。
  • 理解支持度、置信度和提升度。
  • 形成推荐分析思路。
单元 6

数据可视化

使用 Matplotlib 和 Seaborn 建立图表表达能力。

Matplotlib

  • 数据可视化意义。
  • Matplotlib概述和常规配置。
  • Latex常用格式。
  • 绘图对象和子图绘制。

基础图形

  • 折线图、条形图、饼图、散点图。
  • 箱型图、雷达图、面积图。
  • 理解图形适用场景。
  • 完成可视化实战。

Seaborn

  • 整体风格设置。
  • 基本图形绘制。
  • 高级图形绘制。
  • 统计图形与分析表达结合。
单元 7

Streamlit 搭建数据大屏

将数据、图表和交互控件组织成可演示的数据应用。

基础能力

  • Streamlit简介。
  • 文本显示。
  • 数据显示支持。
  • 数据可视化支持。

交互和布局

  • 图表可视化支持。
  • 用户交互支持。
  • 多媒体支持。
  • 页面布局和容器。

大屏实战

  • 流程控制系统。
  • 会员管理。
  • 搭建数据可视化大屏。
  • 实现实时展示与交互。
单元 8

数据分析项目综合实战

按完整流程完成客户细分、零售和互联网金融分析。

分析流程

  • 数据分析流程。
  • 从业务问题到数据指标。
  • 从清洗到分析输出。
  • 从图表到结论表达。

客户细分

  • RFM模型原理。
  • 客户细分-RFM模型实战。
  • 客户价值识别。
  • 精细化运营分析思路。

行业项目

  • 零售行业分析。
  • 拍拍贷互联网金融分析。
  • 综合数据分析报告。
  • 项目复盘和展示。

Practice Projects

项目实战:从餐厅推荐到金融分析

课程通过多个真实感业务场景,把数据处理、统计分析、可视化和大屏展示串起来。

餐厅推荐关联分析

使用 Apriori、FP-growth 和 mlxtend,从消费或偏好数据中挖掘组合关系,理解推荐逻辑。

AprioriFP-growthmlxtend

Streamlit数据可视化大屏

整合文本、数据表、图表、交互控件、页面布局和业务模块,搭建可演示的数据大屏。

Streamlit交互控件数据大屏

RFM客户细分

围绕最近一次消费、消费频率和消费金额进行客户价值分层,支持运营策略和营销决策。

RFM客户分层运营分析

零售行业分析

从销售数据中分析商品、客户、时间和渠道表现,形成零售经营洞察和图表化表达。

零售销售分析可视化报告

拍拍贷互联网金融分析

围绕互联网金融数据进行清洗、统计、特征观察和图表表达,训练金融业务分析思路。

金融数据统计分析风险观察

综合分析报告

按数据分析流程完成问题定义、数据处理、统计分析、可视化展示、结论提炼和项目汇报。

流程闭环图表表达结论汇报

Audience & Service

适合人群与学习服务

课程适合对数据分析感兴趣,并具备 Python 核心语法、统计学基础和 Excel 应用能力的学员。

数据分析初学者

希望系统学习 Python 数据处理、分析和可视化方法。

业务分析从业者

零售、金融等行业希望提升数据处理、报表和洞察能力的人员。

授课形式

小班精讲、面授或直播、案例分析、操作演示、练习实践和课堂答疑。

课后服务

1年内课程答疑、课件资料升级分享、录播回看和免费重修。

从一张数据表,到一套可交互的数据分析作品

完整呈现工具链、学习路径、8个单元、项目实战和课后服务。