-
数据分析基础
- 数据分析概述
- 数据分析环境
- 数据分析工具
-
高效数组运算
- Numpy概述
- NumPy类型
- NumPy数组
- NumPy矩阵
- NumPy统计函数
- NumPy运算函数
- NumPy排序函数
- NumPy随机函数
- NumPy去重函数
- NumPy广播
- NumPy案例
-
数据处理分析
- Pandas概述
- Pandas序列
- Pandas数据框
- Pandas数据导入
- Pandas数据清洗
- Pandas数据分析
- Pandas数据导出
- Pandas分析案例
-
数据图表绘制
- 数据可视化
- Matplotlib绘图
- Pandas绘图
- Seaborn绘图
1 数据分析简介
数据分析是对Excel数据、数据库中的数据、收集的大量数据、网页抓取的数据进行分析,从中提取有价值的信息并形成结论进行展示的过程。

2 数据分析流程
加载->预处理->统计分析->导出或结果展示

3 数据分析工具
(1) NumPy:专注于高性能的数组计算。
(2) Pandas:主打结构化数据的分析、清洗与处理。
(3) Matplotlib:提供全面的 Python 数据可视化能力。
4 数据获取方式
(1) 内部数据:公司内部已有的数据,通常存储在文件或数据库中。
(2) 外部数据:公开数据集、API 接口、爬虫抓取、购买其他公司的数据、社交媒体数据、问卷调查、通过各类物联网终端设备获取等等。
5 数据分析应用
(1) 买东西、做生意:比如淘宝知道你喜欢什么,给你推荐商品;超市预测下个月哪种牛奶卖得最好,提前多进货。
(2) 银行和钱:比如银行判断你能不能贷款;发现你的银行卡是不是被盗刷了。
(3) 工厂和物流:比如工厂分析生产过程,找出哪里慢,提高效率;快递公司分析路线,让包裹送得更快。
(4) 医院和健康:比如医生用你的检查数据判断病情;研究新药有没有效果。
(5) 上网和手机:比如抖音给你推你爱看的视频;网站改版后,看看大家用起来方不方便。
(6) 城市和政府:比如分析哪里堵车最严重,想办法解决;警察根据数据预测哪里可能有小偷,加强巡逻。