数据分析

  • 数据分析基础
    • 数据分析概述
    • 数据分析环境
    • 数据分析工具
  • 高效数组运算
    • Numpy概述
    • NumPy类型
    • NumPy数组
    • NumPy矩阵
    • NumPy统计函数
    • NumPy运算函数
    • NumPy排序函数
    • NumPy随机函数
    • NumPy去重函数
    • NumPy广播
    • NumPy案例
  • 数据处理分析
    • Pandas概述
    • Pandas序列
    • Pandas数据框
    • Pandas数据导入
    • Pandas数据清洗
    • Pandas数据分析
    • Pandas数据导出
    • Pandas分析案例
  • 数据图表绘制
    • 数据可视化
    • Matplotlib绘图
    • Pandas绘图
    • Seaborn绘图

1 数据分析简介

数据分析是对Excel数据、数据库中的数据、收集的大量数据、网页抓取的数据进行分析,从中提取有价值的信息并形成结论进行展示的过程。


2 数据分析流程

加载->预处理->统计分析->导出或结果展示



3 数据分析工具

(1) NumPy:专注于高性能的数组计算。
(2) Pandas:主打结构化数据的分析、清洗与处理。
(3) Matplotlib:提供全面的 Python 数据可视化能力。


4 数据获取方式

(1) 内部数据:公司内部已有的数据,通常存储在文件或数据库中。
(2) 外部数据:公开数据集、API 接口、爬虫抓取、购买其他公司的数据、社交媒体数据、问卷调查、通过各类物联网终端设备获取等等。


5 数据分析应用

(1) 买东西、做生意:比如淘宝知道你喜欢什么,给你推荐商品;超市预测下个月哪种牛奶卖得最好,提前多进货。
(2) 银行和钱:比如银行判断你能不能贷款;发现你的银行卡是不是被盗刷了。
(3) 工厂和物流:比如工厂分析生产过程,找出哪里慢,提高效率;快递公司分析路线,让包裹送得更快。
(4) 医院和健康:比如医生用你的检查数据判断病情;研究新药有没有效果。
(5) 上网和手机:比如抖音给你推你爱看的视频;网站改版后,看看大家用起来方不方便。
(6) 城市和政府:比如分析哪里堵车最严重,想办法解决;警察根据数据预测哪里可能有小偷,加强巡逻。