python生成报告与图表库

Posted by Jinming Qiao on January 5, 2020

python生成报告与图表库


ReportLab

  • 安装
    • pip install reportlab
  • 主要层级
    • 可“绘制” PDF页面的图形画布API
    • 图表和窗口小部件库,用于创建可重复使用的数据图形
    • 页面布局引擎,通过元素(例如标题,段落,字体,表格和矢量图形)构建文档
  • 使用
    • 企业报告工具套件的附加实用程序,也是用于批处理PDF文件的最通用的工具。该套件可在所有通用计算平台上运行
    • 使用PageCatcher过滤器脚本模式将页面提取为特殊的数据文件格式,提取的页面可以由ReportLab程序导入,提取是一次性的设计时步骤,然后可以非常快速地将生成的数据文件包含在新文档中
  • 使用方式
    1. 作为具有许多有用选项的命令行应用程序
    2. 作为Python脚本中的库
    3. 由RML文档中的标签控制

pyecharts

  • 安装
    • pip install pyecharts
  • 介绍
    • pyecharts 是一个用于生成 Echarts 图表的类库,echarts 是百度开源的一个数据可视化 JS 库,主要用于数据可视化。pyecharts 是一个用于生成 Echarts 图表的类库,实际上就是 Echarts 与 Python 的对接
    • 使用 pyecharts 可以生成独立的网页,也可以在 flask , Django 中集成使用
  • 教程
    • https://pyecharts.org/#/zh-cn/
  • 特性
    • 简洁的 API 设计,使用如丝滑般流畅,支持链式调用
    • 囊括了 30+ 种常见图表,应有尽有
    • 支持主流 Notebook 环境,Jupyter Notebook 和 JupyterLab
    • 可轻松集成至 Flask,Django 等主流 Web 框架
    • 高度灵活的配置项,可轻松搭配出精美的图表
    • 详细的文档和示例,帮助开发者更快的上手项目
    • 多达 400+ 地图文件以及原生的百度地图,为地理数据可视化提供强有力的支持

pandas-profiling

  • 安装
    • pip install pandas-profiling
  • 用途
    • 可为任何机器学习数据集生成漂亮的交互式报告
  • 特征
    • 类型推断:检测DataFrame中列的类型
    • 概要:类型,唯一值,缺失值分位数统计信息,例如最小值,Q1,中位数,Q3,最大值,范围
    • 四分位数范围描述性统计数据,例如均值,众数,标准偏差,和,中位数绝对偏差,变异系数,峰度,偏度最常使用的值
    • 高度相关变量(Spearman,Pearson和Kendall矩阵)的相关性突出显示缺失值矩阵,计数(count),热图和缺失值树状图