首页PythonKanaries/pygwalker
Kanaries

pygwalker

AI#Python#Data Visualization#Jupyter#Data Analysis
前往 GitHub →
15,762

// 项目简介

PyGWalker 将 pandas DataFrames 转换为交互式用户界面,从而简化了 Jupyter Notebook 中的数据分析与可视化过程。它集成了 Graphic Walker 库,提供类似于 Tableau 的拖拽式体验,方便用户进行数据探索和清洗。用户可以直接在现有的 Python 工作流中轻松创建各种图表类型、应用筛选器并执行可视化数据转换。

// 技术分析

PyGWalker 是一个 Python 库,旨在通过将 Graphic Walker 界面直接集成到 Jupyter Notebooks 中来简化探索性数据分析。它将静态的 pandas DataFrames 转换为交互式的、类似 Tableau 的可视化环境,允许用户通过直观的拖放操作进行数据清洗、转换和可视化。通过弥合基于代码的数据操作与可视化探索之间的差距,它显著降低了获取快速数据洞察的门槛。一个值得注意的技术权衡是它支持使用 DuckDB 进行基于内核的计算,这使得在本地处理大型数据集(高达 100GB)的同时保持 UI 的响应速度。

// 核心亮点

01
提供了一个交互式的拖放界面,将 pandas DataFrames 转换为可视化探索工具。
02
包含内置的数据清洗和转换功能,可直观地识别异常值并创建新特征。
03
支持多种图表类型,包括柱状图、折线图和散点图,并提供对标签和颜色的广泛自定义。
04
提供与 Jupyter Notebooks、Streamlit 和其他兼容 IPython 环境的无缝集成。
05
通过利用 DuckDB 作为后端计算引擎,实现对大型数据集的高性能处理。
06
允许用户直接从界面保存和导出图表配置及可视化输出。

// 典型使用场景

01
交互式拖拽数据探索与可视化
02
Jupyter Notebook 内的可视化数据清洗与转换
03
与 Streamlit 无缝集成以构建基于 Web 的数据应用

// 快速开始

首先,使用 'pip install pygwalker' 或通过 conda 安装该库。在 Jupyter Notebook 中,导入该库并将您的 pandas DataFrame 传递给 'pyg.walk()' 函数以启动交互式界面。您可以通过设置 'kernel_computation=True' 参数来进一步优化大型数据集的性能。