背景

PyGraphistry 是一个 Python 可视化图形 AI 库,用于提取、转换、分析和可视化大图形,特别是与 Graphistry 端到端 GPU 服务器会话一起使用。

图形学被用于解决诸如设备和用户行为的视觉映射、调查欺诈、分析机器学习结果以及从图形 AI 开始等问题。它提供了时间条、搜索、过滤、集群、着色、共享等指向和点击功能。Graphistry 是为大型图表构建的唯一工具。客户端定制的 WebGL 渲染引擎一次可以渲染 8MM 节点+边缘,而大多数老客户端图形处理器可以平滑地支持 100K 到 2MM 的元素。服务器端 GPU 分析引擎支持更大的图形。它平滑了 PyData 生态系统中的图形工作流,包括 Pandas/Spark/Dask 数据帧,Nvidia RAPIDS GPU 数据帧和 GPU 图形,DGL/PyTorch 图形神经网络,以及各种数据连接器。

官方文档参考

Python 教程

文章采用 Kaggle 中链接以 链接类型 - 网址 为例,数据源 Kaggle URL Classification

安装库:pip install graphistry

主要绘图代码如下

1
2
3
4
5
6
import graphistry
# graphistry.__version__ '0.23.2'
graphistry.register(api=3, protocol="https", server="hub.graphistry.com", username=USER_NAME, password=PWD)

g = graphistry.edges(edges, "type", "host").nodes(nodes, "node")
g.plot(name = "url-link-graph")

对应的可视化结果如下,Web 端提供多种可视化分析和统计工具,同时可嵌入 Jupyter 中!

图例