使用Pandas和plotnine可视化数据
目标:
-
学会使用pandas内置的作图功能 -
使用pands作散点图和直方图? -
使用plotnine定制一个画布 -
从dataframe数据中构建复杂的定制化图表 -
导出作图结果
导入数据
%matplotlib inline
import pandas as pd
import warnings
warnings.filterwarnings('ignore')
ecoli = pd.read_csv('ecoli.csv')
ecoli.head()
直方图
pandas直方图
ecoli['genome_size'].plot.hist()
#带标题
ecoli['genome_size'].plot.hist(title='Histogram with pandas')
plotnine直方图
from plotnine import ggplot, aes, geom_histogram
(ggplot(data=ecoli, #dataframe数据
mapping=aes(x='genome_size')) #需要统计的x轴
+ geom_histogram(bins=15) #直方图分为15个区间
)
from plotnine import ggplot, aes, geom_histogram, labs
(ggplot(data=ecoli,
mapping=aes(x='genome_size'))
+ geom_histogram(bins=15)
+ labs(title='Histogram with Plotnine')
)
散点图
pandas散点图
ecoli.plot.scatter(x='generation',y='genome_size')
#带标题、点的颜色、点的形状marker
ecoli.plot.scatter(x='generation',y='genome_size',
title='Scater plot with pandas', c='green', marker='+')
plotnine散点图
from plotnine import ggplot, aes, geom_point, labs
(ggplot(data=ecoli,
mapping=aes(x = 'sample', y= 'genome_size'))
+ geom_point(alpha=0.5, color='blue') #散点图
+ labs(title='scatter plot with plotnine')
)
from plotnine import ggplot, aes, geom_point, labs, theme, element_text
(ggplot(data=ecoli,
mapping=aes(x = 'sample', y= 'genome_size'))
+ geom_point(alpha=0.5, color='blue') #透明度alpha
+ labs(title='scatter plot with plotnine')
+ theme(axis_text_x=element_text(angle=45, hjust=1)) #设置x轴的文本角度和水平居中程度
)
from plotnine import ggplot, aes, geom_point, labs, theme, element_text
#除x、y轴,增加一个颜色维度
(ggplot(data=ecoli,
mapping=aes(x = 'sample', y= 'genome_size', color='generation'))
+ geom_point(alpha=0.5)
+ labs(title='scatter plot with plotnine')
+ theme(axis_text_x = element_text(angle=45, hjust=1))
)
近期文章
[更新] Python网络爬虫与文本数据分析 tidytext | 耳目一新的R-style文本分析库 rpy2库 | 在jupyter中调用R语言代码 reticulate包 | 在Rmarkdown中调用Python代码 plydata库 | 数据操作管道操作符>> plotnine: Python版的ggplot2作图库 七夕礼物 | 全网最火的钉子绕线图制作教程 读完本文你就了解什么是文本分析 文本分析在经管领域中的应用概述 综述:文本分析在市场营销研究中的应用 plotnine: Python版的ggplot2作图库 小案例: Pandas的apply方法 stylecloud:简洁易用的词云库 用Python绘制近20年地方财政收入变迁史视频 Wow~70G上市公司定期报告数据集 漂亮~pandas可以无缝衔接Bokeh YelpDaset: 酒店管理类数据集10+G 后台回复关键词【20200901】获取本文R代码
免责声明:文章中涉及的程序(方法)可能带有攻击性,仅供安全研究与教学之用,读者将其信息做其他用途,由读者承担全部法律及连带责任,本站不承担任何法律及连带责任;如有问题可邮件联系(建议使用企业邮箱或有效邮箱,避免邮件被拦截,联系方式见首页),望知悉。
- 左青龙
- 微信扫一扫
-
- 右白虎
- 微信扫一扫
-
评论