数据可视化 | Pandas vs Plotnine

admin 2020年9月1日12:56:36评论214 views字数 2291阅读7分38秒阅读模式

腾讯课堂 | Python网络爬虫与文本分析


使用Pandas和plotnine可视化数据

目标:

  • 学会使用pandas内置的作图功能
  • 使用pands作散点图和直方图?
  • 使用plotnine定制一个画布
  • 从dataframe数据中构建复杂的定制化图表
  • 导出作图结果
之前分享过很多pandas可视化、plotnine可视化,
使用pandas做数据可视化
plotnine: Python版的ggplot2作图库
但是两者对比的还没有,今天我们尝试分别用pandas和plotnine作直方图、散点图。

导入数据

%matplotlib inline
import pandas as pd
import warnings
warnings.filterwarnings('ignore')

ecoli = pd.read_csv('ecoli.csv')
ecoli.head()

数据可视化 | Pandas vs Plotnine


直方图

pandas直方图

ecoli['genome_size'].plot.hist()

数据可视化 | Pandas vs Plotnine


#带标题
ecoli['genome_size'].plot.hist(title='Histogram with pandas')

数据可视化 | Pandas vs Plotnine


plotnine直方图

from plotnine import ggplot, aes, geom_histogram

(ggplot(data=ecoli, #dataframe数据
        mapping=aes(x='genome_size'))  #需要统计的x轴
 + geom_histogram(bins=15#直方图分为15个区间
)

数据可视化 | Pandas vs Plotnine


from plotnine import ggplot, aes, geom_histogram, labs

(ggplot(data=ecoli,
        mapping=aes(x='genome_size'))
 + geom_histogram(bins=15)  
 + labs(title='Histogram with Plotnine'

)

数据可视化 | Pandas vs Plotnine


散点图

pandas散点图

ecoli.plot.scatter(x='generation',y='genome_size')

数据可视化 | Pandas vs Plotnine


#带标题、点的颜色、点的形状marker
ecoli.plot.scatter(x='generation',y='genome_size'
                   title='Scater plot with pandas', c='green', marker='+')

数据可视化 | Pandas vs Plotnine


plotnine散点图

from plotnine import ggplot, aes, geom_point, labs

(ggplot(data=ecoli,
        mapping=aes(x = 'sample', y= 'genome_size'))
 + geom_point(alpha=0.5, color='blue'#散点图
 + labs(title='scatter plot with plotnine')
)

数据可视化 | Pandas vs Plotnine


from plotnine import ggplot, aes, geom_point, labs, theme, element_text

(ggplot(data=ecoli,
        mapping=aes(x = 'sample', y= 'genome_size'))
 + geom_point(alpha=0.5, color='blue'#透明度alpha
 + labs(title='scatter plot with plotnine')
 + theme(axis_text_x=element_text(angle=45, hjust=1)) #设置x轴的文本角度和水平居中程度
)

数据可视化 | Pandas vs Plotnine


from plotnine import ggplot, aes, geom_point, labs, theme, element_text

#除x、y轴,增加一个颜色维度
(ggplot(data=ecoli,
           mapping=aes(x = 'sample', y= 'genome_size', color='generation'))
 + geom_point(alpha=0.5)
 + labs(title='scatter plot with plotnine')
 + theme(axis_text_x = element_text(angle=45, hjust=1))
)

数据可视化 | Pandas vs Plotnine

近期文章

[更新] Python网络爬虫与文本数据分析 
tidytext | 耳目一新的R-style文本分析库
rpy2库 | 在jupyter中调用R语言代码
reticulate包 | 在Rmarkdown中调用Python代码
plydata库 | 数据操作管道操作符>>
plotnine: Python版的ggplot2作图库
七夕礼物 | 全网最火的钉子绕线图制作教程
读完本文你就了解什么是文本分析
文本分析在经管领域中的应用概述  
综述:文本分析在市场营销研究中的应用
plotnine: Python版的ggplot2作图库
小案例: Pandas的apply方法  
stylecloud:简洁易用的词云库 
用Python绘制近20年地方财政收入变迁史视频  
Wow~70G上市公司定期报告数据集
漂亮~pandas可以无缝衔接Bokeh  
YelpDaset: 酒店管理类数据集10+G  
后台回复关键词【20200901】获取本文R代码
    分享”和“在看”是更好的支持!




  • 左青龙
  • 微信扫一扫
  • weinxin
  • 右白虎
  • 微信扫一扫
  • weinxin
admin
  • 本文由 发表于 2020年9月1日12:56:36
  • 转载请保留本文链接(CN-SEC中文网:感谢原作者辛苦付出):
                   数据可视化 | Pandas vs Plotninehttp://cn-sec.com/archives/113818.html

发表评论

匿名网友 填写信息