Python數(shù)據(jù)可視化:深入理解pandas直方圖繪制
在上一篇文章中,我們介紹了使用Python的pandas庫來繪制柱形圖,今天我們將討論直方圖。盡管直方圖與柱形圖看起來很相似,但直方圖通常更適用于連續(xù)數(shù)據(jù)而不是分類或離散數(shù)據(jù)。 引入相關(guān)模塊和創(chuàng)建數(shù)
在上一篇文章中,我們介紹了使用Python的pandas庫來繪制柱形圖,今天我們將討論直方圖。盡管直方圖與柱形圖看起來很相似,但直方圖通常更適用于連續(xù)數(shù)據(jù)而不是分類或離散數(shù)據(jù)。
引入相關(guān)模塊和創(chuàng)建數(shù)據(jù)框
首先,我們需要引入必要的模塊并創(chuàng)建一個(gè)數(shù)據(jù)框。讓我們快速查看一下我們將要使用的數(shù)據(jù):
假設(shè)我們有以下數(shù)據(jù)集。我們可以使用hist()
方法直接繪制列數(shù)據(jù)的直方圖。
這里展示的是繪制出的圖。有些人可能會(huì)疑惑為什么要輸出圖片,而不直接使用show()
方法展示圖像。實(shí)際上,這樣做是有意義的。在我看來,我更傾向于使用Python進(jìn)行數(shù)據(jù)分析,并將輸出的圖片導(dǎo)入到word或excel中,以生成數(shù)據(jù)分析報(bào)告。因此,show()
操作是無法達(dá)到這一目的的。
同時(shí)繪制多列的直方圖
我們也可以同時(shí)繪制數(shù)據(jù)框中所有列的直方圖。這將返回一個(gè)numpy.ndarray對(duì)象,其中的元素是對(duì)象。
如果你使用的是集成平臺(tái)如Python(x, y),在去掉print后(df.hist(color'39B', alpha0.5, bins50)
)可以直接看到四個(gè)圖的輸出。但如果你是一個(gè)程序員,我建議避免使用Python(x, y),因?yàn)樗⒉惶m合專業(yè)開發(fā)者。所以,除非你調(diào)用show()
或savefig
方法,否則無法直接查看這些圖形。
使用by參數(shù)進(jìn)行分組
在繪制直方圖時(shí),我們經(jīng)常會(huì)用到by
參數(shù)來設(shè)定分組。這對(duì)于在數(shù)據(jù)集中按照特定條件進(jìn)行分組顯示直方圖非常有用。
通過以上步驟,我們深入了解了如何使用pandas庫繪制直方圖,并掌握了一些高級(jí)技巧。希望這篇文章能夠幫助你更好地利用Python進(jìn)行數(shù)據(jù)可視化和分析。