海詩網 知識百科 pandas(pandas讀取excel文件)

pandas(pandas讀取excel文件)

pandas, 熊貓對groupby的用法有什么詳細解釋?不知道小伙伴們今天來看看邊肖的分享吧!

在熊貓中,社交領域根據用戶畫像(性別、年齡)對用戶進行細分,對用戶使用和偏好的研究主要由groupby完成。

pandas讀取excel文件

Groupby的基本原則:

在pandas中,分組操作的代碼非常簡單,只需要一行代碼。這里上面的數據集是按照公司字段劃分的:in [5]: group=data。分組依據(公司)。

將上述代碼輸入ipython后,您將獲得一個DataFrameGroupBy對象。

In [6]: group

Out[6]: pandas.core.groupby.generic.DataFrameGroupBy object at0x000002B7E2650240

那么這個生成的DataFrameGroupBy是什么呢?groupby on data之后發(fā)生了什么?ipython返回的結果是它的內存地址,不利于直觀理解。為了了解群體內部的情況,

在這里,組被轉換成列表的形式:

In [8]: list(group)

Out[8]:

[(A, company salary age

3 A 20 22

6 A 23 33),

(B, company salary age

4 B 10 17

5 B 21 40

8 B 8 30),

(C, company salary age

0 C 43 35

1 C 17 25

2 C 8 30

7 C 49 19)]

轉換成列表后,可以看出列表由三個元組組成。在每個元組中,第一個元素是一個組(這里是按公司分組的,所以最后分為A、B、C),第二個元素是對應組下的一個DataFrame。

整個過程可以說明如下:

pandas讀取excel文件

總結一下,groupby的流程就是根據groupby(這里是company)的領域,把原來的數據幀分成若干個分組的數據幀,分組的數據幀有多少就有多少。

因此,一系列操作(如agg、apply等。)之后的groupby都是基于子數據幀操作。

pandas,以上就是本文為您收集整理的pandas最新內容,希望能幫到您!更多相關內容歡迎關注。

本文來自網絡,不代表海詩網立場,轉載請注明出處:http://x91880.com/n/168027.html
      

學小易更新了怎么恢復舊版本(更新的軟件怎么恢復舊版本)

發(fā)表回復
聯(lián)系我們
聯(lián)系我們

在線咨詢: QQ交談

郵箱: 3587015498@qq.com

工作時間:周一至周五,9:00-17:30,節(jié)假日休息

關注微信
微信掃一掃關注我們
微信掃一掃關注我們
關注微博
返回頂部