Pandas 数据框获取每组的第一行-pandas-IT问答社区-解决你的IT疑问

Pandas 数据框获取每组的第一行

Oros Tom 2月前

我有一个如下所示的 pandas DataFrame：df = pd.DataFrame({'id' : [1,1,1,2,2,3,3,3,3,4,4,5,6,6,6,7,7], 'value' : [\'first\',\'second\',\'second\',\'fi...

如下的 DataFrame 熊猫

df = pd.DataFrame({'id' : [1,1,1,2,2,3,3,3,3,4,4,5,6,6,6,7,7],
                'value'  : ["first","second","second","first",
                            "second","first","third","fourth",
                            "fifth","second","fifth","first",
                            "first","second","third","fourth","fifth"]})

我想对此进行分组 ["id","value"] 并获取每组的第一行：

        id   value
0        1   first
1        1  second
2        1  second
3        2   first
4        2  second
5        3   first
6        3   third
7        3  fourth
8        3   fifth
9        4  second
10       4   fifth
11       5   first
12       6   first
13       6  second
14       6   third
15       7  fourth
16       7   fifth

预期成果：

id   value
 1   first
 2   first
 3   first
 4  second
 5  first
 6  first
 7  fourth

我尝试了以下方法，但只给出了第一行 DataFrame .

In [25]: for index, row in df.iterrows():
   ....:     df2 = pd.DataFrame(df.groupby(['id','value']).reset_index().ix[0])

帖子版权声明 1、本帖标题：Pandas 数据框获取每组的第一行
本站网址：http://xjnalaquan.com/
2、本网站的资源部分来源于网络，如有侵权，请联系站长进行删除处理。
3、会员发帖仅代表会员个人观点，并不代表本站赞同其观点和对其真实性负责。
4、本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
5、站长邮箱：yeweds@126.com 除非注明，本帖由Oros Tom在本站《pandas》版块原创发布，转载请注明出处！

最新回复 (0)

最新倒序只看楼主

paulsm4 2月前 0 取消查看

引用 2楼
使用 .first() 获取第一个（非空）元素。
```
>>> df.groupby('id').first()
     value
id        
1    first
2    first
3    first
4   second
5    first
6    first
7   fourth
```
如果需要 id 作为列：
```
>>> df.groupby('id').first().reset_index()
   id   value
0   1   first
1   2   first
2   3   first
3   4  second
4   5   first
5   6   first
6   7  fourth
```
要获取前 n 条记录，可以使用 .head() :
```
>>> df.groupby('id').head(2).reset_index(drop=True)
    id   value
0    1   first
1    1  second
2    2   first
3    2  second
4    3   first
5    3   third
6    4  second
7    4   fifth
8    5   first
9    6   first
10   6  second
11   7  fourth
12   7   fifth
```

关于作者

Oros Tom

UID:26260一级用户组

主题数
0

帖子数
0

精华数
0

注册排名
26260

导航

论坛

我的

Pandas 数据框获取每组的第一行

Oros Tom

TAG

作者主题

作者最近主题：