sql >> Database teknologi >  >> RDS >> Mysql

Hvordan grupperer man efter og tager tælling af unikke og tæller en vis værdi som aggregat på samme kolonne i python pandas?

Foretag en forbehandling ved at inkludere col4==3 som en kolonne før tid. Brug derefter aggregate

df.assign(result_col=df.col4.eq(3).astype(int)).groupby(
    ['col1', 'col2']
).agg(dict(col3='size', col4='nunique', result_col='sum'))

           col3  result_col  col4
col1 col2                        
1    4        2           2     1
     6        1           0     1

gamle svar

g = df.groupby(['col1', 'col2'])
g.agg({'col3':'size','col4': 'nunique'}).assign(
    result_col=g.col4.apply(lambda x: x.eq(3).sum()))

           col3  col4  result_col
col1 col2                        
1    4        2     1           2
     6        1     1           0

lidt omarrangeret

g = df.groupby(['col1', 'col2'])
final_df = g.agg({'col3':'size','col4': 'nunique'})
final_df.insert(1, 'result_col', g.col4.apply(lambda x: x.eq(3).sum()))
final_df

           col3  result_col  col4
col1 col2                        
1    4        2           2     1
     6        1           0     1


  1. Altid krypteret ydeevne:En opfølgning

  2. MySQL:kolonner med lav kardinalitet/selektivitet =hvordan indekseres?

  3. Django og PostgreSQL - værdien er for lang til, at typetegn varierer (512)

  4. Oracle Fuzzy tekstsøgning