Data Science, Python, Economie ...

Accueil

df.query() - filtrer un dataframe

Méthode permettant de filtrer un dataframe avec une condition retournant un booléen.

df_q = df.query('total > 1_000_000_000')

On peut accéder à des variables externes en précisant @ devant son nom :

df_q = df('population > @max_value')

Afin d'éviter les problèmes de parsage lorsque l'on utilise plusieurs conditions, il peut être utile d'utiliser des parenthèses :

df_q = df.query('(population > @max_value) or (population < @min_value)')