Pandas DataFrame[].unique(): Einzigartige Werte ermitteln
Sie können bei Python Pandas DataFrames die unique()
-Funktion nutzen, um die eindeutigen Werte in einer Spalte eines DataFrames zu ermitteln. So können Sie sich effizient eine Übersicht der verschiedenen Werte innerhalb eines Datensatzes verschaffen.
- Flexibel: Hosting, das jedem Website-Traffic standhält
- Verlässlich: Inklusive 24/7-Support und persönlicher Beratung
- Sicher: Kostenloses SSL-Zertifikat, DDoS-Schutz und Backups
Syntax von Pandas DataFrame[].unique()
Die grundlegende Syntax für die Anwendung von Pandas unique()
ist einfach, denn die Funktion nimmt keinerlei Parameter entgegen:
DataFrame['column_name'].unique()
pythonBeachten Sie, dass bei Pandas DataFrames unique()
nur auf eine spezifische Spalte des DataFrames angewendet werden kann. Diese müssen Sie also zuvor spezifizieren. Die unique()
-Funktion liefert Ihnen ein numpy-Array mit den einzigartigen Werten in der Reihenfolge ihres Erscheinens zurück; eine Sortierung der Werte findet nicht statt.
Wenn Sie sich schon länger mit Python-Programmierung beschäftigen, kennen Sie sicher auch das numpy-Äquivalent zu Pandas unique()
-Funktion. Eine Anwendung der Pandas-Variante ist aus Effizienzgründen vorzuziehen.
Anwendung von Pandas unique()
Auf Pandas DataFrames kann unique()
dann genutzt werden, wenn Sie zuvor eine Spalte spezifizieren, in der nach eindeutigen Werte gesucht werden soll.
Im folgenden Beispiel betrachten wir einen DataFrame mit Informationen über verschiedene Personen.
import pandas as pd
data = {
'Name': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
'Alter': [24, 27, 22, 32, 29],
'Stadt': ['New York', 'Los Angeles', 'New York', 'Chicago', 'Los Angeles']
}
df = pd.DataFrame(data)
print(df)
pythonDer resultierende DataFrame sieht wie folgt aus:
Name Alter Stadt
0 Alice 24 New York
1 Bob 27 Los Angeles
2 Charlie 22 New York
3 David 32 Chicago
4 Edward 29 Los Angeles
Es sollen nun die Städte ermittelt werden, in denen diese Personen leben. Hierbei soll jede Stadt nur ein einziges Mal gelistet werden. Pandas unique()
-Funktion wird hierzu auf der Spalte des DataFrames angewendet, die die Städte enthält:
# Eindeutige Städte finden
unique_cities = df['Stadt'].unique()
print(unique_cities)
pythonDie Ausgabe ist ein numpy-Array, der jede Stadt ein Mal enthält. Dies zeigt, dass die Personen aus drei verschiedenen Städten stammen: New York, Los Angeles und Chicago.
['New York' 'Los Angeles' 'Chicago']