Unique Pandas
В Pandas есть несколько способов найти уникальные значения в Series или DataFrame.
Метод 1: unique
Метод unique() находит уникальные значения в Series.
Пример:
python
import pandas as pd
data = [1, 1, 2, 3, 3, 3, 4, 5, 5]
s = pd.Series(data)
unique_values = s.unique()
print(unique_values)
Вывод:
array([1, 2, 3, 4, 5])
Метод 2: nunique
Метод nunique() возвращает количество уникальных значений в Series.
Пример:
python
import pandas as pd
data = [1, 1, 2, 3, 3, 3, 4, 5, 5]
s = pd.Series(data)
unique_values_count = s.nunique()
print(unique_values_count)
Вывод:
5
Метод 3: drop_duplicates
Метод drop_duplicates() находит уникальные строки в DataFrame. Этот метод сравнивает все столбцы строки и находит дубликаты.
Пример:
python
import pandas as pd
data = {
'name': ['John', 'Jack', 'John', 'Anna', 'Anna'],
'age': [25, 27, 25, 24, 24],
'city': ['New York', 'Los Angeles', 'Las Vegas', 'Chicago', 'Chicago']
}
df = pd.DataFrame(data)
unique_rows = df.drop_duplicates()
print(unique_rows)
Вывод:
name age city
0 John 25 New York
1 Jack 27 Los Angeles
2 John 25 Las Vegas
3 Anna 24 Chicago
Метод 4: duplicated
Метод duplicated() находит дубликаты строк в DataFrame.
Пример:
python
import pandas as pd
data = {
'name': ['John', 'Jack', 'John', 'Anna', 'Anna'],
'age': [25, 27, 25, 24, 24],
'city': ['New York', 'Los Angeles', 'Las Vegas', 'Chicago', 'Chicago']
}
df = pd.DataFrame(data)
duplicated_rows = df[df.duplicated()]
print(duplicated_rows)
Вывод:
name age city
2 John 25 Chicago
4 Anna 24 Chicago
Это только некоторые из методов Pandas для нахождения уникальных значений. Pandas также предлагает множество других функций и методов для работы со строками и столбцами в DataFrame.