Unique Pandas

В Pandas есть несколько способов найти уникальные значения в Series или DataFrame.

Метод 1: unique

Метод unique() находит уникальные значения в Series.

Пример:

 python
import pandas as pd
data = [1, 1, 2, 3, 3, 3, 4, 5, 5]
s = pd.Series(data)
unique_values = s.unique()
print(unique_values)

Вывод:


array([1, 2, 3, 4, 5])

Метод 2: nunique

Метод nunique() возвращает количество уникальных значений в Series.

Пример:

 python
import pandas as pd
data = [1, 1, 2, 3, 3, 3, 4, 5, 5]
s = pd.Series(data)
unique_values_count = s.nunique()
print(unique_values_count)

Вывод:

Метод 3: drop_duplicates

Метод drop_duplicates() находит уникальные строки в DataFrame. Этот метод сравнивает все столбцы строки и находит дубликаты.

Пример:

 python
import pandas as pd
data = {
    'name': ['John', 'Jack', 'John', 'Anna', 'Anna'],
    'age': [25, 27, 25, 24, 24],
    'city': ['New York', 'Los Angeles', 'Las Vegas', 'Chicago', 'Chicago']
}
df = pd.DataFrame(data)
unique_rows = df.drop_duplicates()
print(unique_rows)

Вывод:


   name  age         city
0  John   25     New York
1  Jack   27  Los Angeles
2  John   25    Las Vegas
3  Anna   24      Chicago

Метод 4: duplicated

Метод duplicated() находит дубликаты строк в DataFrame.

Пример:

 python
import pandas as pd
data = {
    'name': ['John', 'Jack', 'John', 'Anna', 'Anna'],
    'age': [25, 27, 25, 24, 24],
    'city': ['New York', 'Los Angeles', 'Las Vegas', 'Chicago', 'Chicago']
}
df = pd.DataFrame(data)
duplicated_rows = df[df.duplicated()]
print(duplicated_rows)

Вывод:


   name  age     city
2  John   25  Chicago
4  Anna   24  Chicago

Это только некоторые из методов Pandas для нахождения уникальных значений. Pandas также предлагает множество других функций и методов для работы со строками и столбцами в DataFrame.

Unique Pandas

Похожие вопросы на: "unique pandas "