Count Distinct: Find Unique Values in Your Data
Оператор count distinct предназначен для подсчета количества уникальных значений в столбце или группе столбцов в таблице базы данных.
Пример использования оператора count distinct в SQL:
SELECT COUNT(DISTINCT column_name) FROM table_name;
Где column_name - имя столбца, для которого нужно выполнить подсчет уникальных значений, а table_name - имя таблицы.
Например, если у нас есть таблица students со столбцом name, содержащим имена студентов, чтобы узнать, сколько уникальных имен студентов в таблице, можно написать такой SQL-запрос:
SELECT COUNT(DISTINCT name) FROM students;
Также оператор count distinct может быть использован для подсчета количества уникальных значений в группе столбцов. Например, если у нас есть таблица sales со столбцами product и region, содержащими названия товаров и регионы продаж, чтобы узнать, сколько уникальных сочетаний товар-регион есть в таблице, можно написать такой SQL-запрос:
SELECT COUNT(DISTINCT product, region) FROM sales;
В результате выполнения этого запроса будет получено число, соответствующее количеству уникальных сочетаний товар-регион в таблице.
Пример использования оператора count distinct в языке программирования Python с использованием библиотеки Pandas:
import pandas as pd
data = {'Name': ['John', 'Mike', 'John', 'Alex', 'Mike'],
'Age': [25, 30, 25, 40, 30]}
df = pd.DataFrame(data)
# Подсчет количества уникальных имен
count_names = len(df['Name'].unique())
print("Количество уникальных имен в таблице:", count_names)
# Подсчет количества уникальных комбинаций имени и возраста
count_names_age = len(df.groupby(['Name', 'Age']).size().reset_index())
print("Количество уникальных комбинаций имени и возраста в таблице:", count_names_age)
В результате выполнения этого кода будет выведено количество уникальных имен и количество уникальных комбинаций имени и возраста в таблице.