Plotting Scatter Charts with Python
Одна из самых популярных функций для визуализации данных в Python - это функция plot scatter, которая позволяет создавать диаграммы рассеяния для двух переменных. Рассмотрим ее возможности и примеры использования в данном ответе.
Функция plot scatter из библиотеки matplotlib.pyplot принимает на вход два массива данных, соответствующих двум переменным, которые нужно сравнить между собой. Каждое значение массива данных определяет одну точку на графике.
Пример кода:
import matplotlib.pyplot as plt
x = [1, 2, 3, 4, 5]
y = [10, 20, 30, 40, 50]
plt.scatter(x, y)
plt.show()
В этом примере мы создали два массива данных x и y, и заполнили их значениями. Затем мы вызвали функцию scatter из библиотеки matplotlib.pyplot и передали ей эти массивы данных в качестве аргументов. В результате, на экране появился график, на котором каждая точка соответствует значению из массивов x и y.
Можно изменять цвет и форму точек на диаграмме, используя параметры функции scatter. Например, если мы хотим сделать точки желтыми и круглыми, то можем записать такой код:
plt.scatter(x, y, c='yellow', marker='o')
plt.show()
Параметр c отвечает за цвет точек (в этом случае мы выбрали желтый), а параметр marker - за форму точек (в этом случае мы выбрали круглую точку).
Также можно изменять размер точек на диаграмме, используя параметр s:
plt.scatter(x, y, c='green', marker='^', s=100)
plt.show()
Параметр s отвечает за размер точек (в этом случае мы выбрали размер 100).
Кроме того, можно добавлять к графику подписи осей, заголовок и легенду:
plt.scatter(x, y, c='blue', marker='s', s=50)
plt.xlabel('Переменная X')
plt.ylabel('Переменная Y')
plt.title('Диаграмма рассеяния')
plt.legend(['Точки'])
plt.show()
Такой код добавляет подписи осей (параметры xlabel и ylabel), заголовок (параметр title) и легенду (параметр legend) к доступной диаграмме рассеяния.
Использование функции plot scatter для визуализации данных позволяет анализировать зависимости между двумя переменными и делать выводы на основе полученных графиков.