Original size 381x549

Анализ данных и их визуализации

PROTECT STATUS: not protected

Вводная часть

Для создания графиков были выбраны сводные данные о лекарствах в формате таблица Excel. В данной таблице представлены сведения об исключенных лекарственных препаратах разделенные по следующим столбцам: 1) Международное название, 2) Торговое наименование, 3) Лекарственная фирма, 4) Производитель, 5) Количество, 6) Предельная цена, 7) Номер сертификата, 8) Дата регистрации, 9) Штрих-код, 10) Причина исключения, 11) Дата исключения. И далее идет список из 435 строк с различными препаратами и информацией о них.

big
Original size 1920x671

Фрагмент из таблицы с данными для анализа

Было интересно проанализировать именно данные из предметно-количественного учета аптеки, потому что в результате работы можно изучить новые материалы, с которыми не доводилось сталкиваться прежде и провести их анализ.

В результате анализа были выбраны следующие виды диаграмм: линейчатая диаграмма, гистограмма, круговая диаграмма и диаграмма Парето. Именно на них можно качественно и точно отобразить и скомбинировать данные для наилучшего понимания и усвоения информации из таблицы.

Этапы работы

big
Original size 834x841

готовый код (1)

Original size 832x799

готовый код (2)

1. Вначале происходит подготовка данных:

Импорт библиотек: : Импортируем библиотеку Pandas для работы с данными. : Импортируем библиотеку Matplotlib для построения графиков. : Импортируем библиотеку Seaborn для создания визуализаций, основанных на Matplotlib. Далее загрузка данных: : Загружаем данные из файла med.xlsx в DataFrame df. Устранение неиспользуемых колонок: : Удаляем столбцы ‘Цена’ и ‘atc’ из DataFrame. изменяет DataFrame напрямую.

2. Следующий шаг-это преобразование данных:

Создание колонки ‘Страна производитель’: Определяем функцию russia (country): Если в строке country присутствует слово «Россия», возвращаем «Россия». Иначе возвращаем «Иностранный производитель». : Применяем функцию russia ко всем значениям в столбце ‘Производитель’ и создаем новый столбец ‘Страна производитель’. Переопределение типа для колонки ‘Предельная цена’: : Преобразуем тип данных в столбце ‘Предельная цена’ в строковый.

: Заменяем запятые на точки в строковых значениях. : Извлекаем числовые значения из строк и преобразуем их в тип float.

3. Производим анализ и визуализацию:

Установка стиля для графиков: : Устанавливаем стиль «whitegrid» для графиков Seaborn. Подсчёт самых распространённых торговых наименований: : Подсчитываем количество появлений каждого торгового наименования и берем 10 самых частых. : Строим столбчатую диаграмму, показывающую количество лекарств для 10 самых распространенных наименований.

Средние цены для производителей из России и других стран: : Вычисляем среднюю предельную цену для каждого типа производителя (Россия / Иностранный). : Строим столбчатую диаграмму, сравнивающую средние цены для российских и зарубежных производителей.

4. Подсчёт причин исключения:

: Подсчитываем количество появлений каждой причины исключения. : Строим круговую диаграмму, показывающую процентное соотношение разных причин исключения.

5.Подсчёт количества по производителям: : Подсчитываем количество лекарств для 10 самых распространенных производителей. : Строим столбчатую диаграмму, показывающую количество лекарств для 10 самых распространенных производителей. Построение гистограммы распределения предельных цен: : Строим гистограмму, показывающую распределение предельных цен лекарств.

Для стилизации графиков была выбрана лаконичная цветовая гамма и определенное количество пастельных оттенков, чтобы верно различать данные в таблице и их нельзя было спутать. Для таких же целей выбран контрастный темный фон.

Итоговые графики

Original size 1059x549

Линейчатая диаграмма

Original size 692x550

Гистограмма

Original size 1001x621

Круговая диаграмма

Original size 1112x392

Линейчатая диаграмма

Original size 837x533

Диаграмма Парето

Анализ данных и их визуализации
We use cookies to improve the operation of the website and to enhance its usability. More detailed information on the use of cookies can be fo...
Show more