Чтение онлайн

на главную - закладки

Жанры

Python Библиотеки
Шрифт:

Индексация и выбор данных:

```python

# Выбор столбца по имени

age = df['Возраст']

# Выбор строки по индексу

row = df.loc[0]

```

Фильтрация данных:

```python

# Фильтрация по условию

filtered_df = df[df['Возраст'] > 25]

```

Добавление новых столбцов:

```python

# Добавление нового столбца

df['Зарплата'] = [50000, 60000, 45000]

```

Операции с группами:

```python

# Группировка данных по столбцу 'Город' и вычисление среднего значения возраста в каждой группе

grouped_df = df.groupby('Город')['Возраст'].mean

```

4. Визуализация данных с Pandas

Pandas также предоставляет встроенные средства для визуализации данных. Например, гистограмму можно построить следующим образом:

Давайте разберем пошагово строки кода:

– Импорт библиотек:

```python

import pandas as pd

import matplotlib.pyplot as plt

import seaborn as sns

```

Здесь мы импортируем необходимые библиотеки. `pd` – это стандартное соглашение для обозначения библиотеки Pandas. `matplotlib.pyplot` используется для создания графиков, а `seaborn` – библиотека для стилизации графиков и добавления дополнительных функций визуализации.

– Создание данных:

```python

data = {'Имя': ['Анна', 'Борис', 'Виктория'],

'Возраст': [25, 30, 22],

'Город': ['Москва', 'Санкт-Петербург', 'Киев']}

df = pd.DataFrame(data)

```

Мы создаем простой DataFrame с тремя колонками: 'Имя', 'Возраст' и 'Город'. Эти данные представляют собой три записи с именами, возрастами и городами.

Настраиваем стиль seaborn:

```python

sns.set(style="whitegrid")

```

Эта строка устанавливает стиль для графика с помощью библиотеки seaborn. Здесь мы выбрали стиль "whitegrid", который добавляет белую сетку на фоне графика.

– Создаем гистограмму:

```python

plt.figure(figsize=(8, 6))

sns.histplot(df['Возраст'], bins=20, kde=True, color='skyblue')

```

Здесь мы создаем гистограмму для столбца 'Возраст' из DataFrame. `figsize=(8, 6)` устанавливает размер графика. `bins=20` указывает количество столбцов в гистограмме. `kde=True` добавляет оценку плотности на гистограмму. `color='skyblue'` задает цвет графика.

– Добавляем подписи и заголовок:

```python

plt.xlabel('Возраст', fontsize=12)

plt.ylabel('Частота', fontsize=12)

plt.title('Гистограмма возрастов', fontsize=14)

```

Эти строки добавляют подписи к осям и заголовок для улучшения понимания графика

– Добавляем сетку:

```python

plt.grid(axis='y', linestyle='–', alpha=0.7)

```

Эта строка добавляет горизонтальную сетку для лучшей читаемости.

– Показываем график:

```python

plt.show

```

И наконец, эта строка отображает график.

Этот код создает красивую гистограмму с данными о возрасте и демонстрирует базовые шаги визуализации данных с использованием библиотек Pandas, Matplotlib и Seaborn в Python.

Pandas предоставляет эффективные инструменты для работы с табличными данными, что делает его широко используемым в анализе данных, машинном обучении и других областях. DataFrame позволяет легко выполнять множество операций, от фильтрации и группировки данных до визуализации результатов. Это делает Pandas мощным инструментом для аналитики и обработки данных в Python.

Приведем примеры фильтрации, сортировки и агрегации данных с использованием библиотеки Pandas на основе предположимого DataFrame с информацией о людях:

В этом примере мы использовали фильтрацию для выбора только тех записей, где возраст больше 25 лет.

Здесь мы отсортировали DataFrame по столбцу 'Возраст' в порядке убывания.

В данном примере мы использовали агрегацию для расчета среднего возраста и суммы зарплаты для каждого города.

Эти примеры показывают базовые операции фильтрации, сортировки и агрегации данных с Pandas, которые могут быть полезны при работе с табличными данными.

2.3. Matplotlib

Matplotlib – это библиотека для визуализации данных в языке программирования Python. Она предоставляет множество инструментов для создания различных типов графиков и диаграмм. Давайте рассмотрим несколько основных видов графиков и диаграмм, которые можно создать с помощью Matplotlib.

1. Линейный график

Линейный график подходит для визуализации зависимости одной переменной от другой. Рассмотрим пример:

```python

import matplotlib.pyplot as plt

# Создаем данные для примера

x = [1, 2, 3, 4, 5]

y = [10, 15, 7, 12, 9]

# Строим линейный график

plt.plot(x, y, marker='o', linestyle='-', color='b', label='Линейный график')

# Добавляем подписи и заголовок

plt.xlabel('X-ось')

plt.ylabel('Y-ось')

plt.title('Пример линейного графика')

plt.legend # Добавляем легенду

# Показываем график

plt.show

```

2. Гистограмма

Поделиться:
Популярные книги

Варвара Асенкова

Алянский Юрий Лазаревич
Корифеи русской и зарубежной сцены
Документальная литература:
биографии и мемуары
5.00
рейтинг книги
Варвара Асенкова

Государь

Кулаков Алексей Иванович
3. Рюрикова кровь
Фантастика:
мистика
альтернативная история
историческое фэнтези
6.25
рейтинг книги
Государь

Газлайтер. Том 22

Володин Григорий Григорьевич
22. История Телепата
Фантастика:
боевая фантастика
попаданцы
фэнтези
5.00
рейтинг книги
Газлайтер. Том 22

Меняя маски

Метельский Николай Александрович
1. Унесенный ветром
Фантастика:
боевая фантастика
попаданцы
9.22
рейтинг книги
Меняя маски

Вечная Война. Книга II

Винокуров Юрий
2. Вечная война.
Фантастика:
юмористическая фантастика
космическая фантастика
8.37
рейтинг книги
Вечная Война. Книга II

Моров. Том 4

Кощеев Владимир
3. Моров
Фантастика:
фэнтези
попаданцы
альтернативная история
аниме
5.00
рейтинг книги
Моров. Том 4

Я снова граф. Книга XI

Дрейк Сириус
11. Дорогой барон!
Фантастика:
боевая фантастика
попаданцы
аниме
5.00
рейтинг книги
Я снова граф. Книга XI

Жена по ошибке

Ардова Алиса
Любовные романы:
любовно-фантастические романы
7.71
рейтинг книги
Жена по ошибке

Неучтенный элемент. Том 3

NikL
3. Антимаг. Вне системы
Фантастика:
фэнтези
5.00
рейтинг книги
Неучтенный элемент. Том 3

Страх

Рыбаков Анатолий Наумович
2. Дети Арбата
Проза:
историческая проза
9.49
рейтинг книги
Страх

Инженер Петра Великого 2

Гросов Виктор
2. Инженер Петра Великого
Фантастика:
попаданцы
альтернативная история
фэнтези
5.00
рейтинг книги
Инженер Петра Великого 2

Черта прикрытия

Бэнкс Иэн М.
9. Культура
Фантастика:
боевая фантастика
космическая фантастика
киберпанк
6.67
рейтинг книги
Черта прикрытия

Газлайтер. Том 18

Володин Григорий Григорьевич
18. История Телепата
Фантастика:
попаданцы
аниме
фэнтези
5.00
рейтинг книги
Газлайтер. Том 18

Афганский рубеж 2

Дорин Михаил
2. Рубеж
Фантастика:
попаданцы
альтернативная история
5.00
рейтинг книги
Афганский рубеж 2