Bemind
Учебник Python
Учебник Python
  • Python
    • Python Lists
      • Списковые включения в Python (Полное руководство с примерами)
      • Исправление ValueError: Слишком Много Значений Для Распаковки в Python
      • Как добавить словарь в список в Python
      • Как добавить строку в список в Python
      • Разница между массивами и списками в Python
      • Python: Различия между списками и кортежами
      • Как проверить, пуст ли список в Python
      • Как Итерировать (Циклически Проходить) По Списку в Python
      • Python List sort(): Подробное руководство по сортировке списков
      • Python List Extend: Как добавить несколько элементов в список
      • Python: Найти Индекс Всех Вхождений Элемента в Списке
      • Конвертация списка словарей в Pandas DataFrame
      • Генерация случайных чисел в Python
      • Поиск Индекса в Списке Python: Найти Первое, Последнее или Все Вхождения
      • Добавить в начало списка в Python (Вставить в начало)
      • Найти дубликаты в списке Python
      • Python: Умножение Списков (6 Различных Способов)
      • Python списки: Полный обзор
      • Python: Выбор случайного элемента из списка
      • 4 Способа Очистить Список в Python
      • Объяснение ошибки IndexError в Python: индекс списка выходит за пределы допустимого диапазона
      • Python: Получение индекса максимального элемента в списке
      • Python: Объединение списков – Слияние списков (8 способов)
      • Python: Проверка наличия элемента в списке
      • Python: Проверка наличия элемента в списке
      • Удаление элемента из списка в Python (pop, remove, del, clear)
      • Как перевернуть список в Python (6 способов)
      • Python: Замена элемента в списке (6 различных способов)
      • Python: Удаление дубликатов из списка (7 способов)
      • Python: Преобразование словаря в список кортежей (4 простых способа)
      • Python: Перемешать Список (Случайное Распределение Элементов Списка в Python)
      • Python: Пересечение двух списков
      • Python: Вычитание двух списков (4 простых способа!)
      • Длина или Размер Списка в Python: 5 Способов Узнать Длину Списка
      • Python: Транспонирование списка списков (5 простых способов!)
      • Python: Разделение списка (Пополам, на части)
      • Python: Комбинации списка (Получить все комбинации списка)
      • Python: Выравнивание списка списков (4 способа)
      • Разница между списками в Python: Нахождение разницы между двумя списками Python
      • Python: Найти среднее значение списка или списка списков
      • Как добавлять элементы в списки в Python – 4 простых способа!
      • Списковые включения в Python (Полное руководство с примерами)
      • 6 способов преобразовать список Python в строку
    • Python Dictionaries
      • Понимание словаря Python (с примерами)
      • Исправляем ValueError: Слишком Много Значений Для Распаковки в Python
      • Как добавить словарь в список в Python
      • Преобразование JSON в словарь Python
      • Полное руководство по вложенным словарям в Python
      • Копирование словаря в Python: Полное руководство
      • Конвертация списка словарей в Pandas DataFrame
      • Поиск дубликатов в списке Python
      • Полный обзор словарей в Python
      • Python: Добавление пары Ключ:Значение в Словарь
      • Python: Сортировка словаря по значениям
      • Слияние Словарей в Python – Комбинирование Словарей (7 Способов)
      • Python: Удаление Дубликатов из Списка (7 Способов)
      • Python: Преобразование словаря в список кортежей (4 простых способа)
      • Python: Красивая Печать Словаря (Dictionary) – 4 Способа
      • Python: Проверка пуст ли словарь (5 способов!)
      • Copy of Python: Проверка пуст ли словарь (5 способов!)
      • Python: Проверьте, существует ли ключ (или значение) в словаре (5 простых способов)
      • Python: Проверьте, существует ли ключ (или значение) в словаре (5 простых способов)
      • Python: Получение Ключа Словаря с Максимальным Значением (4 Способа)
      • Python: Удаление ключа из словаря (4 разных способа)
      • Как красиво вывести JSON-файл в Python (6 методов)
    • Python Strings
      • Python Капитализация Строк: Руководство по Преобразованию слов в Заглавные
      • Python strip: Как обрезать строку в Python
      • Python Обратная Строка: Руководство по Реверсированию Строк
      • Как Удалить Префикс или Суффикс из Строки в Python
      • Преобразование строки в формат заголовка в Python с помощью str.title()
      • Как добавить строку в список в Python
      • Python String startswith: Проверка, начинается ли строка с подстроки
      • Python String endswith: Проверка того, заканчивается ли строка подстрокой
      • Как удалить первый или последний символ из строки в Python
      • Как исправить: SyntaxError в Python - EOL при сканировании строкового литерала
      • Python String Contains: Проверка Наличия Подстроки в Строке
      • Как проверить, пустая ли строка в Python
      • Python Новая Строка и Как Печатать Без Переноса Строки
      • Как Конкатенировать Строки в Python: Полное Руководство
      • Python: Подсчет слов в строке или файле
      • Как создать список алфавита в Python
      • Python: Конкатенация строки и целого числа (Int)
      • Python: Сортировка строки (4 различных способа)
      • Python zfill и rjust: Добавление нулей в строку в Python
      • Python: Целое в Двоичное (Преобразование целого числа в двоичную строку)
      • Python rfind: Нахождение индекса последней подстроки в строке
      • Python SHA256 хеширование алгоритм: объяснение
      • Python: Усечение числа с плавающей точкой (6 различных способов)
      • Выбор между методами Python isdigit(), isnumeric() и isdecimal()
      • Python: Удаление специальных символов из строки
      • Python Приведение Строки к Нижнему Регистру с помощью .lower(), .casefold(), и .islower()
      • Python программа для проверки, является ли строка палиндромом (6 методов)
      • Python: Найдите все перестановки строки (3 легких способа!)
      • Python: Удаление пунктуации из строки (3 разных способа!)
      • Python: Найти индекс (или все индексы) подстроки в строке
      • Python: Удаление символов новой строки из строки
      • Python: Удаление символа из строки (4 способа)
      • Python: Количество вхождений в строке (4 способа!)
    • Встроенные функции Python
      • abs()
      • ascii()
      • aiter()
      • all()
      • any()
      • anext()
      • bin()
      • bool()
      • breakpoint()
      • bytearray()
      • bytes()
      • callable()
      • chr()
      • classmethod()
      • compile()
      • complex()
      • delattr()
      • dict()
      • dir()
      • divmod()
      • enumerate()
      • eval()
      • exec()
      • filter()
      • float()
      • format()
      • frozenset()
      • getattr()
      • globals()
      • hasattr()
      • hash()
      • help()
      • hex()
      • id()
      • input()
      • int()
      • issubclass()
      • iter()
      • len()
      • list()
      • locals()
      • map()
      • max()
      • memoryview()
      • min()
      • next()
      • object()
      • oct()
      • open()
      • ord()
      • pow()
      • print()
      • property()
      • range()
      • repr()
      • reversed()
      • round()
      • set()
      • setattr()
      • isinstance()
      • slice()
      • zip()
      • type()
      • sorted()
      • staticmethod()
      • str()
      • sum()
      • super()
      • tuple()
      • vars()
      • import()
    • Cобеседования Python. Разбор реальных вопросов.
    • Встроенные методы в Python
  • Учебники по Pandas и Numpy
    • Numpy
      • Функция активации ReLU для глубокого обучения: полное руководство по выпрямленному линейному блоку
      • Как нормализовать массивы NumPy (минимальное-максимальное масштабирование, Z-оценка, L2)
      • NumPy where: Условная обработка элементов массива
      • NumPy linspace: создание равномерно расположенных массивов с помощью np.linspace
      • Как рассчитать векторное произведение в Python
      • Разделение NumPy: Разделение массива NumPy на части
      • NumPy: Лучшие способы применения функции к массиву
      • NumPy full: Создание массивов с заданным значением
      • NumPy clip(): Ограничьте значения массива минимальным и максимальным значениями
      • NumPy cumsum: Расчет кумулятивных сумм массивов NumPy
      • Изучаем функцию np.histogram в NumPy: создаем гистограмму
      • NumPy arange(): Полное руководство (с примерами)
      • Руководство по индексации и срезам массивов NumPy: Полное руководство
      • NumPy argmin(): Получение индекса минимального значения в массивах
      • Выравнивание массива с помощью NumPy flatten
      • Объединение массивов NumPy по различным осям с использованием функции stack
      • Удаление размерности из массивов NumPy с помощью NumPy Squeeze
      • Функция np.repeat() NumPy: Повторение массивов NumPy
      • Использование функции NumPy.exp() для вычисления экспоненты
      • Реализация функции сигмоида на Python
      • NumPy Pad: Использование np.pad() для дополнения массивов и матриц
      • np.argmax(): Как использовать NumPy Argmax
      • NumPy logspace: Понимание функции np.logspace()
      • Использование NumPy Tile для Расположения Массивов
      • NumPy Zeros: Создание массивов и матриц с нулями в NumPy
      • Использование числа Пи в Python (NumPy и Math)
      • Распределение Нормального (Гауссова) Распределения в Numpy (Случайное Нормальное в Numpy)
      • NumPy для Data Science на Python
      • Расчет скалярного произведения с использованием Numpy в Python
      • Расчет натурального логарифма на Python
    • Pandas
      • Python сводные таблицы – Полное руководство
      • Изучение API стиля Pandas
      • Объяснение группировки по нескольким столбцам в Pandas с примерами
      • Удаление индексной колонки DataFrame в Pandas: Руководство с примерами
      • Pandas Quantile: Расчет процентилей в DataFrame
      • Как рассчитать скользящее среднее (среднее арифметическое) в Pandas
      • Руководство по использованию метода fillna в Pandas для работы с отсутствующими данными в DataFrame
      • Pandas unique(): Получение уникальных значений в DataFrame
      • Распакуйте Ваши Данные с Помощью Функции Melt в Pandas
      • Pandas date_range: Как Создать Диапазон Дат в Pandas
      • Сброс индекса в Pandas: как сбросить индекс в Pandas
      • Pandas replace() – Замена значений в DataFrame Pandas
      • Перемещение столбца DataFrame Pandas на позицию (В начало и в конец)
      • Учебное пособие по Python Pandas: полное руководство
      • Pandas: Замена NaN на нули
      • Преобразование DataFrame Pandas в файл Pickle
      • Конвертация Pandas DataFrame в JSON
      • Преобразование DataFrame Pandas в Словарь
      • Преобразование Pandas DataFrame в Список
      • Чтение файлов Parquet в Pandas с помощью pd.read_parquet
      • Pandas dropna(): Удаление отсутствующих записей и столбцов в DataFrame
      • Как Добавить Новый Столбец в DataFrame Pandas
      • Подсчёт уникальных значений в Pandas
      • Отображение всех столбцов и строк в DataFrame Pandas
      • Pandas to_excel: Запись DataFrames в файлы Excel
      • Как использовать Pandas для чтения файлов Excel в Python
      • Преобразование списка словарей в Pandas DataFrame
      • Как добавить/вставить строку в DataFrame Pandas
      • Диаграмма рассеяния в Pandas: Как создать диаграмму рассеяния в Pandas
      • Pandas to_datetime: Преобразование строки Pandas в дату и время
      • Введение в Pandas для Data Science
      • Индексация, Выборка и Присваивание Данных в Pandas
      • Суммирование и Анализ Pandas DataFrame
      • Преобразование столбцов Pandas с помощью map и apply
      • Группировка данных в Pandas с использованием cut и qcut
      • Дата и время в Pandas и Python
      • Очистка и подготовка данных в Pandas и Python
      • Pandas GroupBy: группировка, суммирование и агрегация данных в Python
      • Pandas Дата и Время в Части Даты (месяц, год и т.д.)
      • Pandas: Получение номера строки из DataFrame
      • Вычисление Взвешенного Среднего в Pandas и Python
      • Как перемешать строки Pandas Dataframe в Python
      • Pandas: количество столбцов (подсчет столбцов в DataFrame)
      • Pandas Sum: сложение столбцов и строк DataFrame
      • Pandas Diff: Вычисление Разницы Между Строками Pandas
      • Нормализация столбца или датафрейма Pandas (с использованием Pandas или sklearn)
      • Функция Rank в Pandas: Ранжирование данных в Dataframe (Эквивалент SQL row_number)
      • Pandas Describe: Описательная статистика вашего Dataframe
      • Pandas Shift: Перемещение столбца DataFrame вверх или вниз
      • 7 Способов Выполнения Выборки Данных в Pandas
      • Экспорт DataFrame Pandas в CSV файл – Использование .to_csv()
      • Pandas: Итерация по строкам DataFrame в Pandas
      • Pandas: Преобразование значений столбца в строки
      • Дисперсия в Pandas: Вычисление дисперсии столбца в Pandas Dataframe
      • Pandas: Создание DataFrame из списков (5 способов!)
      • Pandas Rename Index: Как переименовать индекс DataFrame в Pandas
      • Pandas: Подсчёт уникальных значений в объекте GroupBy
      • Pandas: Добавить дни к колонке с датами
      • Среднее в Pandas: Как рассчитать среднее для одной или нескольких колонок
      • Pandas Column to List – Конвертируйте колонку Pandas в список
      • Транспонирование Dataframe в Pandas
      • Python: Разделение DataFrame Pandas
      • Как получить имена столбцов в DataFrame Pandas
      • Pandas: Количество строк в DataFrame (6 способов)
      • Создание пустого DataFrame Pandas и добавление данных
      • Как переименовать столбцы в Pandas DataFrame (с примерами)
      • Изменение порядка столбцов в Pandas: использование метода reindex и метода insert
      • Pandas get_dummies (One-Hot кодирование), объяснение
      • Относительные и Абсолютные Частоты в Python и Pandas
      • Финансовый год – Определение финансового года в Pandas
      • Как сортировать данные в DataFrame Pandas
  • Учебники Matplotlib и Seaborn
    • Seaborn
      • Регрессионные графики в Seaborn с использованием regplot и lmplot
      • Seaborn residplot – Построение остатков линейной регрессии
      • Seaborn jointplot() – Создание совместных графиков в Seaborn
      • Seaborn displot – Распределенческие графики в Python
      • Seaborn ecdfplot – Эмпирические функции накопленного распределения
      • Seaborn rugplot – Визуализация маргинальных распределений
      • Seaborn kdeplot – Создание графиков оценки плотности ядра
      • Seaborn histplot – Создание Гистограмм в Seaborn
      • Seaborn catplot – Визуализация категориальных данных в Python
      • Средняя тенденция для категориальных данных в Seaborn Pointplot
      • Seaborn stripplot: Jitter Plots для распределений категориальных данных
      • Seaborn Countplot – Подсчет категориальных данных в Python
      • Seaborn swarmplot: Bee Swarm Plots для распределения категориальных данных
      • Скрипичные графики Seaborn в Python: Полное руководство
      • Настройка расположения легенд Seaborn, меток, текста и т.д.
      • Тепловая карта Seaborn: Полное руководство
      • Создание многосекционных сеток в Seaborn с помощью FacetGrid
      • Удаление рамки в Seaborn: Как работать с рамкой
      • Заголовки и метки осей в Seaborn: добавление и настройка
      • Как установить Seaborn в Python (Исправление: no module named seaborn)
      • Seaborn relplot – Создание точечных и линейных графиков
      • Полное руководство по созданию точечных диаграмм (scatter plots) в Python с использованием Seaborn
    • Matplotlib
      • Режим Retina в Matplotlib: Улучшение Качества Графиков
      • Как построить функцию в Python с использованием Matplotlib
      • Как создать 3D-диаграммы рассеяния в Matplotlib
      • Как изменить размер шрифта в графике Matplotlib
      • Установка размера маркера в точечных диаграммах Matplotlib
      • Как изменить размер графика и фигуры в Matplotlib
      • Как добавить названия в Matplotlib: Заголовок, Подзаголовок, Названия Осей
      • Pandas Scatter Plot: Как создать диаграмму рассеяния в Pandas
      • Построение графиков в Python с помощью Matplotlib
      • Диаграммы рассеяния Matplotlib – Все, что вам нужно знать
      • Диаграммы с столбцами в Matplotlib – Узнайте все, что вам нужно знать
      • Линейные диаграммы Matplotlib – Всё, что вам нужно знать
      • Построение гистограммы в Python с Matplotlib и Pandas
  • Алгоритмы
    • Алгоритм поиска в ширину (BFS) в Python
    • Алгоритм поиска в глубину (DFS) на Python
  • AI создает хедж-фонд для анализа акций на Python
Powered by GitBook
On this page
  • Загрузка образца DataFrame Pandas
  • Как использовать группу Pandas с несколькими столбцами
  • Использование Pandas GroupBy с несколькими столбцами и несколькими методами агрегации
  • Использование различных агрегатов при группировке по нескольким столбцам в Panda
  • Заключение
  • Дополнительные ресурсы
  1. Учебники по Pandas и Numpy
  2. Pandas

Объяснение группировки по нескольким столбцам в Pandas с примерами

PreviousИзучение API стиля PandasNextУдаление индексной колонки DataFrame в Pandas: Руководство с примерами

Last updated 1 year ago

Метод groupby в Pandas является мощным инструментом, который позволяет агрегировать данные с использованием простого синтаксиса, при этом абстрагируясь от сложных вычислений. Одним из главных преимуществ метода groupby является возможность группировки по нескольким столбцам и применения нескольких трансформаций.

К концу этого руководства вы научитесь следующему:

  • Как использовать метод Pandas groupby с несколькими столбцами, ознакомившись с синтаксисом и практическими примерами.

  • Как использовать несколько агрегатов для нескольких столбцов, что позволяет рассчитывать сводную статистику для нескольких столбцов.

  • Как указать, какие агрегаты использовать для разных столбцов с помощью группы Pandas.

  • Как настроить поведение группы Pandas путем переименования столбцов, обработки пропущенных значений и использования пользовательских функций.

Быстрый Ответ: Как Использовать Метод GroupBy в Pandas с Несколькими Колонками

Как вы можете использовать метод Pandas groupby с несколькими столбцами?

Чтобы использовать метод groupby в Pandas с несколькими столбцами, вы можете передать список заголовков столбцов непосредственно в метод. Порядок, в котором вы добавляете столбцы в список, определяет иерархию столбцов, которые вы используете.

Оглавление

Загрузка образца DataFrame Pandas

В этом руководстве мы будем использовать простой DataFrame от Pandas, который позволит нам легко разобраться, как работает группировка по нескольким столбцам, используя метод groupby от Pandas:

# Loading a Sample Pandas DataFrame
import pandas as pd
data = {
'Gender': ['Male', 'Female', 'Female', 'Female', 'Male', 'Male', 'Female', 'Male', 'Male'], 
'Role': ['Data Analyst', 'Data Analyst', 'Data Analyst', 'Data Scientist', 'Data Scientist', 'Data Scientist', 'Manager', 'Manager', 'Manager'],
'Years_Experience': [1, 2, 3, 4, 5, 6, 8, 10, 12],
'Salary': [48000, 52000, 54000, 68000, 75000, 76000, 82000, 85000, 90000]}
df = pd.DataFrame(data)
print(df)

Распечатав этот DataFrame, мы возвращаем следующую таблицу:

Gender
Role
Years_Experience
Salary

Male

Data Analyst

1

48000

Female

Data Analyst

2

52000

Female

Data Analyst

3

54000

Female

Data Scientist

4

68000

Male

Data Scientist

5

75000

Male

Data Scientist

6

76000

Female

Manager

8

82000

Male

Manager

10

85000

Male

Manager

12

90000

Мы видим, что в нашем DataFrame есть четыре столбца:

  1. Пол нашего сотрудника

  2. Роль нашего сотрудника

  3. Годы Опыта Работы, показывающие, как долго сотрудники работают

  4. Зарплата, показывающая сколько каждый сотрудник зарабатывает

Давайте теперь погрузимся в то, как мы можем использовать метод groupby в Pandas для агрегирования данных по нескольким столбцам.

Как использовать группу Pandas с несколькими столбцами

Чтобы использовать метод groupby в Pandas с несколькими столбцами, вы можете передать список столбцов в функцию. Это позволяет вам указать порядок, в котором хотите группировать данные.

Давайте посмотрим, как это работает в Pandas:

# Grouping a DataFrame by Multiple Columns
df.groupby(['Role', 'Gender'])

В указанном выше блоке кода мы указали, что хотим группировать наши данные сначала по 'Role', а затем по 'Gender'. Давайте посмотрим, что происходит за кулисами, визуализируя, как это трансформирует наши данные:

Каждый цвет представляет собой отдельную группу. В действительности, у нас есть группировка для каждой комбинации роли и пола. **Преимущество этого в том, что теперь мы можем агрегировать данные по этим группам.

Давайте теперь посмотрим, как мы можем агрегировать данные с этими группировками. Чтобы все было просто, давайте рассчитаем сумму для каждой группы по столбцу

# Calculate the Sum for Each Group
df.groupby(['Role', 'Gender'])['Salary'].sum()

Давайте посмотрим, что происходит под капотом при расчете данных:

Мы можем увидеть, как выглядит эти данные, распечатав их:

# Calculate the Sum for Each Group
print(df.groupby(['Role', 'Gender'])['Salary'].sum())

# Returns:
# Role            Gender
# Data Analyst    Female    106000
#                 Male       48000
# Data Scientist  Female     68000
#                 Male      151000
# Manager         Female     82000
#                 Male      175000
# Name: Salary, dtype: int64

Мы видим, что у нас получается объект Pandas Series с несколькими индексами – по одному для каждой группировки. Теперь мы можем лучше понять общую сумму заработных плат, разделенных по ролям и по полу.

Использование Pandas GroupBy с несколькими столбцами и несколькими методами агрегации

Основываясь на том, что вы узнали в предыдущем разделе, мы также можем применять несколько агрегаций к одному столбцу, используя метод groupby Pandas с несколькими столбцами. Это позволяет вам легко анализировать данные по различным статистикам.

Для этого мы используем метод агрегирования Pandas, который позволяет настраивать способы агрегирования данных. Метод aggregate Pandas позволяет применять одну или несколько функций агрегирования к конкретным столбцам DataFrame, предоставляя суммарные статистические данные или пользовательские вычисления для этих столбцов.

Давайте рассмотрим, как мы можем рассчитать три различные статистики для нашей группировки:

  1. Подсчет позволит нам понять, сколько сотрудников попадает в каждую группу

  2. Сумма даст нам представление о совокупной зарплате этой группы

  3. Среднее значение даст нам представление о средних зарплатах для каждой группы

Давайте посмотрим, как мы можем использовать метод .agg() библиотеки Pandas для вычисления нескольких агрегаций для объекта Pandas groupby:

# Aggregate Data in Multiple Ways Using Pandas GroupBy
multiple_aggregations = df.groupby(['Role', 'Gender'])['Salary'].agg(['count', 'sum', 'mean'])
print(multiple_aggregations)

# Returns:
#                        count     sum     mean
# Role           Gender                        
# Data Analyst   Female      2  106000  53000.0
#                Male        1   48000  48000.0
# Data Scientist Female      1   68000  68000.0
#                Male        2  151000  75500.0
# Manager        Female      1   82000  82000.0
#                Male        2  175000  87500.0

Как и в предыдущем примере, мы можем видеть, что группировки остаются прежними, но мы смогли использовать разные методы агрегирования. Давайте посмотрим, как это работает визуально:

Мы видим, что это работает аналогично нашему предыдущему примеру. Большая разница заключается в том, что вместо возвращения Pandas Series мы на самом деле возвращаем Pandas DataFrame. Это позволяет нам легко применять различные элементы нашего более широкого набора инструментов Pandas, например, фильтрацию нашего DataFrame.

В следующем разделе вы узнаете, как использовать разные агрегаты для разных столбцов в группировке Pandas.

Использование различных агрегатов при группировке по нескольким столбцам в Panda

Сила объединения метода .groupby() с методом .aggregate() в Pandas заключается в возможности использования различных агрегаций для разных столбцов. Для этого нам нужно изменить способ использования метода aggregate(). Давайте сначала посмотрим, как изменится наш код:

# How to Use Different Aggregations for Different Columns
df.groupby(['Grouping Column 1', 'Grouping Column 2']).agg({
    'Aggregation Column 1': ['Aggregation Method 1', 'Aggregation Method 2'],
    'Aggregation Column 2': 'Aggregation Method 3'})

В коде выше происходит довольно много всего. Но на самом деле это довольно просто:

  • Мы группируем наши данные таким же образом, как и раньше. Однако мы не индексируем столбец сразу. Вместо этого, мы применяем метод .agg() непосредственно к объекту группировки.

  • Мы передаем словарь в метод. Ключи этого словаря - это столбцы, которые мы хотим агрегировать, в то время как значения являются либо строками, либо списками строк агрегаций, которые мы хотим использовать.

Давайте рассмотрим, как мы можем использовать то, что вы только что узнали, и агрегировать несколько столбцов с помощью Pandas:

# Using Different Aggregations in GroupBy
different_aggregations = df.groupby(['Role', 'Gender']).agg({
    'Years_Experience': 'max',
    'Salary': ['mean', 'median']
})
print(different_aggregations)

# Returns:
#                       Years_Experience   Salary         
#                                    max     mean   median
# Role           Gender                                   
# Data Analyst   Female                3  53000.0  53000.0
#                Male                  1  48000.0  48000.0
# Data Scientist Female                4  68000.0  68000.0
#                Male                  6  75500.0  75500.0
# Manager        Female                8  82000.0  82000.0
#                Male                 12  87500.0  87500.0

В приведенном выше блоке кода мы применили несколько агрегаций к нашим данным:

  1. Мы рассчитали максимальное значение столбца

  2. Также были рассчитаны среднее значение и медиана для столбца

Давайте ещё раз взглянем, как это работает изнутри:

Мы видим, что это работает так же, как и в нашем предыдущем примере, возвращая DataFrame. Основное отличие заключается в том, что у нас есть не только DataFrame с мультииндексными столбцами, но и DataFrame с мультииндексными строками.

Заключение

В этом руководстве вы научились использовать метод groupby в Pandas с несколькими столбцами. Метод groupby является невероятно мощным и универсальным инструментом, который позволяет агрегировать значения аналогично операторам GROUP BY в SQL.

Вы впервые научились использовать метод .groupby() с несколькими столбцами. Затем вы научились агрегировать только один столбец при группировке по нескольким столбцам. После этого вы узнали, как указать несколько агрегаций для одного столбца. Наконец, вы узнали, как указать различные агрегации для каждого столбца при группировке по нескольким столбцам.

Дополнительные ресурсы

Чтобы узнать больше о смежных темах, ознакомьтесь с приведенными ниже учебными руководствами:

  • Подведение итогов и анализ кадра данных Pandas

  • Индексирование, выбор и присвоение данных в Pandas

Понимание группировки по нескольким столбцам в Pandas
Как агрегировать данные по нескольким столбцам в Pandas
Применение нескольких агрегатов к Pandas GroupBy с несколькими столбцами
Группировка по нескольким столбцам и объединение разных столбцов

Pandas groupby: Официальная документация
Загрузка образца DataFrame Pandas
Как использовать группу Pandas с несколькими столбцами
Использование Pandas GroupBy с несколькими столбцами и несколькими методами агрегации
Использование различных агрегатов при группировке по нескольким столбцам в Pandas
Заключение
Дополнительные ресурсы
Applying Multiple Aggregations to a Pandas GroupBy with Multiple Columns
Grouping by Multiple Columns and Aggregating Different Columns
How to Aggregate Data by Multiple Columns in Pandas
Understanding Grouping by Multiple Columns in Pandas