Pandas

Pandas — это популярная библиотека Python, используемая для манипуляции табличными данными. Она предоставляет универсальный объект dataframe, который может читать данные из многих популярных форматов, таких как Excel, SQL, CSV и др. Она предлагает невероятно полезные методы как для изменения формы ваших данных, так и для анализа ваших данных различными способами.

Python сводные таблицы – Полное руководство – Узнайте все, что вам нужно знать о сводных таблицах Pandas в этом подробном руководстве, охватывающем универсальную функцию. Вы научитесь работать с многоуровневыми сводными таблицами и создавать собственные пользовательские функции для анализа данных.

Исследуем API стилизации Pandas – Узнайте, как стилизовать ваш DataFrame в Pandas различными способами, используя цвет и форматирование значений, чтобы лучше иллюстрировать важность представляемых данных. API стилизации Pandas предоставляет вам множество различных инструментов, которые значительно упрощают работу со стилизацией табличных данных.

  • Объяснение группировки по нескольким столбцам в Pandas с примерами

    Метод groupby в Pandas - мощный инструмент, позволяющий агрегировать данные с использованием простого синтаксиса, при этом скрывая сложные вычисления. Одно из главных преимуществ метода groupby - возможность группировки по нескольким столбцам и даже применение нескольких преобразований. К концу этого учебника вы научитесь...

  • Удаление индексной колонки DataFrame в Pandas: Руководство с примерами

    Узнайте, как использовать Pandas для удаления индексной колонки DataFrame с помощью методов reset_index и set_index, а также как читать csv-файлы без индекса.

  • Pandas Quantile: Расчет процентилей в DataFrame

    Узнайте, как использовать метод quantile в Pandas для расчета процентилей, включая модификацию интерполяции значений.

  • Как рассчитать скользящее среднее (среднее арифметическое) в Pandas В этом посте вы узнаете, как рассчитать скользящее среднее в Pandas с использованием функции rolling(). Скользящие средние также известны как движущиеся средние. Создание скользящего среднего позволяет "сгладить" небольшие колебания в наборах данных, одновременно получая представление о тенденциях. Часто его используют в макроэкономике, например, в таких показателях, как уровень безработицы, валовой внутренний продукт и цены на акции.

  • Руководство по использованию метода fillna в Pandas для работы с отсутствующими данными в DataFrame . Добро пожаловать в наше подробное руководство по использованию метода fillna в Pandas! Обработка отсутствующих данных - это важный шаг в процессе очистки данных. Он обеспечивает достоверность, точность и консистентность результатов анализа. К счастью, использование метода .fillna() в Pandas может значительно упростить работу с такими неприятными значениями, как "NaN" или "null". В этом учебном пособии мы рассмотрим…

  • Pandas unique(): Получение уникальных значений в DataFrame

    Pandas предлагает множество различных способов работы с уникальными значениями. Узнайте, как получить уникальные значения в виде списка, получить уникальные значения по столбцам и многое другое!

  • Распакуйте Ваши Данные с Помощью Функции Melt в Pandas

    Вы можете легко распаковать и преобразовать данные с помощью Python, используя Pandas и функцию Melt! Узнайте, как это сделать, из этого подробного обзора!

  • Pandas date_range: Как Создать Диапазон Дат в Pandas

    В этом учебнике мы глубоко погрузимся в один из самых важных и универсальных инструментов библиотеки Pandas — функцию date_range. Независимо от того, только ли вы начинаете изучать возможности Pandas или уже являетесь опытным пользователем, эта функция обязательно должна быть в вашем инструментарии Python. Это откроет для вас…

  • Сброс индекса в Pandas: как сбросить индекс в Pandas

    Узнайте, как использовать метод сброса индекса в Pandas для сброса индекса, включая работу с мультииндексом и удаление оригинального индекса.

  • Pandas replace() – Замена значений в DataFrame Pandas

    Узнайте, как использовать метод replace в Pandas для замены значений по столбцам и во всем DataFrame, включая использование регулярных выражений.

  • Перемещение столбца DataFrame Pandas на позицию (В начало и в конец)

    Владение навыками работы с DataFrame в Pandas и их манипуляция является необходимым умением для каждого, кто работает в области анализа данных или науки о данных. Поскольку Pandas становится повсеместным инструментом для аналитиков данных, важно уметь подготавливать DataFrame к презентации. В этом руководстве вы узнаете, как использовать Pandas для перемещения столбца DataFrame…

  • Python Pandas Руководство: Полное Руководство В этом руководстве вы узнаете о библиотеке pandas в Python! Библиотека позволяет работать с табличными данными в привычном и доступном формате. pandas обеспечивает невероятную простоту, когда это необходимо, но также позволяет глубоко погружаться в поиск, манипулирование и агрегирование данных. pandas является одной из самых ценных библиотек для преобразования данных…

  • Pandas: Замена NaN на нули

    Работа с отсутствующими данными является важным навыком для любого аналитика данных или специалиста по данным! Во многих случаях вам захочется заменить ваши отсутствующие данные или значения NaN на нули. В этом уроке вы узнаете, как использовать Pandas для замены значений NaN на нули. Это обычный навык, который является частью лучше…

  • Преобразование DataFrame Pandas в файл Pickle

    Файлы Pickle - это сериализованные структуры данных, позволяющие сохранять состояние данных между сессиями. Файлы Pickle невероятно распространены в науке о данных. В этом учебнике вы узнаете, как сериализовать DataFrame Pandas в файл Pickle. Это важная функция, которую необходимо понимать, учитывая распространенность файлов Pickle в рабочих процессах науки о данных.…

  • Конвертация Pandas DataFrame в JSON

    В этом уроке вы узнаете, как преобразовать Pandas DataFrame в объект и файл JSON с использованием Python. Большинство языков программирования могут читать, анализировать и работать с JSON. Поэтому знание того, как преобразовать Pandas DataFrame в JSON, является важным навыком. Pandas предоставляет много гибкости при конвертации DataFrame…

  • Преобразование DataFrame Pandas в Словарь

    В этом посте вы узнаете, как использовать Python для преобразования DataFrame Pandas в словарь. Поскольку DataFrame в Pandas - это сложные структуры данных, существует множество различных способов, которыми это может быть сделано. В этом посте рассматриваются все различные опции, которые предоставляет Pandas! Например, Pandas позволяет конвертировать…

  • Преобразование Pandas DataFrame в Список

    В этом посте вы научитесь преобразовывать Pandas DataFrame в список, включая список списков, список кортежей и список словарей. Умение преобразовывать Pandas DataFrame в различные форматы позволяет работать с разными библиотеками, которые могут не принимать Pandas DataFrame. Pandas предоставляет вам...

  • Чтение файлов Parquet в Pandas с помощью pd.read_parquet

    В этом руководстве вы узнаете, как использовать функцию Pandas read_parquet для чтения файлов Parquet в Pandas. Хотя файлы CSV могут быть повсеместно используемым форматом файлов для аналитиков данных, они имеют ограничения по мере увеличения размера ваших данных. Здесь на помощь приходят файлы Apache Parquet! По завершении этого руководства вы научитесь:…

  • Pandas dropna(): Удаление отсутствующих записей и столбцов в DataFrame

    В этом уроке вы узнаете, как использовать метод dropna() в Pandas для удаления отсутствующих значений в DataFrame Pandas. Работа с отсутствующими данными является одним из ключевых навыков при очистке ваших данных перед их анализом. Поскольку очистка данных может занимать до 80% времени аналитика данных / ученого-данных, важно уметь…

  • Как Добавить Новый Столбец в DataFrame Pandas

    В этом руководстве вы узнаете, как добавить новый столбец в DataFrame Pandas. Библиотека Pandas предоставляет удобный способ работы с табличными данными. Одна из наиболее частых задач, с которыми вы столкнетесь, - это необходимость добавления дополнительных данных в DataFrame Pandas.

  • Подсчёт уникальных значений в Pandas

    В этом руководстве вы узнаете, как использовать Pandas для подсчёта уникальных значений. Вы научитесь подсчитывать уникальные значения в столбце, в нескольких столбцах и во всём DataFrame. Умение подсчитывать уникальные значения может быть полезным во многих случаях. Например, это может пригодиться при тестировании вашего кода.

  • Отображение всех столбцов и строк в DataFrame Pandas

    В этом уроке вы узнаете, как изменить настройки отображения в Pandas для отображения всех столбцов, а также всех строк в вашем DataFrame. По умолчанию Pandas ограничивает количество отображаемых столбцов и строк. Хотя это может быть полезным с точки зрения возможности чтения содержимого, это часто может привести…

  • Pandas to_excel: Запись DataFrames в файлы Excel

    В этом учебнике вы узнаете, как сохранить свой DataFrame или DataFrames Pandas в файлы Excel. Умение сохранять данные в этом повсеместно используемом формате данных является важным навыком во многих организациях. Вы узнаете, как сохранить простой DataFrame в Excel, а также как настроить свои параметры для создания…

  • Как использовать Pandas для чтения файлов Excel в Python

    В этом учебнике вы узнаете, как использовать Python и Pandas для чтения файлов Excel с помощью функции pandas read_excel. Файлы Excel повсюду — и хотя они могут не быть идеальным типом данных для многих специалистов по данным, знание того, как с ними работать, является важным навыком.

  • Преобразование списка словарей в Pandas DataFrame

    В этом уроке вы узнаете, как преобразовать список словарей Python в Pandas DataFrame. Pandas предоставляет несколько различных способов для преобразования словарей в DataFrame. Вы узнаете, как использовать метод from_dict, конструктор DataFrame и функцию json_normalize. К концу этого урока вы…

  • Как добавить/вставить строку в DataFrame Pandas

    В этом уроке вы узнаете, как добавить (или вставить) строку в DataFrame Pandas. Вы узнаете, как добавить одну строку, несколько строк и на конкретные позиции. Вы также узнаете, как добавить строку, используя список, серию и словарь.

  • Диаграмма рассеяния в Pandas: Как создать диаграмму рассеяния в Pandas

    В этом учебнике вы узнаете, как использовать Pandas для создания диаграммы рассеяния. Pandas использует Matplotlib, что делает настройку вашего графика знакомым процессом. С помощью Pandas вы можете настроить диаграмму рассеяния, изменяя цвета, добавляя заголовки и многое другое. В более поздних версиях Pandas включил возможность использовать различные…

  • Pandas to_datetime: Преобразование строки Pandas в дату и время

    В этом руководстве вы узнаете, как использовать функцию Pandas to_datetime для преобразования столбца Pandas в дату и время. Pandas предоставляет огромное количество методов и функций, которые делают работу с датами невероятно гибкой. Однако данные не всегда правильно считываются.

  • Введение в Pandas для Data Science

    В этом уроке вы узнаете, как погрузиться в удивительный мир Pandas. Pandas - это пакет Python, который предоставляет быстрые и гибкие структуры данных, используемые для манипуляции и анализа данных. К концу этого урока вы узнаете, как: Установить pandas для Python с помощью pip или conda Понять серию pandas…

  • Индексация, Выборка и Присваивание Данных в Pandas

    В этом уроке вы узнаете, как индексировать, выбирать и присваивать данные в DataFrame Pandas. Понимание того, как индексировать и выбирать данные, является важным первым шагом в любой исследовательской работе, которую вы возьмете на себя в области данных. Аналогичным образом, знание того, как присваивать значения в Pandas, может открыть для вас целый новый мир возможностей…

  • Суммирование и анализ Pandas DataFrame

    В этом уроке вы узнаете, как быстро суммировать и анализировать Pandas DataFrame. К концу этого урока вы сможете проводить некоторый исследовательский анализ вашего набора данных с помощью pandas. Вы узнаете, как рассчитывать общие характеристики вашего набора данных, такие как меры центральной тенденции или меры разброса. Вы…

  • Преобразование столбцов Pandas с помощью map и apply

    В этом уроке вы узнаете, как преобразовывать столбцы DataFrame в Pandas с использованием векторизованных функций и пользовательских функций с использованием методов map и apply. К концу этого урока вы будете хорошо понимать, как Pandas применяет векторизованные функции и как они оптимизированы для производительности. Вы также научитесь использовать пользовательские…

  • Группировка данных в Pandas с использованием cut и qcut

    В этом руководстве вы узнаете, как группировать данные в Python с помощью функций Pandas cut и qcut. Вы узнаете, почему группировка данных полезна в Pandas и как её можно использовать для лучшей организации и анализа информации. К концу этого руководства вы научитесь: использовать функции cut и...

  • Дата и время в Pandas и Python

    В этом руководстве вы узнаете, как работать с датами, временем и DateTime в Pandas и Python. Работа с DateTime в Python и Pandas может быть сложной. Это руководство направлено на то, чтобы сделать сложное простым, сосредоточившись на том, что вам нужно знать для начала и чтобы уметь находить дополнительную информацию…

  • Очистка и подготовка данных в Pandas и Python

    В этом руководстве вы научитесь очищать и готовить данные в DataFrame Pandas. Вы узнаете, как работать с отсутствующими данными, как работать с дублирующимися данными и как справляться с неструктурированными строковыми данными. Умение эффективно очищать и подготавливать набор данных — важный навык. Многие специалисты по данным оценивают, что они тратят...

  • Pandas GroupBy: группировка, суммирование и агрегация данных в Python

    Метод pandas groupby - это невероятно мощный инструмент, помогающий приобрести эффективное и значимое понимание вашего набора данных. Всего за несколько простых для понимания строк кода вы можете агрегировать свои данные невероятно прямолинейными и мощными способами. К концу этого урока вы узнаете, как метод Pandas .groupby()…

  • Pandas Дата и Время в Части Даты (месяц, год и т.д.)

    В этом уроке вы узнаете, как использовать Pandas для извлечения частей даты из столбца datetime, таких как дата, год и месяц. Pandas предоставляет множество простых способов извлечения частей из объекта datetime, включая использование доступа .dt. В конце этого урока вы узнаете, как…

  • Pandas: Получение номера строки из DataFrame

    Узнайте, как использовать Pandas для получения номера строки, соответствующей условию или нескольким условиям, а также как подсчитывать строки, соответствующие условиям.

  • Вычисление Взвешенного Среднего в Pandas и Python

    Узнайте, как использовать Pandas для вычисления взвешенного среднего в Python, применяя groupby, numpy и функцию zip между двумя списками.

  • Как перемешать строки Pandas Dataframe в Python

    Узнайте, как перемешать Pandas Dataframe с помощью трех различных методов, включая возможность воспроизведения результатов перемешивания.

  • Pandas: количество столбцов (подсчет столбцов в DataFrame)

    Узнайте, как с помощью Python и Pandas подсчитать количество столбцов в DataFrame, включая подсчет столбцов, соответствующих определенному условию.

  • Pandas Sum: сложение столбцов и строк DataFrame

    Узнайте, как использовать Pandas для подсчета суммы: сложение столбцов и строк DataFrame, а также условное сложение столбцов.

  • Pandas Diff: Вычисление Разницы Между Строками Pandas

    Узнайте, как использовать метод diff в Pandas для вычисления разницы между строками и столбцами DataFrame, включая определенные интервалы

  • Нормализация столбца или датафрейма Pandas (с использованием Pandas или sklearn)

    Узнайте, как нормализовать и стандартизовать Pandas Dataframe с помощью sklearn, включая масштабирование по максимальному абсолютному значению, min-max масштабирование и z-оценочное масштабирование.

  • Функция Rank в Pandas: Ранжирование данных в Dataframe (Эквивалент SQL row_number)

    Узнайте, как использовать метод rank в Pandas для ранжирования данных, включая ранжирование сгруппированного DataFrame

  • Pandas Describe: Описательная статистика вашего Dataframe

    Узнайте, как использовать метод describe в Pandas для генерации сводной статистики вашего Dataframe, включая изменение процентилей.

  • Pandas Shift: Перемещение столбца DataFrame вверх или вниз

    Узнайте, как использовать функцию shift в Python Pandas для перемещения строк в DataFrame вверх или вниз, включая работу с временными рядами и отсутствующими данными.

  • 7 Способов Выполнения Выборки Данных в Pandas

    Узнайте, как выполнять выборку данных в Pandas с использованием Python, включая применение функции sample, воспроизведение результатов и выборку данных с заданным весом.

  • Экспорт DataFrame Pandas в CSV файл – Использование .to_csv()

    Используйте Python и Pandas для экспорта DataFrame в CSV файл с помощью .to_csv, включая изменение разделителей, кодировки и значений для отсутствующих данных.

  • Pandas: Итерация по строкам DataFrame в Pandas

    Узнайте, как использовать Python и Pandas для итерации по строкам DataFrame, почему векторизация лучше, и как использовать iterrows и itertuples.

  • Pandas: Преобразование значений столбца в строки

    Узнайте, как использовать Python и Pandas для преобразования значений столбца датафрейма в строки, включая оптимизацию памяти и эффективности.

  • Дисперсия в Pandas: Вычисление дисперсии столбца в Pandas Dataframe

    Узнайте, как вычислить дисперсию переменной в Pandas, включая вычисление для одного столбца, нескольких столбцов или всего датафрейма.

  • Pandas: Создание DataFrame из списков (5 способов!)

    Узнайте, как создать DataFrame Pandas из списков, включая использование списков списков, функции zip() и способы добавления столбцов и индекса.

  • Pandas Rename Index: Как переименовать индекс DataFrame в Pandas

    Узнайте, как переименовать индекс в Pandas, включая одиночный или мультииндекс, а также как полностью удалить имя индекса

  • Pandas: Подсчёт уникальных значений в объекте GroupBy

    Узнайте, как использовать Pandas для подсчёта уникальных значений в объекте GroupBy, что позволяет считать различные значения с помощью популярного метода.

  • Pandas: Добавить дни к колонке с датами

    Узнайте, как использовать Pandas для добавления дней к колонке с датами, как постоянные значения, так и на основе другой колонки, с помощью функции.

  • Среднее в Pandas: Как рассчитать среднее для одной или нескольких колонок

    Узнайте, как рассчитать среднее в Pandas, включая вычисление по колонке, датафрейму, строке, и с учетом пустых значений.

  • Pandas Column to List – Конвертируйте колонку Pandas в список

    Узнайте, как конвертировать колонку Pandas в список с помощью этого руководства. Изучите три разных способа достижения этого, все очень простые для понимания!

  • Транспонирование Dataframe в Pandas

    Узнайте, как транспонировать dataframe в pandas, включая работу с разными типами данных и возможные результаты.

  • Python: Разделение DataFrame Pandas

    Узнайте, как разделить DataFrame Pandas в Python. Научитесь разделять dataframe по значению столбца, по позиции и по случайным значениям..

  • Как получить имена столбцов в DataFrame Pandas

    Узнайте, как получить столбцы Pandas в виде списка, отсортированного списка, и как проверить, существует ли столбец в конкретном DataFrame

  • Pandas: Количество строк в DataFrame (6 способов)

    Узнайте, как подсчитать количество строк в Pandas DataFrame, включая способы определения количества строк, содержащих значение или соответствующих условию.

  • Создание пустого DataFrame Pandas и добавление данных

    В этой статье вы узнаете, как создать пустой DataFrame в Pandas и как добавлять в него данные построчно, а также как добавлять строки с помощью цикла.

  • Как переименовать столбцы в Pandas DataFrame (с примерами)

    Изучите способы переименования столбцов в Pandas с помощью метода .rename(). Узнайте, как переименовать один столбец, все столбцы, включая автоматическое переименование.

  • Узнайте различные способы изменения порядка столбцов в DataFrame Pandas, включая использование функции reindex из Pandas и кастомных функций.

  • Функция get_dummies из библиотеки Pandas позволяет легко выполнять one-hot кодирование ваших наборов данных для последующего использования в алгоритмах машинного обучения.

  • Относительные и Абсолютные Частоты в Python и Pandas

    В этом посте вы узнаете, как вычислять относительные и абсолютные частоты, используя чистый Python, а также популярную библиотеку для анализа данных, Pandas. Относительная частота показывает, как часто определенное значение встречается в наборе данных по отношению к общему количеству значений в этом наборе. Абсолютная частота, в свою очередь, просто измеряет, как часто...

  • Финансовый год – Определение финансового года в Pandas

    Узнайте, как вычислять финансовый год в Pandas и как форматировать эти финансовые годы нестандартными способами.

  • Как сортировать данные в DataFrame Pandas

    Узнайте, как сортировать данные в DataFrame Pandas, включая сортировку в порядке возрастания или убывания, а также сортировку по нескольким столбцам.

  • Pandas Value_counts для подсчета уникальных значений

    Функция Pandas value_counts подсчитывает значения в датафрейме Pandas. Узнайте, как нормализовать данные, включать отсутствующие значения и комбинировать с groupby

  • Create New Columns in Pandas

    Pandas is one of the quintessential libraries for data science in Python. A useful skill is the ability to create new columns, either by adding your own data or calculating data based on existing data. Video Tutorial Loading Dataset Let’s start off the tutorial by loading the dataset we’ll use throughout the tutorial. We can… Read More »Create New Columns in Pandas

  • Pandas Crosstab – Everything You Need to Know

    The Pandas crosstab function is one of the many ways in which Pandas allows you to customize data. On the surface, it appears to be quite similar to the Pandas pivot table function, which I’ve covered extensively here. This post will give you a complete overview of how to best leverage the function. The crosstab… Read More »Pandas Crosstab – Everything You Need to Know

  • Pandas drop_duplicates: Drop Duplicate Rows in Pandas

    Learn how to drop duplicates in Pandas, including keeping the first or last instance, and dropping duplicates based only on a subset of columns.

  • Use Pandas & Python to Extract Tables from Webpages (read_html)

    Learn how to easily scrape data from the web without having to build a complex web scraping script!

  • Plotting a Histogram in Python with Matplotlib and Pandas

    Learn what histograms are and how to create them in Python with Matplotlib and Pandas.

  • All the Ways to Filter Pandas Dataframes

    Learn all the ways in which to filter pandas dataframes in this tutorial, including filtering dates, multiple columns, using the iloc, loc and query functions!

  • Selecting Columns in Pandas: Complete Guide

    In this tutorial, you’ll learn how to select all the different ways you can select columns in Pandas, either by name or index. You’ll learn how to use the loc, iloc accessors and how to select columns directly. You’ll also learn how to select columns conditionally, such as those containing a specific substring. By the end of this tutorial,… Read More »Selecting Columns in Pandas: Complete Guide

  • Exploring the Pandas Style API

    Explore the how to style Pandas dataframes and make them presentation ready, including how to add conditional formatting and data type labels!

  • Pivot Tables in Pandas with Python

    You may be familiar with pivot tables in Excel to generate easy insights into your data. In this post, you’ll learn how to create pivot tables in Python and Pandas using the .pivot_table() method. This post will give you a complete overview of how to use the .pivot_table() function! Being able to quickly summarize data… Read More »Pivot Tables in Pandas with Python

  • Binning Data in Python with Pandas’ cut()

    In this post, we’ll explore how binning data in Python works with the cut() method in Pandas. In the past, we’ve explored how to use the describe() method to generate some descriptive statistics. In particular, the describe method allows us to see the quarter percentiles of a numerical column. However, as we’re generating insight into… Read More »Binning Data in Python with Pandas’ cut()

  • VLOOKUP in Python and Pandas using .map() or .merge()

    In this tutorial, you’ll learn how to use Python and Pandas to VLOOKUP data in a Pandas DataFrame. VLOOKUPs are common functions in Excel that allow you to map data from one table to another. In many cases, this can be used to lookup data from a reference table, such as mapping in, say, a… Read More »VLOOKUP in Python and Pandas using .map() or .merge()

Библиотека

Last updated