Pandas

Pandas — это популярная библиотека Python, используемая для манипуляции табличными данными. Она предоставляет универсальный объект dataframe, который может читать данные из многих популярных форматов, таких как Excel, SQL, CSV и др. Она предлагает невероятно полезные методы как для изменения формы ваших данных, так и для анализа ваших данных различными способами.

Python сводные таблицы – Полное руководство – Узнайте все, что вам нужно знать о сводных таблицах Pandas в этом подробном руководстве, охватывающем универсальную функцию. Вы научитесь работать с многоуровневыми сводными таблицами и создавать собственные пользовательские функции для анализа данных.

Исследуем API стилизации Pandas – Узнайте, как стилизовать ваш DataFrame в Pandas различными способами, используя цвет и форматирование значений, чтобы лучше иллюстрировать важность представляемых данных. API стилизации Pandas предоставляет вам множество различных инструментов, которые значительно упрощают работу со стилизацией табличных данных.

  • Объяснение группировки по нескольким столбцам в Pandas с примерами

    Метод groupby в Pandas - мощный инструмент, позволяющий агрегировать данные с использованием простого синтаксиса, при этом скрывая сложные вычисления. Одно из главных преимуществ метода groupby - возможность группировки по нескольким столбцам и даже применение нескольких преобразований. К концу этого учебника вы научитесь...

  • Удаление индексной колонки DataFrame в Pandas: Руководство с примерами

    Узнайте, как использовать Pandas для удаления индексной колонки DataFrame с помощью методов reset_index и set_index, а также как читать csv-файлы без индекса.

  • Pandas Quantile: Расчет процентилей в DataFrame

    Узнайте, как использовать метод quantile в Pandas для расчета процентилей, включая модификацию интерполяции значений.

  • Как рассчитать скользящее среднее (среднее арифметическое) в Pandas В этом посте вы узнаете, как рассчитать скользящее среднее в Pandas с использованием функции rolling(). Скользящие средние также известны как движущиеся средние. Создание скользящего среднего позволяет "сгладить" небольшие колебания в наборах данных, одновременно получая представление о тенденциях. Часто его используют в макроэкономике, например, в таких показателях, как уровень безработицы, валовой внутренний продукт и цены на акции.

  • Руководство по использованию метода fillna в Pandas для работы с отсутствующими данными в DataFrame Добро пожаловать в наше подробное руководство по использованию метода fillna в Pandas! Обработка отсутствующих данных - это важный шаг в процессе очистки данных. Он обеспечивает достоверность, точность и консистентность результатов анализа. К счастью, использование метода .fillna() в Pandas может значительно упростить работу с такими неприятными значениями, как "NaN" или "null". В этом учебном пособии мы рассмотрим…

  • Pandas unique(): Получение уникальных значений в DataFrame

    Pandas предлагает множество различных способов работы с уникальными значениями. Узнайте, как получить уникальные значения в виде списка, получить уникальные значения по столбцам и многое другое!

  • Распакуйте Ваши Данные с Помощью Функции Melt в Pandas

    Вы можете легко распаковать и преобразовать данные с помощью Python, используя Pandas и функцию Melt! Узнайте, как это сделать, из этого подробного обзора!

  • Pandas date_range: Как Создать Диапазон Дат в Pandas

    В этом учебнике мы глубоко погрузимся в один из самых важных и универсальных инструментов библиотеки Pandas — функцию date_range. Независимо от того, только ли вы начинаете изучать возможности Pandas или уже являетесь опытным пользователем, эта функция обязательно должна быть в вашем инструментарии Python. Это откроет для вас…

  • Сброс индекса в Pandas: как сбросить индекс в Pandas

    Узнайте, как использовать метод сброса индекса в Pandas для сброса индекса, включая работу с мультииндексом и удаление оригинального индекса.

  • Pandas replace() – Замена значений в DataFrame Pandas

    Узнайте, как использовать метод replace в Pandas для замены значений по столбцам и во всем DataFrame, включая использование регулярных выражений.

  • Перемещение столбца DataFrame Pandas на позицию (В начало и в конец)

    Владение навыками работы с DataFrame в Pandas и их манипуляция является необходимым умением для каждого, кто работает в области анализа данных или науки о данных. Поскольку Pandas становится повсеместным инструментом для аналитиков данных, важно уметь подготавливать DataFrame к презентации. В этом руководстве вы узнаете, как использовать Pandas для перемещения столбца DataFrame…

  • Python Pandas Руководство: Полное Руководство В этом руководстве вы узнаете о библиотеке pandas в Python! Библиотека позволяет работать с табличными данными в привычном и доступном формате. pandas обеспечивает невероятную простоту, когда это необходимо, но также позволяет глубоко погружаться в поиск, манипулирование и агрегирование данных. pandas является одной из самых ценных библиотек для преобразования данных…

  • Pandas: Замена NaN на нули

    Работа с отсутствующими данными является важным навыком для любого аналитика данных или специалиста по данным! Во многих случаях вам захочется заменить ваши отсутствующие данные или значения NaN на нули. В этом уроке вы узнаете, как использовать Pandas для замены значений NaN на нули. Это обычный навык, который является частью лучше…

  • Преобразование DataFrame Pandas в файл Pickle

    Файлы Pickle - это сериализованные структуры данных, позволяющие сохранять состояние данных между сессиями. Файлы Pickle невероятно распространены в науке о данных. В этом учебнике вы узнаете, как сериализовать DataFrame Pandas в файл Pickle. Это важная функция, которую необходимо понимать, учитывая распространенность файлов Pickle в рабочих процессах науки о данных.…

  • Конвертация Pandas DataFrame в JSON

    В этом уроке вы узнаете, как преобразовать Pandas DataFrame в объект и файл JSON с использованием Python. Большинство языков программирования могут читать, анализировать и работать с JSON. Поэтому знание того, как преобразовать Pandas DataFrame в JSON, является важным навыком. Pandas предоставляет много гибкости при конвертации DataFrame…

  • Преобразование DataFrame Pandas в Словарь

    В этом посте вы узнаете, как использовать Python для преобразования DataFrame Pandas в словарь. Поскольку DataFrame в Pandas - это сложные структуры данных, существует множество различных способов, которыми это может быть сделано. В этом посте рассматриваются все различные опции, которые предоставляет Pandas! Например, Pandas позволяет конвертировать…

  • Преобразование Pandas DataFrame в Список

    В этом посте вы научитесь преобразовывать Pandas DataFrame в список, включая список списков, список кортежей и список словарей. Умение преобразовывать Pandas DataFrame в различные форматы позволяет работать с разными библиотеками, которые могут не принимать Pandas DataFrame. Pandas предоставляет вам...

  • Чтение файлов Parquet в Pandas с помощью pd.read_parquet

    В этом руководстве вы узнаете, как использовать функцию Pandas read_parquet для чтения файлов Parquet в Pandas. Хотя файлы CSV могут быть повсеместно используемым форматом файлов для аналитиков данных, они имеют ограничения по мере увеличения размера ваших данных. Здесь на помощь приходят файлы Apache Parquet! По завершении этого руководства вы научитесь:…

  • Pandas dropna(): Удаление отсутствующих записей и столбцов в DataFrame

    В этом уроке вы узнаете, как использовать метод dropna() в Pandas для удаления отсутствующих значений в DataFrame Pandas. Работа с отсутствующими данными является одним из ключевых навыков при очистке ваших данных перед их анализом. Поскольку очистка данных может занимать до 80% времени аналитика данных / ученого-данных, важно уметь…

  • Как Добавить Новый Столбец в DataFrame Pandas

    В этом руководстве вы узнаете, как добавить новый столбец в DataFrame Pandas. Библиотека Pandas предоставляет удобный способ работы с табличными данными. Одна из наиболее частых задач, с которыми вы столкнетесь, - это необходимость добавления дополнительных данных в DataFrame Pandas.

  • Подсчёт уникальных значений в Pandas

    В этом руководстве вы узнаете, как использовать Pandas для подсчёта уникальных значений. Вы научитесь подсчитывать уникальные значения в столбце, в нескольких столбцах и во всём DataFrame. Умение подсчитывать уникальные значения может быть полезным во многих случаях. Например, это может пригодиться при тестировании вашего кода.

  • Отображение всех столбцов и строк в DataFrame Pandas

    В этом уроке вы узнаете, как изменить настройки отображения в Pandas для отображения всех столбцов, а также всех строк в вашем DataFrame. По умолчанию Pandas ограничивает количество отображаемых столбцов и строк. Хотя это может быть полезным с точки зрения возможности чтения содержимого, это часто может привести…

  • Pandas to_excel: Запись DataFrames в файлы Excel

    В этом учебнике вы узнаете, как сохранить свой DataFrame или DataFrames Pandas в файлы Excel. Умение сохранять данные в этом повсеместно используемом формате данных является важным навыком во многих организациях. Вы узнаете, как сохранить простой DataFrame в Excel, а также как настроить свои параметры для создания…

  • Как использовать Pandas для чтения файлов Excel в Python

    В этом учебнике вы узнаете, как использовать Python и Pandas для чтения файлов Excel с помощью функции pandas read_excel. Файлы Excel повсюду — и хотя они могут не быть идеальным типом данных для многих специалистов по данным, знание того, как с ними работать, является важным навыком.

  • Преобразование списка словарей в Pandas DataFrame

    В этом уроке вы узнаете, как преобразовать список словарей Python в Pandas DataFrame. Pandas предоставляет несколько различных способов для преобразования словарей в DataFrame. Вы узнаете, как использовать метод from_dict, конструктор DataFrame и функцию json_normalize. К концу этого урока вы…

  • Как добавить/вставить строку в DataFrame Pandas

    В этом уроке вы узнаете, как добавить (или вставить) строку в DataFrame Pandas. Вы узнаете, как добавить одну строку, несколько строк и на конкретные позиции. Вы также узнаете, как добавить строку, используя список, серию и словарь.

  • Диаграмма рассеяния в Pandas: Как создать диаграмму рассеяния в Pandas

    В этом учебнике вы узнаете, как использовать Pandas для создания диаграммы рассеяния. Pandas использует Matplotlib, что делает настройку вашего графика знакомым процессом. С помощью Pandas вы можете настроить диаграмму рассеяния, изменяя цвета, добавляя заголовки и многое другое. В более поздних версиях Pandas включил возможность использовать различные…

  • Pandas to_datetime: Преобразование строки Pandas в дату и время

    В этом руководстве вы узнаете, как использовать функцию Pandas to_datetime для преобразования столбца Pandas в дату и время. Pandas предоставляет огромное количество методов и функций, которые делают работу с датами невероятно гибкой. Однако данные не всегда правильно считываются.

  • Введение в Pandas для Data Science

    В этом уроке вы узнаете, как погрузиться в удивительный мир Pandas. Pandas - это пакет Python, который предоставляет быстрые и гибкие структуры данных, используемые для манипуляции и анализа данных. К концу этого урока вы узнаете, как: Установить pandas для Python с помощью pip или conda Понять серию pandas…

  • Индексация, Выборка и Присваивание Данных в Pandas

    В этом уроке вы узнаете, как индексировать, выбирать и присваивать данные в DataFrame Pandas. Понимание того, как индексировать и выбирать данные, является важным первым шагом в любой исследовательской работе, которую вы возьмете на себя в области данных. Аналогичным образом, знание того, как присваивать значения в Pandas, может открыть для вас целый новый мир возможностей…

  • Summarizing and Analyzing a Pandas DataFrame

    In this tutorial, you’ll learn how to quickly summarize and analyze a Pandas DataFrame. By the end of this tutorial, you’ll have learned to take on some exploratory analysis of your dataset using pandas. You’ll learn how to calculate general attributes of your dataset, such as measures of central tendency or measures of dispersion. You’ll… Read More »Summarizing and Analyzing a Pandas DataFrame

  • Transforming Pandas Columns with map and apply

    In this tutorial, you’ll learn how to transform your Pandas DataFrame columns using vectorized functions and custom functions using the map and apply methods. By the end of this tutorial, you’ll have a strong understanding of how Pandas applies vectorized functions and how these are optimized for performance. You’ll also learn how to use custom… Read More »Transforming Pandas Columns with map and apply

  • Binning Data in Pandas with cut and qcut

    In this tutorial, you’ll learn how to bin data in Python with the Pandas cut and qcut functions. You’ll learn why binning is a useful skill in Pandas and how you can use it to better group and distill information. By the end of this tutorial, you’ll have learned: How to use the cut and… Read More »Binning Data in Pandas with cut and qcut

  • DateTime in Pandas and Python

    In this tutorial, you’ll learn how to work with dates, times, and DateTime in Pandas and Python. Working with DateTime in Python and Pandas can be a complicated thing. This guide aims to make the complicated, simple, by focusing on what you need to know to get started and to know enough to discover more… Read More »DateTime in Pandas and Python

  • Data Cleaning and Preparation in Pandas and Python

    In this tutorial, you’ll learn how to clean and prepare data in a Pandas DataFrame. You’ll learn how to work with missing data, how to work with duplicate data, and dealing with messy string data. Being able to effectively clean and prepare a dataset is an important skill. Many data scientists estimate that they spend… Read More »Data Cleaning and Preparation in Pandas and Python

  • Pandas GroupBy: Group, Summarize, and Aggregate Data in Python

    The Pandas groupby method is an incredibly powerful tool to help you gain effective and impactful insight into your dataset. In just a few, easy to understand lines of code, you can aggregate your data in incredibly straightforward and powerful ways. By the end of this tutorial, you’ll have learned how the Pandas .groupby() method… Read More »Pandas GroupBy: Group, Summarize, and Aggregate Data in Python

  • Pandas Datetime to Date Parts (Month, Year, etc.)

    In this tutorial, you’ll learn how to use Pandas to extract date parts from a datetime column, such as to date, year, and month. Pandas provides a number of easy ways to extract parts from a datetime object, including using the .dt accessor. By the end of this tutorial, you’ll have learned how the dt… Read More »Pandas Datetime to Date Parts (Month, Year, etc.)

  • Pandas: Get the Row Number from a Dataframe

    Learn how to use Pandas to get the row number of rows matching a condition or multiple conditions, and how to count rows matching conditions.

  • Calculate a Weighted Average in Pandas and Python

    Learn how to use Pandas to calculate the weighted average in Python, using groupby, numpy, and the zip function between two lists.

  • How to Shuffle Pandas Dataframe Rows in Python

    Learn how to shuffle a Pandas Dataframe using three different methods, including how to be able to reproduce your shuffle results.

  • Pandas: Number of Columns (Count Dataframe Columns)

    Learn how to use Python and Pandas to count the number of columns in a dataframe, using counting the number of columns meeting a condition.

  • Pandas Sum: Add Dataframe Columns and Rows

    Learn how to use Pandas to calculate a sum, including adding Pandas Dataframe columns and rows, and how to add columns conditionally.

  • Pandas Diff: Calculate the Difference Between Pandas Rows

    Learn how to use the Pandas diff method to calculate the difference between dataframe rows and columns, including at defined intervals.

  • Normalize a Pandas Column or Dataframe (w/ Pandas or sklearn)

    Learn how to normalize and standardize a Pandas Dataframe with sklearn, including max absolute scaling, min-max scaling and z-scoare scaling.

  • Pandas Rank Function: Rank Dataframe Data (SQL row_number Equivalent)

    Learn how to use the Pandas rank method to rank you data, including how to rank a grouped dataframe using the groupby method.

  • Pandas Describe: Descriptive Statistics on Your Dataframe

    Learn how to use the Pandas describe method to generate summary statistics on your Pandas Dataframe, including changing percentiles.

  • Pandas Shift: Shift a Dataframe Column Up or Down

    Learn how to use the Python Pandas shift function to move a dataframe’s rows up or down, including working with time series and missing data.

  • 7 Ways to Sample Data in Pandas

    Learn how to sample data in Pandas using Python, including how to use the sample function, reproduce results, and weighted samples of data.

  • Pandas Dataframe to CSV File – Export Using .to_csv()

    Use Python and Pandas to export a dataframe to a CSV file, using .to_csv, including changing separators, encoding, and missing values.

  • Pandas: Iterate over a Pandas Dataframe Rows

    Learn how to use Python and Pandas to iterate over rows of a dataframe, why vectorization is better, and how to use iterrows and itertuples.

  • Pandas: Convert Column Values to Strings

    Learn how to use Python and Pandas to convert a dataframe column values to strings, including how to optimize for memory and efficiency.

  • Pandas Variance: Calculating Variance of a Pandas Dataframe Column

    Learn how to calculate the variance of a variable in Pandas, including how to calculate for a single column, multiple or a whole dataframe.

  • Pandas: Create a Dataframe from Lists (5 Ways!)

    Learn how to create a Pandas dataframe from lists, including using lists of lists, the zip() function, and ways to add columns and an index.

  • Pandas Rename Index: How to Rename a Pandas Dataframe Index

    Learn how to rename a Pandas index, including a single index or multi-index, as well as how to drop an index name altogether.

  • Pandas: Count Unique Values in a GroupBy Object

    Learn how to use Pandas to count unique values in a GroupBy object, allowing you to count distinct values using the popular groupby method.

  • Pandas: Add Days to a Date Column

    Learn how to use Pandas to add days to a date column, both constant values and based off another column, using the Pandas timedelta function.

  • Pandas Mean: Calculate Pandas Average for One or Multiple Columns

    Learn how to calculate the Pandas mean (or Pandas Average), including how to calculate it on a column, dataframe, and row, and with nulls.

  • Pandas Column to List – Convert a Pandas Series to a List

    Learn how to convert a Pandas column to list with this tutorial. Learn three different ways to accomplish this, all very easy to follow!

  • Transpose a Pandas Dataframe

    Learn how to transpose a pandas dataframe, including how to work with mixed datatypes and what their outputs may be.

  • Python: Split a Pandas Dataframe

    Learn how to split a Pandas dataframe in Python. Split a dataframe by column value, by position, and by random values.

  • How to Get Column Names in a Pandas DataFrame

    Learn how to get Pandas columns as a list, a sorted list and how to check if a column exists in a particular dataframe.

  • Pandas: Number of Rows in a Dataframe (6 Ways)

    Learn how to count the number of rows in a Pandas Dataframe, including identifying how many rows contain a value or meet a condition.

  • Create an Empty Pandas Dataframe and Append Data

    In this post, you’ll learn how to create empty pandas dataframes and how to add data to them row-by-row and add rows via a loop.

  • How to Rename Pandas DataFrame Columns (with Examples)

    Learn the ways in which you can rename Pandas columns, using Pandas .rename() method. Learn how to rename one, all, including automatically.

  • Reorder Pandas Columns: Pandas Reindex and Pandas insert

    Learn different ways to reorder Pandas columns, including the Pandas reindex function as well as a custom function.

  • Pandas get_dummies (One-Hot Encoding) Explained

    The pandas get dummies function allows you to easily one-hot encode your data sets for use in machine learning algorithms.

  • Relative Frequencies and Absolute Frequencies in Python and Pandas

    In this post, you’ll learn how to calculate relative frequencies and absolute frequencies using pure Python, as well as the popular data science library, Pandas. A relative frequency, measures how often a certain value occurs in a dataset, relative to the total number of values in that dataset. An absolute frequency, meanwhile, simply measures how… Read More »Relative Frequencies and Absolute Frequencies in Python and Pandas

  • Pandas Fiscal Year – Get Financial Year with Pandas

    Learn how to calculate custom a Pandas fiscal year and how to format these fiscal years in custom ways.

  • How to Sort Data in a Pandas DataFrame

    Lean how to sort data in a Pandas dataframe, including how to sort in ascending or descending order, as well as sorting by multiple columns.

  • Pandas Value_counts to Count Unique Values

    The Pandas value_counts functioncounts values in a Pandas dataframe. Learn to normalize, include missing values, and combine with groupby.

  • How to Drop One or More Columns in Pandas

    Learn how to use Pandas to drop columns and rows in a dataframe, including how to drop columns or rows based on conditions.

  • Create New Columns in Pandas

    Pandas is one of the quintessential libraries for data science in Python. A useful skill is the ability to create new columns, either by adding your own data or calculating data based on existing data. Video Tutorial Loading Dataset Let’s start off the tutorial by loading the dataset we’ll use throughout the tutorial. We can… Read More »Create New Columns in Pandas

  • Pandas Crosstab – Everything You Need to Know

    The Pandas crosstab function is one of the many ways in which Pandas allows you to customize data. On the surface, it appears to be quite similar to the Pandas pivot table function, which I’ve covered extensively here. This post will give you a complete overview of how to best leverage the function. The crosstab… Read More »Pandas Crosstab – Everything You Need to Know

  • Pandas drop_duplicates: Drop Duplicate Rows in Pandas

    Learn how to drop duplicates in Pandas, including keeping the first or last instance, and dropping duplicates based only on a subset of columns.

  • Use Pandas & Python to Extract Tables from Webpages (read_html)

    Learn how to easily scrape data from the web without having to build a complex web scraping script!

  • Plotting a Histogram in Python with Matplotlib and Pandas

    Learn what histograms are and how to create them in Python with Matplotlib and Pandas.

  • All the Ways to Filter Pandas Dataframes

    Learn all the ways in which to filter pandas dataframes in this tutorial, including filtering dates, multiple columns, using the iloc, loc and query functions!

  • Selecting Columns in Pandas: Complete Guide

    In this tutorial, you’ll learn how to select all the different ways you can select columns in Pandas, either by name or index. You’ll learn how to use the loc, iloc accessors and how to select columns directly. You’ll also learn how to select columns conditionally, such as those containing a specific substring. By the end of this tutorial,… Read More »Selecting Columns in Pandas: Complete Guide

  • Exploring the Pandas Style API

    Explore the how to style Pandas dataframes and make them presentation ready, including how to add conditional formatting and data type labels!

  • Pivot Tables in Pandas with Python

    You may be familiar with pivot tables in Excel to generate easy insights into your data. In this post, you’ll learn how to create pivot tables in Python and Pandas using the .pivot_table() method. This post will give you a complete overview of how to use the .pivot_table() function! Being able to quickly summarize data… Read More »Pivot Tables in Pandas with Python

  • Binning Data in Python with Pandas’ cut()

    In this post, we’ll explore how binning data in Python works with the cut() method in Pandas. In the past, we’ve explored how to use the describe() method to generate some descriptive statistics. In particular, the describe method allows us to see the quarter percentiles of a numerical column. However, as we’re generating insight into… Read More »Binning Data in Python with Pandas’ cut()

  • VLOOKUP in Python and Pandas using .map() or .merge()

    In this tutorial, you’ll learn how to use Python and Pandas to VLOOKUP data in a Pandas DataFrame. VLOOKUPs are common functions in Excel that allow you to map data from one table to another. In many cases, this can be used to lookup data from a reference table, such as mapping in, say, a… Read More »VLOOKUP in Python and Pandas using .map() or .merge()

Библиотека

Last updated