Как Добавить Новый Столбец в DataFrame Pandas
В этом учебном пособии вы узнаете, как добавить новый столбец в DataFrame Pandas. Библиотека Pandas предоставляет удобный способ работы с табличными данными. Одна из самых распространенных задач, с которыми вы столкнетесь, — это необходимость добавить больше данных в DataFrame Pandas.
К концу этого руководства вы научитесь:
Как добавить новый столбец в DataFrame Pandas
Как создать новый столбец постоянных значений в DataFrame Pandas
Как создать новый столбец на основе значений другого столбца
Содержание
Создание образца DataFrame Pandas
Чтобы следовать этому учебному пособию, вы можете скопировать и вставить код ниже в свой любимый редактор кода. Если у вас есть свой собственный набор данных, не стесняйтесь использовать его, хотя ваши результаты могут отличаться. Давайте посмотрим на наш набор данных:
В приведенном выше DataFrame у нас есть три столбца: ['Name', 'Location', 'Amount']
. Теперь, когда у нас есть DataFrame, давайте приступим к добавлению новых столбцов!
Как добавить столбец в DataFrame Pandas с постоянным значением
В этом разделе вы узнаете, как добавить в DataFrame Pandas столбец с постоянным значением. Самый простой способ сделать это - это непосредственно присвоить значение новому столбцу. Это присваивает значение каждой записи в столбце DataFrame.
Давайте посмотрим, как это выглядит:
В приведенном выше блоке кода, мы назначили одно значение (в данном случае строку 'datagy'
) всему столбцу DataFrame.
Добавление одного постоянного значения в DataFrame Pandas часто не является наиболее распространенной задачей, поскольку информация часто бывает избыточной. В следующем разделе вы научитесь добавлять столбец в Pandas из списка значений.
Простой способ добавить новый столбец в DataFrame Pandas — присвоить список новому столбцу. Это позволяет напрямую назначить новый столбец на основе существующих или новых данных.
Давайте посмотрим, как добавить новый столбец из списка:
В приведенном выше коде мы присвоили список новому столбцу DataFrame в Pandas. Важно отметить, что длина списка должна точно соответствовать количеству записей в DataFrame. В противном случае Pandas выдаст ValueError
, указывающий на несоответствие длин.
Как добавить столбец в фрейм данных Pandas из словаря
Простой способ добавить новый столбец в Pandas DataFrame на основе других столбцов - это использование словаря для отображения. Это позволяет легко воспроизвести VLOOKUP в Pandas. Этот метод особенно полезен, когда у вас есть определенное количество элементов, соответствующих другим категориям.
Давайте посмотрим, как мы можем адаптировать информацию о странах, исходя из города, из которого человек родом:
В приведенном выше блоке кода мы использовали метод map()
для сопоставления со словарем значений. Мы применили метод напрямую к другому столбцу, где словарь ищет ключ и возвращает соответствующее значение.
В следующем разделе вы узнаете, как добавить несколько столбцов в DataFrame Pandas.
Как добавить несколько столбцов в фрейм данных Pandas
Часто возникает необходимость добавить в DataFrame Pandas несколько столбцов. Любой из вышеупомянутых методов будет работать. Например, вы можете назначить два столбца, передав два списка данных.
Давайте посмотрим, как мы можем использовать список списков для создания двух колонок в Pandas:
Давайте разберем, что мы сделали выше:
Мы назначили две колонки,
df['Образец']
иdf['Sample2']
Мы передали список списков, каждый из которых содержит пять значений
Как добавить новый столбец, производный от другого столбца кадра данных Pandas
В этом разделе вы узнаете, как добавить новый столбец, являющийся производной от другого столбца. Это позволяет добавить новый столбец, который рассчитывается на основе значений другого столбца. Например, вы можете умножить значения в одном столбце, чтобы рассчитать новый столбец. В приведенном ниже примере вы узнаете, как добавить налог с продаж к столбцу на основе одного столбца:
Как добавить новый столбец в фрейм данных Pandas путем слияния с другим фреймом данных
В этом заключительном разделе вы научитесь добавлять новый столбец в DataFrame Pandas, объединяя его с другим DataFrame. Это может быть полезно при работе с реляционными данными из базы данных, например, с данными, которые вы загружаете из SQL базы данных
Функция merge()
в Pandas позволяет имитировать комплексное слияние, включая различные типы объединения. Давайте посмотрим, как добавить новый столбец, объединив два DataFrame:
Давайте разберем, что мы сделали в приведенном выше коде:
Мы загрузили два DataFrame, один из которых мы объединим с другим.
Мы затем использовали функцию
merge()
из библиотеки PandasВ заключение, мы использовали метод
.drop()
, чтобы удалить дублирующийся столбец.
Заключение
В этом уроке вы научились использовать Pandas для добавления нового столбца в DataFrame. Сначала вы узнали, как присвоить константное значение напрямую. Затем вы научились добавлять различные значения на основе списка или из словаря. Затем вы изучили, как добавить несколько столбцов в DataFrame Pandas одновременно. После этого вы научились добавлять столбцы, производные от другого столбца. Наконец, вы узнали, как объединить два DataFrame для добавления столбца в DataFrame.
Дополнительные ресурсы
Чтобы узнать больше о смежных темах, ознакомьтесь с ниже приведенными учебными материалами:
Преобразование списка словарей в фрейм данных Pandas
Как добавить/вставить строку в фрейм данных Pandas
Pandas: как удалить столбец индекса Dataframe
Pandas Sum: добавьте столбцы и строки Dataframe
Last updated