Pandas: количество столбцов (подсчет столбцов в DataFrame)
В этом уроке вы узнаете, как использовать Pandas для подсчета количества столбцов в DataFrame Pandas. Вы изучите несколько способов для этого, включая использование атрибута df.columns
и атрибута df.shape
. Знание того, как получить количество столбцов в DataFrame Pandas, является важным навыком. Поскольку эти методы выполняют разные функции и возвращают разные типы значений, знание того, какой метод возвращает нужный вам тип результата, полезно для того, чтобы ваша программа действовала так, как вы хотите.
Краткий ответ: Используйте len(df.columns)
Оглавление
Загрузка образца Pandas Dataframe
Давайте начнем этот учебник с загрузки примера dataframe, с которым вы можете следовать. Если вы работаете с собственным dataframe, вероятно, вы получите другие результаты.
Загрузим наш Dataframe с помощью Pandas:
В приведенном выше коде мы загрузили DataFrame Pandas с помощью функции load_dataset()
, которая входит в пакет Seaborn. Если у вас не установлен модуль Seaborn, вы можете установить его с помощью следующей команды:
Чтобы узнать больше о библиотеке Seaborn, ознакомьтесь с моим подробным руководством здесь, которое поможет вам использовать эту популярную библиотеку для визуализации данных.
Теперь, когда у нас есть датафрейм, давайте научимся считать количество столбцов в датафрейме Pandas с помощью атрибута .columns
.
Хотите узнать больше о f-строках в Python? Ознакомьтесь с моим подробным руководством, в котором есть пошаговое видео, чтобы овладеть f-строками в Python!
Получить количество столбцов Pandas Dataframe с помощью .columns
В этом разделе вы научитесь простому и универсальному методу подсчета количества столбцов в Pandas Dataframe. Поскольку Dataframe Pandas являются объектами Python, мы можем получать доступ к различным атрибутам, принадлежащим им. Одним из этих атрибутов является атрибут .columns
, который возвращает структуру, подобную списку, содержащую все различные столбцы в этом dataframe
Поскольку мы можем подсчитать количество элементов в списке с помощью функции len()
, мы можем передать атрибут этой функции, чтобы подсчитать количество столбцов в нашем датафрейме.
Посмотрим, как это работает
Мы видим на примере выше, что когда мы передаем атрибут .columns
в функцию len()
, это возвращает количество колонок в списке датафрейма.
В следующем разделе вы узнаете, как подсчитать количество столбцов в Pandas Dataframe, соответствующих определенному условию.
Подсчитайте количество столбцов Pandas Dataframe, соответствующих условию
Могут возникнуть ситуации, когда необходимо подсчитать количество столбцов в DataFrame Pandas, которые соответствуют определённому условию. Например, вам может быть интересно, сколько столбцов содержат заданный суффикс или содержат числа.
Мы можем сделать это, используя атрибут .columns
фрейма данных. Мы можем использовать списковое включение, чтобы отфильтровать элементы и предоставить только те, которые соответствуют условию. Чтобы узнать больше о списковых включениях Python, ознакомьтесь с моим подробным руководством здесь, которое также включает в себя видеообзор.
Мы можем перебирать структуру, подобную списку, и сохранять только те элементы, которые соответствуют условию. В примере ниже вы узнаете, как подсчитать количество столбцов, которые имеют суффикс ‘_mm’
Мы видим, что проверяем, содержится ли строка '_mm'
в названии нашего столбца. Если нет, то не включаем его в наш список столбцов. Наконец, мы подсчитываем количество столбцов, соответствующих нашему условию, что возвращает значение 3.
В следующем разделе вы узнаете, как использовать атрибут .shape
библиотеки Pandas для подсчета количества столбцов в DataFrame.
Получить количество столбцов Pandas Dataframe с помощью .shape
Атрибут .shape
в Pandas — это полезный атрибут DataFrame, который позволяет увидеть количество строк и столбцов в DataFrame. **Атрибут shape возвращает кортеж значений, где первое значение — это количество строк в DataFrame, а второе значение — количество столбцов в DataFrame
Мы можем получить количество столбцов в нашем датафрейме, используя атрибут .shape
и обратившись ко второму элементу.
Прежде чем мы начнем, давайте посмотрим, что возвращает атрибут .shape
DataFrame
Атрибут возвращает кортеж, соответствующий следующим элементам (количество строк, количество столбцов)
. Мы можем получить доступ ко второму элементу, обратившись к позиции индекса 1.
Давайте посмотрим, как это можно сделать в Pandas:
Здесь мы видим, что при обращении к первому элементу возвращенных данных мы получаем количество столбцов в датафрейме Pandas. В следующем разделе вы узнаете, как использовать метод Pandas .info()
для получения количества столбцов в датафрейме.
Получить количество столбцов Pandas Dataframe с помощью .info
В этом заключительном разделе вы научитесь использовать метод .info()
, чтобы получить количество столбцов в датафрейме. Этот метод работает немного иначе, чем атрибут, который вы видели в предыдущих разделах руководства. Это связано с тем, что он возвращает информацию о датафрейме в строковом формате.
Посмотрим, как это выглядит в Pandas:
Мы видим, что хотя предоставляется много полезной информации о самом датафрейме, включая количество столбцов, информация не является легко доступной программно. Например, мы не можем получить количество элементов без непосредственного чтения этой информации.
Заключение
В этом руководстве вы узнали, как использовать Python и Pandas для подсчета количества столбцов в датафрейме. Вы научились делать это с помощью атрибутов .columns
, .shape
и .info
. Вы освоили, как эти методы работают и какие результаты они возвращают. Вы также научились считать количество столбцов, удовлетворяющих условию, например, содержащих подстроку.
Чтобы узнать больше об атрибуте .columns
в Pandas, ознакомьтесь с официальной документацией здесь.
Last updated