Pandas: количество столбцов (подсчет столбцов в DataFrame)
Last updated
Last updated
В этом уроке вы узнаете, как использовать Pandas для подсчета количества столбцов в DataFrame Pandas. Вы изучите несколько способов для этого, включая использование атрибута df.columns
и атрибута df.shape
. Знание того, как получить количество столбцов в DataFrame Pandas, является важным навыком. Поскольку эти методы выполняют разные функции и возвращают разные типы значений, знание того, какой метод возвращает нужный вам тип результата, полезно для того, чтобы ваша программа действовала так, как вы хотите.
Краткий ответ: Используйте len(df.columns)
Оглавление
Давайте начнем этот учебник с загрузки примера dataframe, с которым вы можете следовать. Если вы работаете с собственным dataframe, вероятно, вы получите другие результаты.
Загрузим наш Dataframe с помощью Pandas:
В приведенном выше коде мы загрузили DataFrame Pandas с помощью функции load_dataset()
, которая входит в пакет Seaborn. Если у вас не установлен модуль Seaborn, вы можете установить его с помощью следующей команды:
Теперь, когда у нас есть датафрейм, давайте научимся считать количество столбцов в датафрейме Pandas с помощью атрибута .columns
.
Хотите узнать больше о f-строках в Python? Ознакомьтесь с моим подробным руководством, в котором есть пошаговое видео, чтобы овладеть f-строками в Python!
В этом разделе вы научитесь простому и универсальному методу подсчета количества столбцов в Pandas Dataframe. Поскольку Dataframe Pandas являются объектами Python, мы можем получать доступ к различным атрибутам, принадлежащим им. Одним из этих атрибутов является атрибут .columns
, который возвращает структуру, подобную списку, содержащую все различные столбцы в этом dataframe
Поскольку мы можем подсчитать количество элементов в списке с помощью функции len()
, мы можем передать атрибут этой функции, чтобы подсчитать количество столбцов в нашем датафрейме.
Посмотрим, как это работает
Мы видим на примере выше, что когда мы передаем атрибут .columns
в функцию len()
, это возвращает количество колонок в списке датафрейма.
В следующем разделе вы узнаете, как подсчитать количество столбцов в Pandas Dataframe, соответствующих определенному условию.
Могут возникнуть ситуации, когда необходимо подсчитать количество столбцов в DataFrame Pandas, которые соответствуют определённому условию. Например, вам может быть интересно, сколько столбцов содержат заданный суффикс или содержат числа.
Мы можем перебирать структуру, подобную списку, и сохранять только те элементы, которые соответствуют условию. В примере ниже вы узнаете, как подсчитать количество столбцов, которые имеют суффикс ‘_mm’
Мы видим, что проверяем, содержится ли строка '_mm'
в названии нашего столбца. Если нет, то не включаем его в наш список столбцов. Наконец, мы подсчитываем количество столбцов, соответствующих нашему условию, что возвращает значение 3.
В следующем разделе вы узнаете, как использовать атрибут .shape
библиотеки Pandas для подсчета количества столбцов в DataFrame.
Атрибут .shape
в Pandas — это полезный атрибут DataFrame, который позволяет увидеть количество строк и столбцов в DataFrame. **Атрибут shape возвращает кортеж значений, где первое значение — это количество строк в DataFrame, а второе значение — количество столбцов в DataFrame
Мы можем получить количество столбцов в нашем датафрейме, используя атрибут .shape
и обратившись ко второму элементу.
Прежде чем мы начнем, давайте посмотрим, что возвращает атрибут .shape
DataFrame
Атрибут возвращает кортеж, соответствующий следующим элементам (количество строк, количество столбцов)
. Мы можем получить доступ ко второму элементу, обратившись к позиции индекса 1.
Давайте посмотрим, как это можно сделать в Pandas:
Здесь мы видим, что при обращении к первому элементу возвращенных данных мы получаем количество столбцов в датафрейме Pandas. В следующем разделе вы узнаете, как использовать метод Pandas .info()
для получения количества столбцов в датафрейме.
В этом заключительном разделе вы научитесь использовать метод .info()
, чтобы получить количество столбцов в датафрейме. Этот метод работает немного иначе, чем атрибут, который вы видели в предыдущих разделах руководства. Это связано с тем, что он возвращает информацию о датафрейме в строковом формате.
Посмотрим, как это выглядит в Pandas:
Мы видим, что хотя предоставляется много полезной информации о самом датафрейме, включая количество столбцов, информация не является легко доступной программно. Например, мы не можем получить количество элементов без непосредственного чтения этой информации.
В этом руководстве вы узнали, как использовать Python и Pandas для подсчета количества столбцов в датафрейме. Вы научились делать это с помощью атрибутов .columns
, .shape
и .info
. Вы освоили, как эти методы работают и какие результаты они возвращают. Вы также научились считать количество столбцов, удовлетворяющих условию, например, содержащих подстроку.
Чтобы узнать больше о библиотеке Seaborn, ознакомьтесь , которое поможет вам использовать эту популярную библиотеку для визуализации данных.
Мы можем сделать это, используя атрибут .columns
фрейма данных. Мы можем использовать списковое включение, чтобы отфильтровать элементы и предоставить только те, которые соответствуют условию. Чтобы узнать больше о списковых включениях Python, , которое также включает в себя видеообзор.
Чтобы узнать больше об атрибуте .columns
в Pandas, .