Python: Сортировка строки (4 различных способа)

В этом учебнике вы узнаете, как использовать Python для сортировки строки в алфавитном порядке. Вы узнаете несколько различных способов сделать это, включая сортировку строк в алфавитном порядке, независимо от регистра, и с учетом регистра. Вы также узнаете, как сортировать уникальные символы и как сортировать строку, удаляя пробелы и пунктуацию.

Умение работать со строками в Python и знание того, как их сортировать, имеет множество полезных применений. Например, вы можете проверять дублирующиеся строки для очистки данных перед выполнением обработки естественного языка. Альтернативно, вы можете создавать игру и проверять анаграммы в своей программе.

Содержание

Сортировка строки в Python с помощью sorted

Python имеет встроенную функцию sorted(), которая принимает итерируемый элемент и сортирует элементы по заданному ключу. Значение по умолчанию для этого ключа – None, что сравнивает элементы напрямую. Функция возвращает список всех отсортированных элементов.

Давайте посмотрим, как это выглядит:

# Сортировка строки в Python с помощью sorted()
word = 'datagy'

sorted_word = sorted(word)
print(sorted_word)

# Возвращает: ['a', 'a', 'd', 'g', 't', 'y']

Мы видим, что когда мы применяем функцию sorted к нашей строке, возвращается список. Элементы списка отсортированы в алфавитном порядке.

Как мы можем преобразовать этот список обратно в строку? Мы можем использовать метод str.join(), как показано ниже:

# Сортировка строки в Python с помощью sorted()
word = 'datagy'

sorted_word = sorted(word)
sorted_word = ''.join(sorted_word)
print(sorted_word)

# Возвращает: aadgty

Мы видим, что строка теперь отсортирована (и снова является строкой). Мы можем объединить это в одну строку, написав:

# Сортировка строки в Python с помощью sorted()
word = 'datagy'

sorted_word = ''.join(sorted(word))
print(sorted_word)

# Возвращает: aadgty

Теперь, что происходит, когда мы включаем заглавные буквы в нашу строку? Давайте заглавную первую букву и посмотрим, что произойдет:

# Сортировка строки в Python с помощью sorted()
word = 'Datagy'

sorted_word = ''.join(sorted(word))
print(sorted_word)

# Возвращает: Daagty

Мы видим, что теперь заглавная D появляется перед строчной a. Почему это происходит? Python интерпретирует сортировку явно, когда мы не применяем ключ, заставляя значения сортироваться на основе их значений ASCII. В этом случае заглавные буквы сортируются перед строчными значениями.

В следующем разделе вы узнаете, как сортировать строку в Python без учета регистра, что может дать вам нужные результаты.

Хотите узнать, как развернуть строку в Python? Ознакомьтесь с этим учебником, который научит вас шести различным способам разворота строки в Python: Python: Reverse a String (6 Easy Ways)

Сортировка строки в Python с помощью sorted без учета регистра

В примере выше вы узнали, как использовать функцию sorted для строки в Python. Однако, просто применяя функцию sorted без ключа, заглавные буквы сортируются перед всеми строчными буквами. Что если мы хотим отсортировать строку с заглавными буквами, но разместить их в алфавитном порядке? Мы можем использовать параметр key=, чтобы указать, как сортировать строку без учета регистра.

Параметр key= позволяет передать функцию, которая позволяет Python создать ключ сравнения для каждого элемента в итерируемом объекте. Это означает, что мы можем использовать функцию для создания значения для сравнения. В предыдущем примере это значение было установлено на None по умолчанию, что означает, что значения сравнивались напрямую друг с другом.

Давайте посмотрим, как мы можем использовать параметр key= функции sorted для сортировки нашей строки, игнорируя чувствительность к регистру:

# Сортировка строки в Python с помощью sorted()
word = 'Datagy'

sorted_word = ''.join(sorted(word, key=str.lower))
print(sorted_word)

# Возвращает: aaDgty

Мы видим, что, хотя все ключи в строке остаются в своем исходном регистре, они теперь отсортированы на основе их строчных эквивалентов. Это отличный способ сортировать строку, сохраняя целостность исходной строки, если регистр важен.

Если вас не волнует регистр, вы всегда можете преобразовать строку в нижний регистр. Таким образом, вам не нужно применять параметр key=. Давайте посмотрим, как это выглядит:

# Сортировка строки в Python с помощью sorted()
word = 'Datagy'

sorted_word = ''.join(sorted(word.lower()))
print(sorted_word)

# Возвращает: aadgty

Мы видим, что мы использовали тот же метод строки .lower(), что и раньше, чтобы преобразовать нашу строку в нижний регистр. Это, конечно, изменяет значения строки, тем самым удаляя целостность исходных данных.

В следующем разделе вы узнаете, как сортировать строку только с уникальными символами.

Хотите узнать, как преобразовать строку в нижний регистр? Узнайте нюансы трех различных методов, которые предлагает Python, в этом подробном учебнике: Python Lowercase String with .lower(), .casefold(), and .islower()

Сортировка строки в Python с уникальными символами

Вы можете захотеть просто отсортировать различные символы строки с уникальными символами в этой строке. Для этого мы можем использовать функцию Python set, которую мы можем использовать для преобразования элемента в набор. Наборы – это одна из основных структур контейнеров данных Python. Одной из их уникальных характеристик является то, что все элементы в них уникальны.

Мы можем использовать уникальность в наших интересах здесь – мы можем преобразовать нашу строку в набор, а затем отсортировать значения. Наконец, мы можем преобразовать его обратно в строку с помощью метода строки .join.

Давайте посмотрим, как это выглядит:

# Сортировка строки в Python с помощью sorted()
word = 'Datagy'

sorted_word = ''.join(sorted(set(word)))
print(sorted_word)

# Возвращает: Dagty

Мы видим, что строка отсортирована только для уникальных символов. Если мы хотим отсортировать наши символы снова, используя нечувствительность к регистру, мы можем применить тот же подход, как показано выше:

# Сортировка строки в Python с помощью sorted()
word = 'Datagy'

sorted_word = ''.join(sorted(set(word), key=str.lower))
print(sorted_word)

# Возвращает: aDgty

Так как строки в Python часто бывают довольно грязными и могут содержать пробелы и пунктуацию, если вы хотите узнать, как сортировать строки без пробелов и пунктуации, ознакомьтесь с следующим разделом.

Хотите проверить, является ли строка в Python палиндромом? Этот учебник научит вас пяти различным способам сделать это: Python: Check If a String is a Palindrome (5 Easy Ways!)

Сортировка строки в Python и удаление пробелов и пунктуации

В этом последнем разделе вы узнаете, как сортировать строку в Python и удалить пробелы и пунктуацию. Поскольку строки в Python часто содержат неалфавитные символы, мы можем найти способ сортировать нашу строку, игнорируя эти значения.

Для этого мы сначала отфильтруем нашу строку с помощью метода строки .isalpha, который сохраняет только алфавитные символы. Давайте посмотрим, как это можно сделать в Python:

# Сортировка строки в Python с помощью sorted()
word = 'da ta ?gy!'

sorted_word = ''.join(filter(lambda x: x.isalpha(), sorted(word, key=lambda x: x.lower())))
print(sorted_word)

# Возвращает: aadgty

Давайте посмотрим, что мы сделали:

  • Сначала мы сортируем слово, используя нечувствительность к регистру

  • Затем мы используем функцию filter, чтобы сохранить только алфавитные символы

  • Наконец, мы объединяем наш список символов обратно в одну строку

Хотите узнать, как удалить все специальные символы в строке Python? Ознакомьтесь с этим учебником, чтобы узнать как: Python: Remove Special Characters from a String

Заключение

В этом учебнике вы узнали, как использовать Python для сортировки строки. Вы узнали несколько различных способов сделать это, включая использование функции sorted с учетом и без учета регистра. Вы также узнали, как сортировать только уникальные буквы и как сортировать только алфавитные символы, тем самым удаляя пробелы и пунктуацию.

Чтобы узнать больше о функции sorted в Python, ознакомьтесь с официальной документацией здесь.

Last updated