Python re split - разделение строк с помощью регулярных выражений
Модуль re в Python предоставляет функцию split(), которая позволяет разбить строку на подстроки, используя заданный шаблон регулярного выражения. Вот примеры использования:
Пример 1:
import re
string = "Hello, World! How are you?"
split_str = re.split(r"\W+", string)
print(split_str)
Результат:
['Hello', 'World', 'How', 'are', 'you']
В этом примере мы используем регулярное выражение \W+, которое означает все неалфавитно-цифровые символы. Метод split() будет искать все места, где это регулярное выражение соответствует строке, и разделять их на подстроки.
Пример 2:
import re
string = "Welcome to Python programming"
split_str = re.split(r"\s+", string, maxsplit=2)
print(split_str)
Результат:
['Welcome', 'to', 'Python programming']
В этом примере мы использовали регулярное выражение \s+, которое соответствует одному или более пробельному символу. Мы также указали аргумент maxsplit=2, чтобы ограничить разделение только первыми двумя совпадениями.
Пример 3:
import re
string = "Apple, Orange, Banana, Mango"
split_str = re.split(r",\s*", string)
print(split_str)
Результат:
['Apple', 'Orange', 'Banana', 'Mango']
В этом примере мы использовали регулярное выражение ,\s*, которое соответствует запятой, за которой может следовать ноль или более пробельных символов. Таким образом, мы разделяем строку по запятым, игнорируя пробельные символы.
Это примеры, демонстрирующие применение функции split() из модуля re в Python. Вы можете экспериментировать с различными регулярными выражениями, чтобы адаптировать ее под ваши потребности.