Регулярные выражения (Regexp)

Теория: Поиск по условию

В этом уроке мы изучим еще одну технику поиска — поиск по условию. Это одна из самых сложных конструкций, которая существует в регулярных выражениях и не поддерживается в JavaScript, и многих других языках программирования.

В некоторых языках нужно учитывать особенности его реализации: Python поддерживает условный поиск с использованием группировки с обратной связью или именованных групп.

Эта конструкция напоминает тернарный оператор из языков программирования и выглядит следующим образом: (?ifthen|else).

Рассмотрим ее работу на таком примере:


/(?(?<=a)m|p)/

mam,pap


Мы видим внешние скобки с ?, а внутри — два отдельных выражения:

  • Первое — это условие (?<=a). Оно проверяет, соответствует ли символ слева a
  • Дальше идет альтернатива. Мы выбираем между m и p в зависимости от того, сработало условие или нет

Можно описать эту конструкцию так: «Найти все m перед которыми идет a, или все p, перед которыми a нет».

Давайте разберем поиск в нашей строке посимвольно:

  • Сначала идет проверка условия — является ли текущий символ m и стоит ли перед ним a. Условие не выполнилось, поэтому пробуем извлечь p, что также не является текущим символом
  • Второй символ a не подходит под условия. Пропускаем подстроку ma и проверяем m,pap
  • Третий символ m соответствует m, ранее была a — мы нашли первое сопоставление
  • Четвертый символ , не подходит под условия. Пропускаем подстроку mam, и проверяем pap
  • Пятый символ p не соответствует am, но соответствует p — мы нашли второе сопоставление
  • Шестой символ a снова запускает проверку следующего символа на соответствие m
  • Седьмой символ p проваливает проверку на соответствие m

Вот так в результате условного поиска мы нашли два совпадения в строке.

Рекомендуемые программы