Для сохранения прогресса вступите в курс. Войти или зарегистрироваться.

Конспект урока

Познакомимся с понятиями жадной и ленивой квантификации.

Давайте напишем регулярное выражение, которое подсветит все теги в нашей строке. Для этого укажем открывающие и закрывающие знаки тега: < и >, а внутри пусть будет любой символ:


/<.*>

<a href="http://www.yandex.ru">google</a>


Несмотря на то, что в строке есть два тега — открывающий и закрывающий — в результате сопоставилась вся строка. Такое поведение называется жадным. Это значит, что квантификатор повторяется столько раз, сколько это возможно. По умолчанию в регулярных выражениях квантификация жадная, поэтому у нас захватывается максимальная подстрока. Вся строка соответствует нашему регулярному выражению: всё внутри < и > считается содержимым тега.

Чтобы избежать жадного поведения, вместо любого символа внутри тэга мы можем задать любой символ, за исключением закрывающего. И тогда сопоставляются два тега отдельно:


/<[^>]*>

<a href="http://www.yandex.ru">google</a>


Несмотря на эффективность такого решения, это лишь уход от проблемы. Так можно избежать последствий жадного поведения, но не его самого.

Чтобы из жадной сделать квантификацию ленивой, необходимо использовать специальный символ ?:


/<.*?>

<a href="http://www.yandex.ru">google</a>


Не забывайте, что в регулярных выражениях многие специальные символы ведут себя по-разному, в зависимости от того, где они стоят. Если бы ? располагался после точки, то он рассматривался бы просто как квантификатор "ни одного символа, либо один символ":


/<.?>

a link to Google or Yandex


Но когда ? идёт сразу после квантификатора, он рассматривается регулярным выражением как специальный символ, который из жадных квантификаторов делает ленивые.

Мы учим программированию с нуля до стажировки и работы. Попробуйте наш бесплатный курс «Введение в программирование» или полные программы обучения по Node, PHP, Python и Java.

Хекслет

Подробнее о том, почему наше обучение работает →