В работе маркетолога часто приходится обрабатывать разные тексты. При большом количестве элементов и их разной записи, делать это стандартными методами невозможно. Лучше использовать регулярные выражения, чтобы ускорить процесс работы.
Поиск и замена части текста с помощью регулярных выражений – это мощный инструмент, который используется в программировании и обработке текстов для выполнения различных операций с текстовыми данными. Регулярные выражения позволяют находить шаблоны в строках, извлекать нужные данные и даже заменять их на другие значения.
В статье расскажу про них подробнее.
Задачи могут сильно различаться.
Например, в гугл таблицах нужно убрать из utm ссылок всё, что идёт после адреса страницы.
Пример ссылок с utm метками
Для этого нужно воспользоваться специальной формулой таблиц для регулярных выражений.
REGEXREPLACE(текст; регулярное_выражение; замена)
— С текстом всё понятно, выбираем ячейку, где есть ссылка;— С регулярным выражением сложнее, пишем код \&.*|\?.* в отдельной ячейке и выбираю её;— Для замены используем пустое место “”.
Пример таблицы замены регулярных выражений
Получаем в столбце “Формула” ссылку без utm меток. Фактически происходит следующее:Мы говорим, возьми текст из ячейки А2 → выбери по регулярному выражению в ячейке В2 весь текст из А2 → подставь пустое место (“”).
Разберём регулярное выражение \&.*|\?.*Используя такой код, мы говорим: возьми все символы (.*) до символа & (\&) или (|) возьми все символы (.*) до символа ? (\?).
Для этого нужно определить символ и вывести значения до него. Сделал пример в регулярных выражениях.
Разберём выражение
^[^\:]*
Значения регулярных выражений можно посмотреть на специальном сайте regexr.com.
Удобно вставить анализируемый текст и подбирать коды регулярных выражений. Подсветкой будет выделен выбираемый текст.
Скрин моделирования регулярных выражений
Коды приведены в левом пунтке меню Cheatsheet.
Кратко привожу их в таблице:
Если мы ищем определённое количество символов. Например, шестизначный почтовый индекс или все коды товаров из трёх букв. Тогда на помощь приходят квантификаторы или кванторы. Это специальные выражения, которые задают количество искомых знаков.
Квантификаторы применяются к тому символу, что стоит перед ним:
Помимо использования REGEXREPLACE можно применять и другие регулярные выражения: