Донецкий техникум промышленной автоматики

Використання регулярних виразів в Google Analytics

«Google Analytics» надає широкий спектр можливостей для оптимізації звітності, тому при правильному підході і наявності деяких нескладних навичок можна за досить нетривалий період часу в кілька разів збільшити ефективність роботи з отриманими даними. Одним з найбільш дієвих інструментів, на думку більшості фахівців, є застосування регулярних виразів.

Регулярні вирази представля Регулярні вирази представля   ють собою взаємодію правил і спеціальних символів, які застосовуються для вилучення фрагментів поля або порівняння ють собою взаємодію правил і спеціальних символів, які застосовуються для вилучення фрагментів поля або порівняння. Іншими словами, регулярні вирази визначають рамки відповідності, після чого фільтри здійснюють певні дії (порівняння і т. Д.) З даними, укладеними в цих рамках. Регулярні вирази в «Google Analytics», як правило, використовуються для завдання цілей, фільтрації даних, а також створення сегментів з розширеними настройками.

На практиці все виглядає набагато простіше. Наприклад, робота фільтра «Виключити за IP-адресою» полягає в тому, що він відфільтровує звернення того відвідувача, IP-адреса якого відповідає встановленим регулярному виразу. Зразок такого регулярного виразу може мати наступний вигляд:

127 \ .211 \ .151 \ .345

В той момент коли користувач з IP-адресою 127.211.151.345 заходить на сторінку сайту, відбувається відповідність між 127 \ .211 \ .151 \ .345 та 127.211.151.345 і, як наслідок, таке звернення фільтрується. Таким чином, у наведеному прикладі, коса риска «\» - це один із символів, які застосовуються для створення регулярних виразів.

Існує кілька символів, які використовуються в регулярних виразах:

1. Вертикальна риса «|» і дужки «()».

Як правило, вони використовуються разом, при цьому, вертикальна риса є аналогом логічного оператора «АБО». Якщо необхідно відокремити пошуковий трафік відповідно до запитів, можна використовувати вертикальну риску.

приклад:

Щоб відфільтрувати пошуковий трафік за запитами, які б не містили назву інтернет-магазину «tradebox.ua», від брендового пошукового трафіку, для оцінки ефективності заходів по SЕО оптимізації і просуванні сайтів , Необхідно в «Google Analytics» створити персоналізований звіт з фільтром, який би прибирав все брендові запити. Іншими словами, всілякі варіанти назви магазину. Використання регулярних виразів в даному випадку, позбавить від необхідності створювати поля фільтра для кожного окремого випадку. Виглядати регулярні вирази будуть наступним чином:

tradebox | trade box | трейдбокс | трейд бокс | трейд бокс | трейдбокс | екфвуіщч | trade - box

Цілком очевидно, що необхідно перерахувати всі варіанти, відокремлюючи їх один від одного вертикальною лінією, що дозволяє виключити їх зі звітності.

2. Квадратні дужки «[]» і дефіси «-».

У квадратні дужки поміщають один з елементів списку, який необхідно знайти. Всі символи, які укладені в квадратні дужки, вважаються окремими елементами.

Приклад 1:

Список, що складається з 6 елементів [фвпрлд]. Розділові знаки в даному варіанті не використовуються, оскільки кожен елемент списку складається тільки з одного символу.

Приклад 2:

Якщо для інтернет-магазину, де товари розміщені в лотах (Лот 1, Лот 2 і т. Д.), Існує необхідність дізнатися, як часто відвідувачі заходять в той чи інший лот, в квадратних дужках слід помістити назви цікавлять лотів - ЛОТ [1489 ] і ввести це регулярний вираз у вікні фільтра «Знайти ключове слово» внизу звіту за ключовими словами.

Використання дефіса допомагає істотно скоротити роботу над складанням регулярного виразу, оскільки його функція полягає у визначенні рамок «від і до».

Приклад 3:

Якщо необхідно в квадратні дужки помістити цілий список - [123456789] або [абвгдежзіклмн], за допомогою дефіса його можна скоротити до - [1-9] і [а-н] - значення не зміниться. Можна використовувати і більш складні, комплексні варіанти - [1-579] - значення цього виразу таке - необхідно виключити всі варіанти від 1 до 5, а також 7 і 9.

Бувають випадки, коли дефіс використовується як частина слова, тобто як один із символів для пошуку.

Приклад 4:

Необхідно знайти такі запити: «Експресбанку», «експресбанк» і «Експресбанку». Для того, щоб скласти регулярний вираз, слід поставити дефіс на початку списку - експрес [-Сб] банк. Таким чином, вираз буде починатися на «експрес» та закінчуватися на «банк», посередині буде дефіс і буква з або буква б.

3. Зірочка "*".

Значення даного символу відповідає нулю і більш попередніх елементів.

приклад:

Для інтернет-магазину, який використовує шестизначні цифрові номера товарів в такому форматі - НТ000000, необхідно визначити, яка кількість відвідувачів шукає товари під номером 12. Для цього необхідно в рядку фільтрації ключових слів використовувати наступне регулярний вираз: «НТ * 12». Таким чином, будуть показані всі пошукові запити для частин НТ012, НТ0012, НТ00012, НТ000012 і НТ12.

4.Обратная коса риска «\» і точка «.».

Як правило, зворотну косу риску застосовують в тих випадках, коли необхідно замінити будь-який спеціальний символ на буквений. Найчастіше зворотна коса риска замінює точки.

Приклад 1:

Якщо необхідно виключити якийсь URL, слід використовувати зворотну косу:

127 \ .211 \ .151 \ .345

Точка «.» Використовується для позначення тільки одного символу.

Приклад 2:

.аря

Даному висловом відповідатимуть значення: зоря, даруючи, варя і інші, а також 5аря, 2аря, оскільки точка позначає не тільки літерні показники, але і цифрові.

Найчастіше зворотна коса і точка використовуються в тандемі.

Приклад 3:

сontactpage.ru

В даному варіанті точка - це постановочний знак, який заміщає один символ. Щоб уникнути варіантів - сontactpage s ru, сontactpage d ru сontactpage n ru і так далі, необхідно використовувати зворотну косу риску: з ontactpage \. ru

5. Каре "^".

Регулярними виразами, де використовується каре, відповідають значення, які мають послідовність символів, вказану після "^".

приклад:

На сайті є дві сторінки: http: // www. shop. ua / secondary / news / і http: // www. shop. ua / news /.

У звітах «Google Analytics» такі сторінки будуть вказуватися, як / secondary / news / і / news /, оскільки про домен www.shop.ua інформація вже є. Щоб знайти всі рядки для другого варіанту - http: // www. shop. ua / news /, при цьому виключити з них варіант перший - / secondary / news /, необхідно використовувати таке регулярний вираз - ^ / news /.

6. Знак долар «$» і плюс «+».

Знак долар, як правило, позначає кінець поля.

Приклад 1:

Якщо частина назв сторінок має закінчення htm, а інша частина - html і необхідно записати частину мети GA для форми підписки на розсилку, з урахуванням тільки версії на html. Регулярний вираз має мати такий вигляд: "/email-form\.htm$".

Знак «$» в цьому варіанті повідомляє, що в рядку є ще символи, і дана сторінка не відповідає цьому виразу. Коса ж риса в цьому виразі необхідна для того, щоб GA розпізнавав точку як звичайний символ, а не спеціальний.

Знак «+» вказує на один або кілька попередніх елементів.

Приклад 2:

експрес + буде відповідати значенням «експрес», «експрес», «експресссс» і т. д.

Можна також використовувати квадратні дужки.

Приклад 3:

[БСЖ] + відповідні значення - «б», «БС», «жбс», «з», «ж», «жжжж» і т. д.

7. Знак питання «?».

Знак питання відповідає або нулю, або одному попередньому висловом, під яким мається на увазі символ, зазначений перед знаком питання.

приклад:

Необхідно визначити тільки URL переходів, в заголовку яких використовується слово «промоушн». Але оскільки в російській мові, це слово ще нестійка, то в написанні можуть бути варіанти, наприклад, «Промоушен». Необхідно для цього створити наступний фільтр: «Промоушен? Н».

NB! : Вживання «Промоушен? Н» в даному випадку неможливо, так як «?» - це не підстановлювальний знак, який свідчить про те, що між «ш» і «н» може розміщуватися будь-яка буква або цифра.

Отже, використання регулярних виразів значно спрощує аналіз веб сайту і оптимізує роботу веб-майстра. Застосовувати їх доцільно як при створенні фільтрів, так і при створенні персоналізованих звітів. Для того щоб на практиці перевірити роботу регулярних виразів, досить перейти в звіти уявлення і скористатися розширеними фільтрами в таблиці. Не слід також забувати, що створення регулярних виразів має бути максимально спрощено, що, в свою чергу, значно полегшить подальшу роботу з ними і аналіз отриманих даних.

Автор: Олександр Фіонін

7. Знак питання «?
Необхідно для цього створити наступний фільтр: «Промоушен?
Вживання «Промоушен?
Н» в даному випадку неможливо, так як «?