Що таке якісний контент з точки зору пошукових систем

743

Ми постійно женемося за «якістю» контенту. Ми постійно пишемо про це в своєму блозі. Ми постійно говоримо про це на профільних заходах і в групах соцмереж. «Контент повинен бути якісним» – начебто зрозуміло всім, про що йдеться. Але чи так це насправді?

Ніякого абстрактного «якості» контенту не існує, як не існує «хорошого» кіно, «красивої» музики і «цікавих» книг. Кіно може бути хорошим, а книга цікавою для конкретної людини. І той самий фільм буде смертної нудьгою для іншої людини, і нічого дивного тут немає – скільки людей, стільки й думок.

Ну от а як щодо пошуковиків? Представники пошукачів теж постійно твердять нам про якість контенту. Відкриваю розділ «Допомогу вебмайстру» «Яндекса». Зринає згадка цієї самої якості, але про критерії «якості» по суті не сказано нічого. При цьому, очевидно, «якість контенту», про яке говорять пошуковики, – сьогодні один з найважливіших чинників ранжирування.

Зрозуміло, що пошук сьогодні не той, що в нульові роки. Він дуже сильно апгрейдился. Він став розумний. Але він – набір алгоритмів (все ще). Нехай «розумних», нехай складних, нехай самонавчаючих, але – набір алгоритмів. А значить, абстрактний термін «якість контенту» він розкладає на складові «молекули». У цій статті я спробую розглянути «якість контенту», саме як фактор ранжування.

Ось про це давайте поговоримо про те, що ж таке «якісний контент» з точки зору пошуку сьогодні, і які можливі алгоритми оцінки тут можливі. Поїхали.

1. Якісний контент задовольняє потреби користувача

Що таке якісний контент з точки зору пошукових систем

І почну я з однієї важливої речі, я стикаюся з цим постійно. У більшості випадків переважна кількість професіоналів пошукового просування говорять про вміст у прив’язці до текстової релевантності. Це завжди буде розмова про «вхождениях ключів», «щільності ключів», «шинглах», «частотних словниках», «лемах» і т. д. Так, все це має право на існування, і текстова релевантність, безперечно, важлива. Але починаючи десь з 2010-го року – я переконаний у цьому – набагато більший вплив на пошукову видачу надає текст з точки зору поведінкових чинників ранжирування. Тобто у розрахунку підсумкової релевантності документа, фактори, пов’язані з текстовою релевантністю, в рази поступаються за своєю значимістю факторів, пов’язаних з поведінковими характеристиками.

Ви повинні бути експертом в тому, про що ви пишете. І ви повинні створити (це дуже важливо!) максимально повний, вичерпний мануал по досить вузькій проблемі, про яку ви пишете (за кордоном стає популярним термін Power Page стосовно таких статей).

Як це працює з точки зору ранжирування: ваш документ буде «останнім кліком» користувацької ланцюжку кліків – користувач шукає інформацію з якоїсь проблеми, потрапивши на вашу сторінку і ознайомившись з нею, він перестає шукати.

Важливо створити такий текст, після якого користувач перестане шукати інформацію на цю ж тему.

Ось приклади таких мануалів (даю посилання на наші власні статті, анкор посилання – це пошуковий запит в «Яндексі», за яким дана стаття знаходиться в топі): A/B-тестування, Eye Tracking, Просування молодого сайту, Картка товару, Фільтр аффіліатів.

Перевірте і переконайтеся самі, за всім цим запитам наші статті знаходяться в топі «Яндекса», причому ні на одну з цих статей не було куплено жодного посилання за весь час! (Зате зібрано достатню кількість природних соціальних сигналів – лайків, твітів, розшарювання).

Як один з підвидів таких статей, хотів би навести ще один приклад. Є у нас одна стаття – Лендінгем: розвінчання деяких міфів про посадочних сторінках. Ця стаття – не вичерпний мануал по лендингам. Але вона знаходиться в топі «Яндекса» по запиту «лендінгем» – так, теж без єдиної покупної посилання на цю сторінку. Запит має за «Вордстату» частотність більше 36 тис, і щодня генерує трафік на сайт). У чому хитрість? Ми вважаємо, що лендінгем, як маркетинговий інструмент, сьогодні дуже сильно переоцінені. Вони, безперечно, потрібні і важливі, але це точковий інструмент, який не годиться в якості єдиної «точки дотику» з клієнтом. Про це ми говоримо в статті. Ймовірно, після прочитання статті чимала частина людей, яким хтось колись рекомендував використовувати лендінгем, перестає шукати інформацію про них. Вуаля – фактор останнього кліка спрацював.

Моя думка – це найважливіший «текстовий» фактор ранжування сьогодні, в лапках – тому що до текстової релевантності цей фактор відношення не має, хоча має безпосередній вплив на поведінку користувача на сторінці (ну і, відповідно, на поведінкові чинники ранжирування).

2. Якісний контент фокусується на одній тематиці (не «розпорошується»)

Зрозуміло, що текстова релевантність важлива для ранжирування, а вона залежить від щільності входження ключа. Але зворотна сторона: чим більш висока щільність входження ключа, тим вище «спамность» тексту. Тобто такий текст перестає бути природним. Але як текстова релевантність може зростати без переходу в категорію «спаму»? Дуже просто може, насправді.

Пошук вже давно оперує не «ключами», а сутностями. Вибачте, зараз буде трохи незрозуміло, але я постараюся на прикладі.

Напевно, у вашій кімнаті, в якій ви зараз сидите, є дерев’яний предмет, схожий на прямокутник зі сторонами, ну, припустимо, 60 х 90 см По краях цього прямокутника ввинчены у нього чотири оброблених витягнутих бруска. Всього таких брусків 4 штуки. Ви, ймовірно, за цим предметом зараз сидите.

Ви вже зрозуміли, що це таке? Ну? І ось в той момент, коли ви говорите «стіл», ви використовуєте номинативную функцію мови. Сутність/Поняття ви вбрали в лексему.

Що таке якісний контент з точки зору пошукових систем

У термінах лінгвістики ми в текстах використовуємо номінації, в термінах SEO – «ключі». Але пошукові системи вже працюють не просто з номінаціями, а з сутностями. Не зі столами, а з поняттям столу.

І релевантність може бути підвищена без збільшення щільності «ключа», але за рахунок більш високої зустрічальності пов’язаних сутностей.

Одним з простих прикладів пов’язаних сутностей є синоніми: зрозуміло, що «готелі Москви», «готелі Москви» – це суть одне і те ж. Але пов’язані сутності можуть і не бути повними синонімами. Тепер я вам перерахую наступний ряд словосполучень: «готелі Москви», «готелі Москви», «хостели Москви», «квартири в Москві з подобової оплатою». Зрозуміло, що все це не одне і те ж – різниця між готелем і готелем за семантичним значенням мінімальна, але от різниця між готелем і гостелів вже значно вище. А між готелем і квартирою в оренду – так взагалі величезна, це різні речі, переплутати їх неможливо. А що об’єднує ці запити? Об’єднує їх те, що у всіх цих об’єктах можна зупинитися в Москві. Саме тому, за запитом «готелі Москви» ви знайдете у видачі як готелі, так і готелі, але не знайдете хостели, і квартири з подобової оплатою (вони будуть не релевантні запиту). А ось за запитом «зупинитися в Москві недорого» ви знайдете і дешеві готелі, і готелі, і хостели, і квартири з подобової оплатою. Тому що пошук розуміє таку сутність – «місце, де можна зупинитися в Москві, заплативши гроші».

Що таке якісний контент з точки зору пошукових систем

Як пошук визначає пов’язані сутності? Ну, очевидно, за власний поведінки. Відповідно, пов’язані сутності – це не те, що визначається раз і назавжди, вони можуть змінюватися з часом при зміні користувача патернів поведінки.

При роботі зі створення якісного контенту потрібно думати не тільки про те, як користувачі можуть/будуть шукати вашу статтю, але і про те, які пов’язані сутності повинні бути присутніми в статті. Наведу спеціально спрощений приклад. Якщо ви хочете написати текст, який повинен високо ранжируватися за запитом «коротка біографія Наполеона Бонапарта», очевидно, ваша стаття – при всій її лаконічності – не може обійтися без пов’язаних з нею сутностей – «війна 1812 року», «битва при Ватерлоо», «острів Святої Єлени». Тому що біографія Наполеона без згадки цих сутностей теж не мислима.

Все це стає сьогодні критично важливим. Наявність пов’язаних сутностей у статті говорить про повноту поданої інформації. З іншого боку, якщо в статті буде присутній велика кількість сутностей, зв’язок яких між собою для пошукової машини не очевидна (тому що користувальницькі патерни зв’язаність цих сутностей не демонструють), то це буде «розмивати» текстову релевантність, впливаючи з якимсь знижувальним коефіцієнтом на підсумкове значення релевантності документа.

3. Якісний контент інформативний

Абстрактна формулювання, я згоден. Але ви вже, сподіваюся, зрозуміли, що я в цій статті гранично конкретний. Отже, що таке інформативність? Мова йде про так звану «щільність тексту». Максимальна щільність тексту – це коли кількість інформації у статті прагне до нескінченності, а обсяг тексту – прагне до нуля. Іншими словами, коли з тексту нічого не можна прибрати без втрати сенсу.

Алгоритми визначення «водянистості тексту» існує давно, і використовуються вони в IT-індустрії не тільки пошуковими системами, а також творцями анти-спам фільтрів для поштових служб, програмами-архіваторами і т. д.

Алгоритми, що визначають коефіцієнт стисливості тексту, різні. Є алгоритми, які виявляють щільність входження в текст визначених найбільш популярних для російської мови лексем, і, відповідно, виявляються аномалії – відхилення від норми. Є алгоритми словникового стиснення сімейства LZ і т. д.

Відповідно, що потрібно знати про щільність тексту в застосуванні до пошукового просування. Розмовний текст має завжди менш високу щільність, ніж правильний літературний. Звідси висновок: коли для написання тексту нам потрібно провести інтерв’ю з експертом, ні в якому разі не можна такі тексти просто давати в розшифрованому і «причесанном» вигляді, інтерв’ю слід серйозно переробляти – прибирати смислові повтори, довготи, відступу.

З іншого боку, треба розуміти, що максимальна щільність тексту досягається за рахунок «висушування», коли ви прибираєте з тексту все живе й емоційно забарвлене. Наприклад, максимальна щільність тексту, як правило, присутні в документах, постановах, законах і т. д. З цих текстів нічого не можна прибрати без втрати сенсу. Але і читаються вони досить важко, доводиться продиратися через кожне речення, як через зарості якогось густого чагарника.

Пошуковики, індексуючи текстовий контент, враховують не тільки текст з точки зору «стисливості» (наявність у тексті «води»), але і з точки зору зручності читання тексту. Алгоритми читання тексту теж існують (наприклад, індекс легкості читання з Флешем спочатку створений для англійської мови, але існує розрахунок індексу і для російської мови). Але це, по суті, не так важливо – пошукових систем для дослідів весь корпус текстів російською мовою, щоб виявляти свої, скільки завгодно складні, алгоритми читання. І сучасний пошук, звичайно, використовують ці два механізму – визначення «води» у тексті та визначення зручності читання.

Як нам використовувати це у своїх цілях? Пишіть максимально щільні тексти, без «води». Прибирайте смислові повтори, тавтологію, довготи, але не «висушуйте» тексти. Метафори, порівняльні звороти, каламбури, алюзії та інші стежки цілком доречні. Вони роблять текст більш виразним, цікавим і читабельним.

4. Якісний контент породжує соціальний відгук

Що таке якісний контент з точки зору пошукових систем

Ну, ось, нарешті, ми дійшли до одного важливого питання, актуального для SEO-індустрії вже кілька років. Якщо прибрати все зайве, то це питання буде звучати так: чи впливають соцсигналы на ранжирування чи ні?

Перш ніж заглибитися в пошуки відповіді на це питання, давайте визначимося, що таке соцсигналы, які можуть (потенційно) враховуватися пошуковими системами. До соцсигналам я б відніс три види активностей – лайки опублікованій на сторінці допомогою встановлених кнопок соцмереж («лайки»), публікація посилань на матеріал у своєму аккаунті соціальної мережі або в паблике (розшарювання, твіти) і трафік з соцмереж на сторінку.

Тепер до питання про вплив соціальних факторів на ранжування. Досліджень (цілком серйозних, незалежних і достовірних), що підтверджують вплив соцсигналов на ранжирування, існує безліч. Але представники пошукачів неодноразово спростовували (і продовжують спростовувати досі), що соцсигналы враховуються при ранжируванні сайтів. Цілком можливо, що представники пошукачів тут анітрохи не лукавить.

Тут ми бачимо наочний приклад проблеми курки і яйця, тобто проблеми з невстановленої причинно-наслідковим зв’язком. На що «реагують» пошукові системи – на соцсигналы або на контент, який ці соцсигналы породив? Цікавий, який втягує, виральный контент народжує так званий social buzz («соціальний шум»). Оцінює пошук цей шум? Або він оцінює якісь характеристики тексту, які дозволяють визначити цей контент, цікавий, який втягує і виральный (а отже – потенційно – задовольняє потреби аудиторії пошукових систем)?

Я припускаю, що все-таки пошукові системи оцінюють не social buzz як такої, а текст. І добре ранжування статті в пошукових системах по відповідним запитам – це такий самий наслідок високої якості статті, що викликається цією статтею social buzz.

Як це знання може допомогти нам у нашій роботі? Дуже просто. Не варто займатися маніпулюванням з соціальним шумом (купувати «лайки», «розшарювання», а тим більше переходи з соціальних мереж). Замість цього використовуйте природні сигнали, як індикатор якості статті.

Я розумію, що промоутування статті в соцмережах – це окремий бюджет, який потрібно закладати, але мало хто його закладає насправді. Але я також упевнений у двох речах. Перше: бюджет повинен витрачатися не на накрутку соціальних сигналів, а на покупку «дотиків» – контактів вашої цільової аудиторії з вашим контентом. Друге: якщо після промоутування ваш контент не породив природного відгуку в соцмережах, то якість контенту недостатнє. Я переконаний, що якісний контент повинен приносити природні лайки і шери. Так, це важко. Так, це не завжди виходить. Але якщо цього не відбувається, пред’являйте претензії передусім до себе, точніше – до якості свого контенту.

5. Якісний контент викликає довіру

Довіра. Горезвісний «траст». Trust Rank. Зрозуміло, що цей показник, а точніше сума показників, визначається не тільки контентом.

Що таке довіра? З чого воно складається?

Що таке якісний контент з точки зору пошукових систем

Інтернет – це віртуальна реальність. Людина в інтернеті – викривлене дзеркало, і ступінь викривлення залежить від дистанції між реальною людиною і його представленням про себе (яким він хоче здаватися в очах інших). Все те ж саме стосується і діючих бізнесів. Всі вони більшою чи меншою мірою бундючаться – хочуть здаватися більше, краще і ефективніше, ніж в реальності. Пошукова система намагається визначити справжній образ компанії – що вона являє собою насправді. Як це використовувати?

Пишіть про себе. Використовуйте фотографії власного офісу, виробництва, складів. Транслюйте, нарешті, відео з вашого офісу в інтернет.

Якщо залучаєте до створення контенту для вашого сайту експертів вашої компанії, не соромтеся згадувати їхні імена. Нарешті, почніть підписувати авторів ваших статей. У віртуальному просторі вашої компанії не існує, якщо пошукові системи не знають профілі користувачів, які вказують вас як роботодавця. Чим більше буде згадок вашої компанії, тим краще. Це не обов’язково повинні бути неодмінно гіперпосилання на ваш сайт. Пошук враховує звичайне текстове цитування компанії (мало того, може розуміти контекст згадки компанії).

Якщо ви шукаєте співробітників, і у вас велика кількість вакансій на спеціалізованих сайтах – це ознака того, що ви реально існуюча і функціонуюча компанія.

Якщо вас обговорюють клієнти і співробітники на сайтах відгуків – це ознака того, що ви реально існуюча і функціонуюча компанія.

Будьте відкриті в контенті, який ви передаєте. Не намагайтеся прикрашати себе і свої переваги. Не прагніть брати на себе більше, ніж ви є насправді.

Бізнес повинен бути ре-ле-ван-тен того контенту, який він транслює, а контент повинен бути ре-ле-ван-тен бізнесу.

***

На цих п’яти пунктах я хотів продемонструвати, як пошукова система індексує і «розуміє» ваш контент. Я пишу слово «розуміє» в лапках – тому що насправді вона, звичайно, нічого зрозуміти не може, це просто алгоритми. Поки ще. Але пошук розвивається, і розвивається по експоненті. Кожен рік він буде ставати на порядок інтелектуальнішим (до пошукових систем повною мірою застосуємо закон Мура, пам’ятайте про це). «Боротися» з пошуком методом накруток буде ставати складніше з кожним роком і навіть місяцем. Настав час зрозуміти це.