Защо Google не индексира сайта ми - причини и решения

Защо Google не индексира сайта ми

Ако се чудиш защо Google не индексира сайта ти, в момента гледаш в Google Search Console статус "Discovered – currently not indexed" или си написал името на продукта си в Google и си получил нула резултати - спри да разчиташ само на Request Indexing. В много случаи той няма да реши проблема, и след малко ще ти обясня защо.

Първо искам да ти кажа нещо, което рядко ще прочетеш в техническите статии: най-вероятно не си направил нищо нередно и не си наказан.

За над десет години в SEO съм поемал десетки сайтове на собственици на малък бизнес, които ми се обаждат точно в това състояние - на ръба, защото са платили за сайт, чакат седмици и "нищо не излиза".

Почти винаги, когато отворя такъв сайт, виждам една и съща картина: сайтът дори не е свързан с Google. Няма property в Search Console, няма подаден sitemap, при WordPress липсва какъвто и да е SEO плъгин, заглавията и meta данните ги няма. Сайтът не е наказан - Google просто още не знае, че съществува, или знае за него, но няма достатъчно сигнали, че страницата заслужава място в индекса.

Затова в тази статия няма да получиш поредния списък от десет причини. Ще тръгнем от началото и ще проверим нещата в реда, в който ги проверявам аз на живо: първо дали сайтът ти изобщо говори с Google, после какво точно ти казват онези английски статуси в конзолата, и накрая защо "индексиран" не е същото като "виждам се в Google". Започваме с проверка, която отнема трийсет секунди.

Какво всъщност значи "индексиране" и защо сайтът ти е невидим

Преди да търсим виновник, трябва да сме наясно какво се случва между момента, в който публикуваш страница, и момента, в който тя се появява в Google. Това не е една стъпка, а три отделни - и провалът на която и да е от тях води до едно и също разочарование: сайт, който сякаш не съществува. Ето защо терминологията тук има значение, не за да звучим сложно, а защото всеки от тези термини отговаря на конкретна стъпка, която или работи, или е счупена.

Каква е разликата между обхождане, индексиране и класиране?

Обхождането (crawling) е когато роботът на Google, Googlebot, открива и прочита страницата ти. Индексирането (indexing) е когато Google решава да я запази в гигантската си база данни - индекса. Класирането (ranking) е къде те показва при реално търсене. Това са три отделни стъпки и провалиш ли първата, останалите няма как да се случат.

Представи си го като библиотека. Обхождането е библиотекарят, който намира книгата ти на входа. Индексирането е решението му дали да я сложи на рафта и да я въведе в каталога. Класирането е на кой рафт и колко напред я подрежда, когато някой попита за тази тема.

Сайтът ти може да е обходен, но да не е индексиран. Може да е индексиран, но да не се класира. Всяка от тези ситуации изглежда еднакво отвън - "не се виждам в Google" - но има напълно различна причина.

Има и четвърта стъпка, която често е невидимият виновник при модерните сайтове: рендирането (rendering). Ако сайтът ти зарежда съдържанието си с JavaScript (типично за React или Next.js решения без сървърно рендиране), Googlebot първо вижда празна страница и трябва да я "изрисува" допълнително, в отделна опашка.

Докато това се случи - а понякога не се случва както трябва - страницата ти на практика е празна за Google. Това е причина за неиндексиране, която почти никой не споменава, защото изглежда като текстов проблем, а всъщност е технически.

Първата проверка за 30 секунди: site:domain.com

Преди да отваряме Search Console и да се давим в английски статуси, искам да направиш една проверка, която не изисква никакъв достъп и отнема половин минута. Тя ще ти каже в коя от трите ситуации се намираш - изобщо ли те няма в Google, частично ли си вътре, или си индексиран, но просто не се класираш. Без този отговор всичко останало е гадаене.

Какво ти казва site:domain.com - и какво не

Отвори Google и напиши site: плюс домейна си, без интервал - например site:tvoiatdomain.com. Резултатът показва приблизително кои твои страници са в индекса на Google. Нула резултати означава, че сайтът ти на практика го няма в индекса. Малко резултати при много страници означава частичен проблем. Много резултати - индексиран си.

Това е най-бързата диагностика, която съществува, и точно затова я препоръчвам на всеки, който ми се обади в паника. Но има едно важно ограничение, което трябва да разбереш, за да не си направиш грешен извод.

Операторът site: ти казва дали си в индекса - нищо повече. Не ти казва на коя позиция се класираш, не ти казва защо не получаваш трафик, и не отразява в реално време последните промени. Виждаш всичките си страници, но нямаш посещения? Тогава проблемът ти не е индексиране - индексиран си - а класиране. Това е напълно различен разговор, към който ще се върнем в края.

За по-детайлна картина после ще влезем в Search Console, в раздела "Pages", където Google разбива страниците на "Indexed" и "Not indexed" с конкретна причина за всяка. Но site: е безплатната първа стъпка, която не изисква нищо освен браузър.

Свързан ли е изобщо сайтът ти с Google Search Console?

Ако site: проверката върна нула или почти нула, най-вероятната причина не е екзотична - сайтът ти просто не е свързан с Google по никакъв начин. Това е най-честият случай, който виждам при предадени сайтове, и за съжаление почти никога не се обсъжда, защото техническите статии приемат за даденост, че вече имаш работеща Search Console. Нека проверим това допускане, защото без property в Search Console ти работиш сляпо.

WordPress: Site Kit и връзката със Search Console

Ако сайтът ти е на WordPress, най-лесният мост към услугите на Google е официалният плъгин Site Kit. Той свързва и показва данните от Search Console и Analytics директно в админ панела ти. Важно уточнение обаче: Site Kit само показва данните - той сам по себе си не индексира нищо и не е достатъчен, ако зад него няма реално верифициран property в Search Console.

На практика стъпките са: инсталираш Site Kit, влизаш с Google акаунта си и плъгинът създава и верифицира property в Search Console вместо теб. От този момент Google има канал, по който да ти докладва какво вижда.

Ако нямаш нито Site Kit, нито друг SEO плъгин като RankMath, и никога не си отварял Search Console - ето къде е проблемът ти. Google не те "пренебрегва". Просто никой не му е казал, че те има, и ти нямаш никаква видимост какво се случва.

Custom, HTML или Next.js: верификация през DNS или HTML property

При сайтове без WordPress - чист HTML/CSS/JavaScript или Next.js - нямаш плъгин, който да свърши работата вместо теб. Верификацията става ръчно в Search Console по един от два начина: чрез DNS property (TXT запис в домейна, който покрива целия домейн с всичките му поддомейни) или чрез URL-prefix property (качваш HTML файл, добавяш мета таг или ползваш Google Analytics).

DNS методът е най-чистият, защото обхваща целия домейн наведнъж, но не е единственият - за конкретен сайт без поддомейни HTML файлът или мета тагът вършат същата работа. Изборът зависи от това дали имаш достъп до DNS настройките на домейна.

При Next.js и подобните решения има допълнителна уловка, която трябва да провериш веднага: как се рендира съдържанието. Ако страниците ти се изграждат изцяло от страната на клиента (client-side rendering), Googlebot може да получи празен HTML и да реши, че няма какво да индексира.

Сървърното рендиране (SSR) или статичното генериране (SSG) решават това, като подават готовото съдържание още при първото зареждане. Ако сайтът ти е "празен" за Google въпреки коректна верификация, рендирането е първото нещо, което бих проверил.

Сайтът, предаден без никаква оптимизация - как да го разпознаеш

Сега стигаме до сценария, който ме изненадва дори след десет години. Често човекът, който ми се обажда, е платил прилична сума за сайт, понякога е доплатил "за SEO" отгоре, и в крайна сметка е получил черупка, на която не е направено абсолютно нищо.

Не казвам това, за да съдя някого - казвам го, защото ако твоят сайт е такъв, разпознаването му за минута ти спестява седмици чакане за индексиране, което никога няма да дойде. Ето как изглежда отвътре.

Признаците на "предаден", но неоптимизиран сайт

Отвори която и да е страница, кликни с десен бутон и избери "Преглед на изходния код" (View Source). Търсиш няколко неща: има ли <title> таг с осмислено заглавие, има ли точно един <h1>, има ли meta description, имат ли снимките alt атрибут. Ако всичко това липсва или е празно, сайтът ти не е оптимизиран на базово ниво - и това само по себе си забавя или спира индексирането.

При WordPress добави и проверката за SEO плъгин: ако в админ панела няма нито RankMath, нито друг подобен, никой не е управлявал заглавията, каноничните тагове и sitemap-а ти. Провери и дали изобщо съществува sitemap, като отвориш tvoiatdomain.com/sitemap.xml или sitemap_index.xml. Липсващ sitemap означава, че Google трябва да открива страниците ти само чрез линкове - а ако и вътрешното свързване е слабо, новите страници остават невидими.

Това не са дребни козметични пропуски. За Google те са сигнал, че сайтът е изоставен или некачествен - и точно затова той не бърза да отдели ресурс за обхождането му. Ако се чудиш какво точно проверява SEO одитът на сайт и какви са цените в България - там обяснявам обхвата на анализа в детайли.

Остаряла тема, стар PHP и бавен хостинг

Има и втори, по-коварен слой при предадените сайтове: технологичната основа. Остаряла тема, която вече не се обновява, стара версия на PHP и претоварен споделен хостинг водят до бавно зареждане и сървърни грешки. А когато Googlebot усети, че сайтът се задъхва, той сам намалява темпото на обхождане, за да не те събори - и спира да стига до новите ти страници.

Конкретният сигнал, който търся тук, са грешки от тип 503 (Service Unavailable) и други 5xx грешки под натиск. Те казват на Google "сега не мога да те обслужа" и ако се повтарят, обхождането се срива. Същият ефект има и тема, претрупана с тежки скриптове - тя бави рендирането и изяжда ресурса, който Google е готов да отдели на сайта ти.

Това е важно за разбиране: индексацията понякога се проваля не заради текста ти, а заради хостинга и темата. Решението не е повече съдържание, а по-бърз и стабилен сайт.

Декодер на статусите в Google Search Console

Ако сайтът ти е свързан и влезеш в раздела "Pages" на Search Console, ще видиш страниците разпределени по статуси - на английски, без обяснение, понякога стотици наведнъж. Тези редове изглеждат като чужд език и точно затова толкова хора се отказват. Ще ги преведа един по един: какво означава всеки, проблем ли е и какво се прави. Запазвам английските надписи точно както ги виждаш в конзолата, за да можеш да ги сверяваш едно към едно.

"Discovered – currently not indexed"

Google знае за страницата ти - открил е адреса ѝ от sitemap или вътрешен линк - но още не е изпратил робот да я обходи. Най-честата причина е, че сайтът ти не е достатъчно авторитетен, за да заслужи ресурс веднага, или ботът е зает с други твои страници. Това е въпрос на приоритет, не на грешка.

Тук влиза и понятието crawl budget - колко страници от сайта ти Google е готов да обходи за определен период. Веднага да уточня, за да не си изкараш грешен извод: при малки сайтове crawl budget рядко е истинският проблем. Това е грижа основно за сайтове с десетки хиляди страници.

Но има един капан, който реално изяжда бюджета и при по-малки магазини: параметризираните URL адреси от филтри (WooCommerce, Magento). Филтрите за цвят, цена и размер генерират хиляди адреси от типа ?filter_color=blue, ботът се върти в безкрайни комбинации и така и не стига до важните ти страници. Управляват се с канонични тагове и внимателна вътрешна архитектура, която не линква към филтрираните адреси.

"Crawled – currently not indexed"

Google е обходил страницата ти, прочел е съдържанието и съзнателно е решил да не я включи в индекса. Това е най-разочароващият статус, защото не е технически - обикновено е въпрос на качество или релевантност. Google е преценил, че страницата не добавя нищо ново спрямо това, което вече има.

Този статус се умножи неслучайно през последните две години. Google систематично вдигна летвата за качество чрез Helpful Content системата си - а тя вече е вградена в основния алгоритъм, не е отделен филтър. Идеята е проста и Google я нарича "people-first content": съдържание, писано преди всичко за хората, а не за да напълни страница с ключови думи. Когато Google види текст, който очевидно е писан "за алгоритъма", той все по-често просто не го индексира.

Тук влиза и E-E-A-T - опит, експертиза, авторитет и надеждност (Experience, Expertise, Authoritativeness, Trustworthiness). Това не е пряк рейтинг фактор с число, а рамката, през която Google преценява дали си струва да покаже страницата ти. Личен опит, ясно авторство, конкретика вместо общи приказки - това са сигналите, които изместват една страница от "currently not indexed" към индекса.

Класическият пример за обратното е продуктова или текстова страница с две изречения описание, копирани от производителя, същите снимки като на още 40 сайта и нула уникална стойност. Google няма причина да покаже точно твоята версия. Решението не е да молиш за повторно индексиране, а да добавиш реална, уникална стойност - съдържание и личен опит, които не съществуват другаде - и едва тогава да информираш Google, че страницата е променена.

"Duplicate, submitted URL not selected as canonical" и "Duplicate without user-selected canonical"

Google е открил две или повече версии на една и съща страница и е избрал да индексира само едната - но не тази, която ти си посочил. Това почти винаги е техническо дублиране, не съдържателно. Страницата съществува, просто Google е консолидирал сигнала към друг неин вариант.

Типичните виновници са познати: адрес със и без наклонена черта накрая (trailing slash), HTTP срещу HTTPS версии без правилно пренасочване, www срещу без-www, и tracking параметри като ?utm_source=. Решението минава през коректни канонични тагове, които посочват кой е официалният URL, и правилни 301 пренасочвания, така че всички варианти да водят към едно място.

"Alternate page with proper canonical tag"

В повечето случаи това изобщо не е проблем. Означава, че страницата има коректно настроен canonical таг, който сочи към друга страница, и Google уважава това указание. Типичен пример са филтрираните страници, които правилно посочват основната категория като каноничен адрес.

Проблем става само ако страница, която искаш да се индексира самостоятелно, по погрешка сочи към друга като canonical. Затова прегледай към кого сочат каноничните тагове на засегнатите страници. Логична връзка (филтър към категория) е наред. Всички продукти, сочещи към началната страница - това е сериозна грешка.

"Blocked by robots.txt"

Сам си казал на Google да не влиза в страницата. Файлът robots.txt блокира обхождането на определени адреси. Понякога това е нарочно и правилно, друг път е грешка, която коства реални пари. Провери го, като отвориш tvoiatdomain.com/robots.txt и потърсиш редове като Disallow: /product/.

Тук има тънкост, която мнозина бъркат: robots.txt блокира обхождането, но не гарантира, че страницата няма да се индексира. Ако към блокиран адрес сочат външни линкове, Google може да го индексира гол - само с URL адреса, без съдържание - и това изглежда зле в резултатите. За да скриеш страница сигурно, се ползва meta noindex, не robots.txt.

"Excluded by 'noindex' tag"

Казал си на Google изрично да не индексира страницата чрез meta noindex таг в самия код. Ако е нарочно - наред е. Ако не е - имаш проблем, и той е изненадващо чест. Два сценария го причиняват почти винаги.

Първият: SEO плъгин с активирана опция да крие категории, тагове или цели типове съдържание от търсачките. Вторият, и по-болезненият: тестова (staging) версия на сайта, настроена с noindex, която после е копирана на живо заедно с тази настройка.

Малка забравена отметка може да скрие целия сайт. Провери изходния код за <meta name="robots" content="noindex"> и настройката "Discourage search engines" в WordPress.

"Soft 404" и "Page with redirect"

При "Soft 404" страницата връща технически статус 200 (всичко е наред), но съдържанието ѝ изглежда празно или като грешка - типично изчерпан продукт без друго съдържание или филтър без резултати. Google я третира като несъществуваща. Решението е тези страници да връщат коректен 404/410 статус или да имат реално съдържание.

При "Page with redirect" Google е открил адрес, който пренасочва другаде, затова не го индексира самостоятелно - което е нормално. Проблем става при стотици такива записи от стари миграции и при верижни пренасочвания (страница А към Б към В), при които Google спира да следи след няколко скока. Прегледай списъка: умишлените 301 пренасочвания към релевантни страници са наред, тези към несъществуващи адреси трябва да се изчистят.

Не, най-вероятно не си наказан - как да провериш

Сега да адресирам страха, който стои зад почти всяко обаждане, дори когато човекът не го казва на глас: "Дали Google не ме е наказал?". Разбирам откъде идва - вложил си труд и пари, не виждаш резултат и умът отива към най-лошия сценарий. Истината е, че ръчните наказания са рядкост и засягат сайтове, които съзнателно са нарушавали правилата. Но има как да провериш за минута, вместо да гадаеш.

Как да проверя дали сайтът ми има наказание от Google?

Влез в Search Console и отвори раздела "Security & Manual actions" → "Manual actions". Ако там пише "No issues detected", сайтът ти няма ръчно наказание - точка. Това покрива страха ти директно и ти спестява безсмислената тревога, че си "баннат".

Ако все пак има наказание, Google ще опише причината и ще ти даде възможност да я отстраниш и да подадеш заявка за преразглеждане (reconsideration request). Но в практиката ми при собственици на малък бизнес, които никога не са купували линкове и не са правили схеми, този раздел почти винаги е чист. Проблемът им не е наказание - а липса на базова оптимизация и авторитет, което е добра новина, защото се решава с работа, а не с молби към Google.

Защо Request Indexing не работи и какво да правиш вместо това

Стигаме до бутона, който всички натискат и почти никой не разбира. Ако досега си прекарвал дни в Search Console, въвеждайки URL след URL и натискайки "Request Indexing", докато Google не те спре с дневния лимит - спри. Не защото е забранено, а защото в повечето случаи това е загуба на твоето време и на ресурса на Google.

Защо бутонът Request Indexing не помага?

Request Indexing казва на Google "моля, погледни тази страница пак". Но ако Google вече я е видял и съзнателно е решил да не я индексира - заради тънко съдържание, дублиране или липса на стойност - повторната молба не променя нищо, защото причината за отказа стои. Все едно молиш някого, който вече ти е отказал, без да си променил нищо у себе си.

Затова редът е обратен на това, което правят повечето хора. Първо отстраняваш причината: ако съдържанието е слабо - подобри го; ако проблемът е технически (дублиране, грешни канонични тагове, блокиране) - оправи го; ако сайтът е нов и без авторитет - работи върху съдържание и вътрешно свързване. И едва тогава ползваш URL Inspection, не за да молиш, а за да информираш Google, че страницата вече е друга. Повече за правилния подход към SEO оптимизацията на сайт - от техническите основи до съдържанието.

При нов сайт, между другото, търпението е част от отговора - първоначалното индексиране отнема от няколко дни до около четири седмици, а пълното покриване на всички страници - седмици до месеци. Това не е наказание, а нормалният ход на нещата.

"Пуснах Google Ads, а органично пак не се вижда нищо"

Този сценарий заслужава отделно място, защото го виждам постоянно и почти никой не го свързва правилно. Бизнесът отказва SEO, защото изглежда бавно, пуска реклама в Google с идеята "така ще стане бързо", плаща за реклама - и пак не разбира защо органично сайтът му е невидим. Тук се крие най-голямото объркване между индексиране, класиране и видимост, затова да го разплета.

Защо Google Ads не решава проблема с органичната видимост

Google Ads и органичното класиране са две напълно отделни системи. Рекламата купува позиция на върха за конкретни ключови думи, докато плащаш - спреш ли, изчезваш. Тя не влияе на това дали и как органичните ти страници са индексирани и класирани. Можеш да харчиш всеки ден и пак да си напълно невидим в органичните резултати.

Тоест Ads не е заместител на индексирането и класирането, а паралелен канал. Ако органично не се виждаш, причината е в сайта и съдържанието ти, и рекламата няма как да я скрие или поправи. В най-лошия случай дори маскира проблема: плащаш за трафик, който при здрав сайт би идвал безплатно.

Индексиран ≠ класиран: канибализация и AI Overviews

Често истинският проблем не е индексирането изобщо, а нещо, което прилича на него. Първият виновник е канибализацията на ключови думи - когато няколко твои страници се борят за една и съща дума и Google не може да реши коя да класира, та накрая не показва нито една ясно.

Страниците са индексирани, но взаимно се обезсилват. Това е напълно отделна тема, която обяснявам в детайли в материала за канибализация на ключови думи, но в контекста на "не се виждам" е сред първите неща, които проверявам.

Вторият съвременен фактор са AI Overviews - обобщенията с изкуствен интелект, които Google показва над органичните резултати. При информационни заявки те често поемат клика, който преди отиваше към твоята индексирана и класирана страница. Тоест си вътре, класираш се, но видимостта ти е изместена нагоре от отговор, генериран от Google. Това вече не е проблем на индексирането - а нова реалност на видимостта, която изисква съдържание, структурирано така, че да бъде цитирано, а не подминато.

Какво да направиш сега

Ако си стигнал дотук, вече имаш реда, по който подхождам аз. Започни с site:domain.com, за да разбереш в коя ситуация си.

Ако те няма изобщо - свържи сайта със Search Console и провери базовата оптимизация. Ако си частично вътре - влез в "Pages" и преведи статусите с декодера отгоре. Ако си напълно индексиран, но без трафик - проблемът ти не е индексиране, а класиране, канибализация или изместване от AI Overviews.

Това, което искам да отнесеш със себе си, е простата истина зад цялата паника: в огромния брой случаи сайтът ти не е счупен и не е наказан. Той просто още не е дал на Google причина да го забележи - защото не е свързан, не е оптимизиран или не носи уникална стойност. И трите се решават с работа, не с натискане на бутони. Започни от първата проверка, движи се по реда, и невидимостта спира да е мистерия.