Пока поисковая система не проиндексирует страницу сайта [что такое индексация], та не будет участвовать в её результатах выдачи. Узнать о сайте поисковик может двумя способами:
- от вебмастера. Для чего URL-адрес веб-документа [что такое URL] нужно добавить в аддурилку Яндекса или Google (от английского add url).
- перейдя на страницы сайта по ссылке с других проиндексированных веб-документов.
На данном блоге я столкнулась с такой ситуацией, что без проблем Яндекс проиндексировал только Главную страницу, а вот внутренние не участвовали в поиске. У Google похожего невнимания не наблюдалось. Там практически молниеносно можно было заметить свою статью в выдаче.
Почему не индексируется сайт в Яндексе
- Google заносит в свою базу данных все страницы сайта: качественные и некачественные без разбора. Но участвуют в ранжировании [что такое ранжирование] только полезные веб-документы [не путать оригинальное содержание с уникальным]. Яндекс же сразу не включает веб-хлам. Можно заставить его проиндексировать любую страницу, но со временем поисковик удалит мусор. У обоих систем есть дополнительный индекс. У обоих систем низкокачественные страницы влияют на рейтинг сайта в целом. По последнему пункту есть как официальное заявление [см. блог Google], так и простая логика. Любимые сайты конкретного человека будут на более высоких позициях в его выдаче. Зато этот же человек с трудом найдёт сайт, который не смог его заинтересовать в прошлый раз. Поэтому вначале нужно закрыть от индексации дубликаты веб-документов [как это сделать], проверить есть ли страницы с отсутствующем содержанием и не пускать в выдачу никудышный контент.
- "Проверить URL" в Вебмастере.Яндекса напомнит, что документ закрыт для индексации или что сервер выдаёт 301 редирект или 404 ошибку.
- Если был приобретён поддержанный домен, на который наложены санкции, то нужно написать в службу поддержки что-то типа
Здравствуйте. 01.01.2000 года был приобретён домен сайт.ru. 20.01.2000 года сайт был добавлен в Вебмастер и аддурилку. По прошествии трёх недель он не был проиндексирован. Подскажите, пожалуйста, может ли домен быть причиной плохой индексации?
Как ускорить индексацию в Яндексе
- Подтвердить права на управление сайтом в Яндекс.Вебмастере.
- Опубликовать ссылку на статью в twitter. С 2012 года у Яндекса с ним подписан договор.
- Установить на компьютер Яндекс.Браузер и "походить" по страницам сайта с его помощью.
- Добавить поиск для сайта от Yandex. Там в графе "Индексирование" можно указать свои URL-адреса вручную точно также как в аддурилке. [не актуально]
- Установить код Яндекс.Метрики без указания галочки "Запрет отправки страниц на индексацию".
- Создать файл Sitemap. Тогда по приходу на сайт робот в первую очередь будет проверять его. Этот файл существует только для него и не виден аудитории. Состоит он из списка URL-адресов страниц. Только что созданные или с обновлённым содержимым находятся сверху. Адрес Sitemap прописывается в robots.txt или в соответствующую форму в Вебмастере-"Настройка индексирования"-"Файлы Sitemap".
Дополнительные действия, когда Яндекс проиндексировал только 1 страницу
- Насколько часто обновляется страница, настолько часто поисковый робот будет её переиндексировать. В основном содержание периодически меняется на странице "карта сайта" и Главная. Чем чаще публиковать новые статьи, тем чаще будут обновляться вышеназванные страницы и по ссылкам внутри них индексироваться новый материал.
- Если на всех страницах сделать сквозной блок с последними написанными публикациями, то поисковый робот может перейти на новую запись с любой посещённой им страницы сайта. А это будет быстрее. Ссылки в сквозном блоке не должны быть реализованы скриптом, по ним не нужно запрещать переход с помощью rel="nofollow".
- Сайты, имеющие RSS ленту, могут зарегистрироваться в каталоге Яндекс.блоги, а уже оттуда данные будут переданы основному роботу.
- Оставить ссылки на свои статьи на часто обновляемых ресурсах: "Живой Журнал", ВКонтакте", "Facebook" и др.
Обновление базы данных - апдейт (ап) выдачи - происходит в среднем раз в неделю. Если все вышеуказанные действия не помогли, чего у меня ни разу не было, то следует написать в службу поддержки письмо, где рассказать что было сделано, немного о сайте, о том, что он регулярно наполняется, что людям он интересен, дать пару ссылок на самые лучшие статьи в качестве примера. Если ресурс имеет низкую посещаемость по причине узкотематичности, нужно проговорить это. Например, сказать, что проект не планирует большую посещаемость, так как создан для общества лепидоптерологов, которые изучают бабочек семейства чешуекрылых. Если сайт коммерческий, то сообщите, что за ним стоит реальная организация.
Что нужно сделать пока веб-страница не проиндексирована Яндексом
- Чтобы отечественный поисковик считал сайт первоисточником, ещё до публикации статьи нужно обязательно её содержание добавить в форму "Оригинальных текстов". Иначе плагиаторы могут скопировать запись к себе на ресурс и именно они, если первыми попадут в базу данных, будут признаны авторами.
Индексация Google
Вот и всё, что нужно сделать для быстрой индексации Яндексом. Для Google подойдут те же рекомендации, только сервисы будут другими:
- Google Инструменты для веб-мастеров - «Сканирование» - «Посмотреть как Googlebot» - кнопка «Сканировать» - кнопка «Добавить в индекс»
- Google+ (вместо twitter)
- Google Chrome
- Поиск внутри сайта от Гугла
- Google Analytics (вместо Яндекс.Метрики)
51 комментарий:
В целом же, чтобы предоставить развёрнутый ответ, чтобы у пользователя не было желания его искать на другом ресурсе, нужно довольно большое количество символов. Многое зависит от запроса (например, те же фотогалереи прекрасно живут без объемного текста), ориентируйтесь на конкурентов.
Поисковики не любят плагиат. Например, эта статья - http://prostoinvestor.blogspot.com/2011/08/vlojit-dengi-pod-procenti.html есть здесь - http://www.postroim.com/news_restr/text.asp?NewsId=36753 слово в слово.
Но дело в том, что как только я это сделала, меня на следующий день проиндексировал Яндекс (я ждала этого около 3 недель). И захватил именно страницы из ярлыков 7шт. и больше никакие. Что делать? Снять запрет или ждать пока он меня снова посетит и проиндексирует то, что нужно? И на сколько актуален запрет индексации ярлыков и архива? Может у вас есть на эту тему статья?
Да, для сайта нужно убирать весь дублирующий контент подробнее тут. Это очень важно для продвижения.
Проблема была решена? а если решена, то через какое время после начала активных действий?
Скажем, если прогнать мой сайт, то плачевного результата скорее всего не будет. Так как есть трафик, есть естественные ссылки, есть положительная история.
Поисковик сравнивает. На одной чаше спам, на другой положительные характеристики. В вашем случае спам перевесил.
В анонсе твитера, ВКонтакте и т.п. берётся пару строк. Они безобидны. Тем более поисковик видит, что это соц. сеть.
Я поэтому сейчас активизировал усилия в направлении блогспота, как хорошей альтернативы.
Файл robots.txt не будет учтён роботом Яндекса, т.к. при запросе выполняется перенаправление.
Время ответа сервера: 180мс
IP сайта: 173.194.71.132
Кодировка: UTF-8
Размер страницы: 0Кб
Заголовки:
Location: http://nechipuruk.blogspot.ru/
Content-Length: 0
Или пусть главным зеркалом в Яндексе будет .ru
Или замучаешься склеивать. У автора http://blogger.omg-linux.ru/ удалось, но даже он говорит, что это того не стоит. Попробуйте к нему обратиться.
Я просто не могу разобраться, куда конкретно нужно вставить этот файл.
Яндекс вообще не индексировал мой блог, а ему уже год..
Там (в вебмастере) есть возможность выбирать подтверждение мета-тегом. Его (мата-тег) внесите в шаблон в секцию <head>
Посмотрите скриншот http://shpargalkablog.ru/2011/03/webmaster-yandex.html (он старый, но, думаю, суть раскрывает).
Проиндексировать в любом случае должен, если нет технических ошибок.
Не думаю, что до этого домен был использован. По крайней мере, информации я не нашла
Один раз видела как заблокировали сайт за чат (см. "Общение и отзывы").
В robots.txt не верно указан Sitemap (www, а у вас ww), лучше его совсем убрать.
Что написано в Вебмастере?
За 7 лет на www.vozhdi.ru размещено 250 статей.
Что же мы видим в июне 2015 в webmaster.yandex.ru:
— загружено роботом — 445, причем только из папок 2011—2014 г.г. (откуда столько много, если страниц всего 250? Нет ответа. Расшифровка по url не раскрывается);
— страниц в поиске — 70 (за 7 лет остальные 180 страниц не нашлись);
— из 32 статей 2015 года проиндексировано 4.
На вопрос в июне 2015 в Yandex.Search support: "Что ж у вас так печально всё с индексацией?"
Платон Щукин пишет: "Приведённые Вами страницы сайта известны нашему роботу, по мере обхода сайта они постепенно будут индексироваться и смогут появиться в поисковой выдаче. Но хочу заметить, что процесс индексирования сайтов организован таким образом, чтобы роботы могли скачать максимально возможное количество страниц, не перегружая при этом сервер. Если на одном IP—адресе расположено большое количество сайтов, робот просто не сможет скачать все страницы, обход которых он запланировал, так как это может привести к перегрузке севера или блокировке робота.
Ваш сайт расположен как раз на одном из таких IP адресов: помимо www.vozhdi.ru , там находится еще несколько сотен других сайтов, в связи с этим на индексирование страниц сайта может уйти гораздо больше времени, чем обычно. Указать какие—то конкретные сроки индексирования страниц в подобных случаях, у нас, к сожалению, нет возможности. Наши рекомендации о том, как помочь роботу быстрее индексировать сайт...". Дальше, уверен, вы уже не один раз читали.
Таким образом, можно сделать выводы:
1. прикрепляй, не прикрепляй домен к блогу на www.blogger.com — помимо него на одном IP—адресе будет "находиться еще несколько сотен других сайтов, в связи с этим на индексирование страниц сайта Яндексом может уйти гораздо больше времени, чем обычно", — вплоть до бесконечности;
2. если хотите, чтобы Ваше поздравление с Наступающим Новым 2022 годом появилось в поиске Яндекса — сейчас самое время заняться его написанием и размещением. Однако "указать какие—то конкретные сроки индексирования" страницы "С Новым 2022 годом!" у Яндекса, "к сожалению, нет возможности" )))
Кстати, постарайтесь не размещать фото с обнажёнными людьми или намёком на интим - заблокируют Адсенс.