Robots.txt

точно, протупил. page- нужно убрать из robots.txt.

Какой все-таки оптимальный вариант robots?

Кто-то может выложить?

Спасибо

У меня щас сам блок такой, если кто заметил ошибки или есть дополнения, сообщите. спасибо.





Disallow: /images/thumbnails/

Disallow: /addons/

Disallow: /cgi-bin/

Disallow: /controllers/

Disallow: /core/

Disallow: /index.php?dispatch=auth

Disallow: /js/

Disallow: /lib/

Disallow: /skins/

Disallow: /payments/

Disallow: /schemas/

Disallow: /shippings/

Disallow: /skins/

Disallow: /store_closed.html

Disallow: /var/

Disallow: /config.php

Disallow: /config.local.php

Disallow: /init.php

Disallow: /php.ini

Disallow: /prepare.php

Disallow: /*sl=

Disallow: /*currency=

Disallow: /*sort_by=

Disallow: /*layout=

Надо добавить



Disallow: /*page=

Подниму тему, но уже с прицелом на 4.x.x … вот примерно так получилось у меня… понятно дело, что еще прописано отдельно для яндекса гугла, указано главное зеркало и карта. Что лишнего или наоборот не хватает?



User-agent: *

Allow: /images/

Disallow: /images/thumbnails/

Disallow: /cgi-bin/

Disallow: /app/

Disallow: /design/

Disallow: /js/

Disallow: /var/

Disallow: /store_closed.html

Disallow: /404.html

Disallow: /init.php

Disallow: /php.ini

Disallow: /prepare.php

Disallow: /sendmail/

Disallow: /*sl=

Disallow: /*currency=

Disallow: /*sort_by=

Disallow: /*layout=

Disallow: /*variant_id=

Disallow: /*display=

Disallow: /*page=

Disallow: */page

Disallow: /*return_url=

Disallow: /*more_filters=

Disallow: /*features_hash=

Disallow: /subcats=

Disallow: /
?sef_rewrite=

Disallow: /tags.summary

Disallow: /wishlist.view

Disallow: /login?

Disallow: /profiles-update

Disallow: /index.php?dispatch=products.quick_view

Disallow: /index.php?dispatch=auth.recover_password

Disallow: /index.php?dispatch=events.search

Disallow: /index.php?dispatch=auth.login_form

Disallow: /index.php?dispatch=gift_certificates.add

Disallow: /index.php?dispatch=news.list

Disallow: /index.php?dispatch=orders.search

Disallow: /index.php?dispatch=profiles.update

Disallow: /index.php?dispatch=profiles.add

Disallow: /index.php?dispatch=checkout.cart

#Disallow: /index.php?

[quote name='ALEXsei_' timestamp='1392677664' post='177695']

прописано отдельно для яндекса гугла

[/quote]

Разве отдельно?


[quote name='ALEXsei_' timestamp='1392677664' post='177695']

User-agent: *

[/quote]

[quote name=‘vkapas’ timestamp=‘1392709436’ post=‘177724’]

Разве отдельно?

[/quote]

пропущено слово “еще” :) не, ну конечно можно продублировать

[quote name=‘ALEXsei_’ timestamp=‘1392712441’ post=‘177725’]

пропущено слово “еще” :) не, ну конечно можно продублировать

[/quote]

Так поделились бы и этими правилами тоже :-). Или специфическими для этих ПС правилами. Думаю многим будет интересно узнать.



Кстати, ни у кого не было проблемы с Google Merchant при использовании директивы Disallow?



В моём случае Google Merchant отклонял около 50% товаров, говорил “проверьте правила индексации сайта”. На тот момент robots.txt был настроен сеошниками. Я пробовал разные варианты, включая возврат стандартного robots, но проблема решилась только тогда, когда я привёл правило для Гугла к виду

User-agent: Googlebot<br /> Allow: /index.php?dispatch=xmlsitemap.view<br /> Disallow:<br /> Host: site.ru<br /> Sitemap: http://site.ru/index.php?dispatch=xmlsitemap.view

Что, конечно, не слишком-то хорошо для поисковой выдачи. Кто-нибудь решал подобную проблему?

[quote name=‘vkapas’ timestamp=‘1392721593’ post=‘177731’]

Так поделились бы и этими правилами тоже :-). Или специфическими для этих ПС правилами. Думаю многим будет интересно узнать.



[/quote]



они точно такие же …

I really think this thread would be helpful to others if it was also in English. Is there anyway this can be translated?



Thanks.

[quote name='infogirl' timestamp='1396540666' post='180900']

I really think this thread would be helpful to others if it was also in English. Is there anyway this can be translated?



Thanks.

[/quote]



Dear infogirl,

Please let us know the matters you are interested in. It is rather difficult to translate the whole forum thread but we can help you in translating of the necessary points. You can also use Google Translate.

Подскажите, а что делать в плане оптимизации/настройки robots.txt под 2 домена сайтов на одном движке Cs-Cart Ultimate (2 магазина)?

с мета-тегами ПС webmaster решено движком (в шаблоне)

с sitemap.xml так же решено движком

а с robots.txt?

для SEO это же не годится, когда по запросу domain.com.ua и domain2.com.ua будет один и тот же robots.txt

[quote name='Vanger' timestamp='1414582290' post='195585']

для SEO это же не годится, когда по запросу domain.com.ua и domain2.com.ua будет один и тот же robots.txt

[/quote]



Почему?

[quote name='dbazhenov' timestamp='1414586961' post='195593']

Почему?

[/quote]



там могут быть разные параметры … например host или путь к карте сайта

robots же тоже можно динамически отдавать, точно также как например та же самая xml карта сайта фрмируется динамически

ни че не понимаю :) обновился до 4.2.4 роботс по умолчанию там пустой … полезло куча мусора: фильтры, авторизации и т п. мусор содержит [font=“Arial, Helvetica, sans-serif”][color="#1a3dc1"][size=3]мета-тег noind[/size][/color][/font][font=“Arial, Helvetica, sans-serif”][color="#1a3dc1"][size=3]ex . [/size][/color][/font]Но? робот же все равно сканирует и грузит страницы?



опять актуально стало написание robots.txt … что добавить? что убавить?



User-agent: *

Disallow: /app/

Disallow: /store_closed.html

Disallow: */?subcats=

Disallow: */?features_hash=

Disallow: */?return_url=

[quote name=‘ALEXsei_’ timestamp=‘1418773895’ post=‘199997’]

ни че не понимаю :) обновился до 4.2.4 роботс по умолчанию там пустой … полезло куча мусора: фильтры, авторизации и т п. мусор содержит [color=#1a3dc1]мета-тег noind[/color][color=#1a3dc1]ex . [/color]Но? робот же все равно сканирует и грузит страницы?

[/quote]



Ничего он не грузит, почитайте здесь. У нас не было случая, когда страницы с тегом noindex попадали в поиск. https://support.google.com/webmasters/answer/93710?hl=ru



C уважением, Alt-team.

[quote name=‘Alt-team’ timestamp=‘1418803604’ post=‘200020’]

Ничего он не грузит, почитайте здесь. У нас не было случая, когда страницы с тегом noindex попадали в поиск. https://support.goog…wer/93710?hl=ru



C уважением, Alt-team.

[/quote]

Спасибо. Но Гугл он то умный, а Яндекс пишет “Загружено страниц”

На одном сайте у меня была беда с индексацией мусора, вылечил вот этим:

<br /> User-agent: Yandex<br /> Disallow:<br /> Clean-param: subcats&features_hash&currency /*



Сегодня сделал это:


<br /> User-agent: Yandex<br /> Disallow: /*/page-*/



При этом у меня есть карта сайта, + выдается все через плагин “Alt-team: Easy scroll pagination”, т.е. все на одной странице.



Причина - периодически проседают запросы, когда Яндекс считает что page-N стала главной.

Буду благодана за помощь чайнику



Мой robots.txt выгляит пока так:

User-agent: *

Disallow: /app/

Disallow: /store_closed.html



Вопрс:

Что я должна написать, чтобы скрыть список продавцов (МультиВендор) http://my-site.ru/index.php?dispatch=companies.catalog и страницу с данными каждого продавца http://my-site/company-name/



Заранее спасибо!