Robots.txt

В общем, он у меня такой. Что лишнего? что реально стоит добавить? или штатного роботса более чем достаточно?



User-agent: *

Disallow: /images/thumbnails/

Disallow: /addons/

Disallow: /cgi-bin/

Disallow: /controllers/

Disallow: /core/

Disallow: /index.php?dispatch=

Disallow: /js/

Disallow: /lib/

Disallow: /skins/

Disallow: /payments/

Disallow: /schemas/

Disallow: /shippings/

Disallow: /skins/

Disallow: /store_closed.html

Disallow: /var/

Disallow: /404.html

Disallow: /config.php

Disallow: /config.local.php

Disallow: /init.php

Disallow: /prepare.php

Disallow: /store_closed.html

Disallow: /?currency=

Sitemap: http://www. .ru/sitemap.xml



User-agent: Yandex

Disallow: /images/thumbnails/

Disallow: /addons/

Disallow: /cgi-bin/

Disallow: /controllers/

Disallow: /core/

Disallow: /index.php?dispatch=

Disallow: /js/

Disallow: /lib/

Disallow: /skins/

Disallow: /payments/

Disallow: /schemas/

Disallow: /shippings/

Disallow: /skins/

Disallow: /store_closed.html

Disallow: /var/

Disallow: /404.html

Disallow: /config.php

Disallow: /config.local.php

Disallow: /init.php

Disallow: /prepare.php

Disallow: /store_closed.html

Disallow: /?currency=

Host: www. .ru

еще

/?s* - согласен, нужно добавить …



а вот это?

[left][size=4]/?l[color=#1155CC][font=Arial, sans-serif]ayo[/font][/color][color=#1155CC][font=Arial, sans-serif]ut=[/font][/color][/size][/left]

[quote name='ALEXsei_' timestamp='1326323237' post='129231']

В общем, он у меня такой. Что лишнего? что реально стоит добавить? или штатного роботса более чем достаточно?

[/quote]



Да и так весь корень перечислен : )

[color=#282828][font=arial, verdana, tahoma, sans-serif]Disallow: /store_closed.html даже 2 раза.[/font][/color]



А [color=#282828][font=arial, verdana, tahoma, sans-serif]Disallow: /index.php?dispatch= - это только при условии что на сайте ЧПУ? Закрыть дубли?[/font][/color]

[quote name=‘590’ timestamp=‘1326338736’ post=‘129240’]

Да и так весь корень перечислен : )

[color=#282828][font=arial, verdana, tahoma, sans-serif]Disallow: /store_closed.html даже 2 раза.[/font][/color]



А [color=#282828][font=arial, verdana, tahoma, sans-serif]Disallow: /index.php?dispatch= - это только при условии что на сайте ЧПУ? Закрыть дубли?[/font][/color]

[/quote]



Спасибо :) с клозетом :grin: я действительно лоханулся по полной … вот что значит у буржуинов сдувать под копирку …



на сайте естественно чпу … а как без этого? я так понимаю яша очень положительно к этому относится если в адресе находит нужное слово



немного изменил … как тут уже обсуждалось … [color=#000000]/index.php?dispatch= закрывает все, в том числе и тэги и некоторые страницы, хоть и не важные но путь будут … в связи с чем вопрос … данное написание корректно будет? [/color]

[color=#000000]Disallow: /index.php?dispatch=auth* или тут решетка нужна?[/color]



Disallow: /images/thumbnails/

Disallow: /addons/

Disallow: /cgi-bin/

Disallow: /controllers/

Disallow: /core/

Disallow: /index.php?dispatch=auth*

Disallow: /js/

Disallow: /lib/

Disallow: /skins/

Disallow: /payments/

Disallow: /schemas/

Disallow: /shippings/

Disallow: /skins/

Disallow: /store_closed.html

Disallow: /var/

Disallow: /404.html

Disallow: /config.php

Disallow: /config.local.php

Disallow: /init.php

Disallow: /prepare.php

Disallow: /?currency=

Disallow: /?sort_by=

Disallow: /?layout=



посмотрел дубли в гугле и закрытые в яше, теперь так выглядит

[quote]немного изменил … как тут уже обсуждалось … /index.php?dispatch= закрывает все, в том числе и тэги и некоторые страницы, хоть и не важные но путь будут … в связи с чем вопрос … данное написание корректно будет?

Disallow: /index.php?dispatch=auth* или тут решетка нужна?[/quote]



Решетка? Решетка - это же комент.

В итоге запрещено все, что начинается index.php?dispatch=auth


[quote]я так понимаю яша очень положительно к этому относится если в адресе находит нужное слово[/quote]

Есть такое дело…и чем дальше, тем больше.

[quote name=‘ALEXsei_’ timestamp=‘1326345470’ post=‘129244’]

Спасибо :) с клозетом :grin: я действительно лоханулся по полной … вот что значит у буржуинов сдувать под копирку …



на сайте естественно чпу … а как без этого? я так понимаю яша очень положительно к этому относится если в адресе находит нужное слово



немного изменил … как тут уже обсуждалось … [color=#000000]/index.php?dispatch= закрывает все, в том числе и тэги и некоторые страницы, хоть и не важные но путь будут … в связи с чем вопрос … данное написание корректно будет? [/color]

[color=#000000]Disallow: /index.php?dispatch=auth* или тут решетка нужна?[/color]



Disallow: /images/thumbnails/

Disallow: /addons/

Disallow: /cgi-bin/

Disallow: /controllers/

Disallow: /core/

Disallow: /index.php?dispatch=auth*

Disallow: /js/

Disallow: /lib/

Disallow: /skins/

Disallow: /payments/

Disallow: /schemas/

Disallow: /shippings/

Disallow: /skins/

Disallow: /store_closed.html

Disallow: /var/

Disallow: /404.html

Disallow: /config.php

Disallow: /config.local.php

Disallow: /init.php

Disallow: /prepare.php

Disallow: /?currency=

Disallow: /?sort_by=

Disallow: /?layout=



посмотрел дубли в гугле и закрытые в яше, теперь так выглядит

[/quote]



Загрузил в яндекс проверить

/? не действует на него, у меня лично все страницы имеющие проблемы это либо имеют часть кода авторизации или связаны с фильтром на яндексе, смотрю на гугле, там же вот как раз валюты, сортировка, по этому нужно:



[color=#282828][font=arial, verdana, tahoma, sans-serif]Disallow: /?currency=[/font][/color]

[color=#282828][font=arial, verdana, tahoma, sans-serif]Disallow: /?sort_by=[/font][/color]

[color=#282828][font=arial, verdana, tahoma, sans-serif]Disallow: /?layout=[/font][/color]





[color=#282828][font=arial, verdana, tahoma, sans-serif]поставил[/font][/color]





Disallow: /*features_hash=

Disallow: /*currency=

Disallow: /*sort_by=

Disallow: /*layout=

Я долго боролся с дублями для Google. В итоге выяснил, что нужно указывать непосредственно для GoogleBot запрет на дубли страниц. Но все равно до конца на свое кол-во страниц не вышел. Robots.txt такой:


[quote]

User-agent: *



Disallow: /images/thumbnails/

Disallow: /skins/

Disallow: /payments/

Disallow: /store_closed.html

Disallow: /core/

Disallow: /lib/

Disallow: /install/

Disallow: /js/

Disallow: /schemas/

Disallow: /*currency=

Disallow: /*variant_id=

Disallow: /*display=

Disallow: /*page=

Disallow: /*return_url=

Disallow: /*dispatch=

Disallow: /*more_filters=

Disallow: /*features_hash=

Disallow: /*subcats=



User-agent: Googlebot



Disallow: /images/thumbnails/

Disallow: /skins/

Disallow: /payments/

Disallow: /store_closed.html

Disallow: /core/

Disallow: /lib/

Disallow: /install/

Disallow: /js/

Disallow: /schemas/

Disallow: /*currency=

Disallow: /*variant_id=

Disallow: /*display=

Disallow: /*page-

Disallow: /*page=

Disallow: /*return_url=

Disallow: /*dispatch=

Disallow: /*more_filters=

Disallow: /*features_hash=

Disallow: /*subcats=



Sitemap: http://mysite.com/sitemap.xml



User-agent: Yandex



Host: mysite.com

Disallow: /images/thumbnails/

Disallow: /skins/

Disallow: /payments/

Disallow: /store_closed.html

Disallow: /core/

Disallow: /lib/

Disallow: /install/

Disallow: /js/

Disallow: /schemas/

Disallow: /*currency=

Disallow: /*variant_id=

Disallow: /*display=

Disallow: /*page=

Disallow: /*return_url=

Disallow: /*dispatch=

Disallow: /*more_filters=

Disallow: /*features_hash=

Disallow: /subcats=

[/quote]



А что такое "/?s
"

[quote name=‘xeddin’ timestamp=‘1326464124’ post=‘129308’]

Я долго боролся с дублями для Google. В итоге выяснил, что нужно указывать непосредственно для GoogleBot запрет на дубли страниц. Но все равно до конца на свое кол-во страниц не вышел. Robots.txt такой:







А что такое “/?s*”

[/quote]



/? - это ошибка правильно /*

xeddin

z3r0

спасибо !



2 z3r0 есть ли смысл полностью закрывать dispatch ? … там же закрываются как я понял и полезная выдача по тегам.

Если закрывать только авторизацию, эта строчка правильно написана? [color=#282828][font=arial, verdana, tahoma, sans-serif][size=3]Disallow: /index.php?dispatch=auth*[/size][/font][/color]



2 xeddin откуда у тебя [color=#282828][font=arial, verdana, tahoma, sans-serif][size=3]Disallow: /install/ ?[/size][/font][/color]

[quote name=‘ALEXsei_’ timestamp=‘1326506870’ post=‘129349’]

xeddin

z3r0

спасибо !



2 z3r0 есть ли смысл полностью закрывать dispatch ? … там же закрываются как я понял и полезная выдача по тегам.

Если закрывать только авторизацию, эта строчка правильно написана? [color=#282828][font=arial, verdana, tahoma, sans-serif][size=3]Disallow: /index.php?dispatch=auth*[/size][/font][/color]



2 xeddin откуда у тебя [color=#282828][font=arial, verdana, tahoma, sans-serif][size=3]Disallow: /install/ ?[/size][/font][/color]

[/quote]



Dispatch должен жить. Теги святое



Вот так его закрыть нужно



Disallow: /*dispatch=products.search



По авторизации тестил все вроде хорошо блок работает.



Вот это зло нужно удалить, иначе у нас товар на страницах глубже первой не попадает в индекс!



Disallow: /*page-

[quote name='z3r0' timestamp='1326498390' post='129342']

/? - это ошибка правильно /*

[/quote]

а почему- ошибка?

даже с подстановкой символов - * - любое количество символов,

? - один символ.

Даже в этой интерпретации данная строка должна прекрасно работать…

[quote name=‘Alex_VP’ timestamp=‘1326880838’ post=‘129534’]

а почему- ошибка?

даже с подстановкой символов - * - любое количество символов,

? - один символ.

Даже в этой интерпретации данная строка должна прекрасно работать…

[/quote]



если забить строку с данной комбинацию в проверку яндекса, то он никак не отреагирует на “?”. Возможно в гугле по другому … но нас то яндекс больше интересует :) поэтому однозначно “*”. Все правильно z3r0 обратил на это внимание.

[quote name=‘Alex_VP’ timestamp=‘1326880838’ post=‘129534’]

а почему- ошибка?

даже с подстановкой символов - * - любое количество символов,

? - один символ.

Даже в этой интерпретации данная строка должна прекрасно работать…

[/quote]



В правилах яндекса работы с robots.txt даже нет такого спец. символа “?”

[quote name=‘z3r0’ timestamp=‘1326911710’ post=‘129549’]

В правилах яндекса работы с robots.txt даже нет такого спец. символа “?”

[/quote]



Посмотрел щас и в гугуле, там тоже “?” - ничего не значит. еще раз спасибо. так в неведении и жили бы :) а я все думал нафига в вебмастере кнопка “проверить” :grin:

[quote name=‘ALEXsei_’ timestamp=‘1326963514’ post=‘129578’]

Посмотрел щас и в гугуле, там тоже “?” - ничего не значит. еще раз спасибо. так в неведении и жили бы :) а я все думал нафига в вебмастере кнопка “проверить” :grin:

[/quote]



=}}}}}}}}}}}} мы все всегда узнаем что-то новое о том, что видим каждый день ;} Я тут месяц назад узнал о ПОСТАВКАХ, теперь счастливый как хомяк ;}

кстати, а что такое Поставки?

[quote name=‘ALEXsei_’ timestamp=‘1326506870’ post=‘129349’]

2 xeddin откуда у тебя [color=#282828][font=arial, verdana, tahoma, sans-serif][size=3]Disallow: /install/ ?[/size][/font][/color]

[/quote]



или по умолчанию была или сам добавил, не помню точно.


[quote name='ALEXsei_' timestamp='1326506870' post='129349']



Вот это зло нужно удалить, иначе у нас товар на страницах глубже первой не попадает в индекс!



Disallow: /*page-

[/quote]



На каждой такой страничке есть СЕО текст и он дублируется. Например пишем СЕО текст для категории, тогда на каждой страничке этой категории этот текст будет дублироваться и попадать под фильтр и сайт в целом будет выглядеть не очень, т.к. будет низкая индексация.

[quote name='xeddin' timestamp='1327429701' post='129863']

или по умолчанию была или сам добавил, не помню точно.

[/quote]

ясно … у меня эта папка удалена.

кстати, по поводу этого:



Вот это зло нужно удалить, иначе у нас товар на страницах глубже первой не попадает в индекс!



Disallow: /*page-



все странички сайта есть в sitemap.xml, хотя я не помню, актуально ли это для Яндекса.

[quote name='xeddin' timestamp='1327696641' post='130101']

кстати, по поводу этого:



Вот это зло нужно удалить, иначе у нас товар на страницах глубже первой не попадает в индекс!



Disallow: /*page-



все странички сайта есть в sitemap.xml, хотя я не помню, актуально ли это для Яндекса.

[/quote]



А у вас перелистывание как настроено?

У меня стоит сео все отображается вот так http://ekipirovki.net/volleyball/volleyball-balls-page-4.html, без page=