Wie man in Matt Cutts Blog und im SEOmoz Blog nachlesen kann, sollte man Webseiten nicht mit .0 oder .exe enden lassen, da diese dann nicht indiziert werden.
SEOmoz hat dies an Hand einiger Beispiele dargelegt und gezeigt, dass diese Seiten zwar bei Yahoo aber nicht bei Google indiziert wurden. Der Trust einer Domain (bsp. durpal.org oder Wikipedia.org) spielt hier keine Rolle da selbst dort entsprechende Artikel / Unterseiten nicht indiziert wurden. Unterseiten die mit .1 (oder anderen Zahlen) enden, werden laut diesem Experiment indiziert.
Folglich macht es Sinn Unterverzeichnisse die den Namen Web2.0 tragen nicht Web2.0 sondern Web2-0 oder Web20 zu benennen um eine Indizierung dieser Verzeichnisse zu ermöglichen.
Matt Cutts schreibt dazu:
Even though urls ending in “.0″ are often binary and therefore end up getting dropped later in our indexing pipeline (…) in the last day or so, we switched it so that Google is willing to crawl pages that end in in “.0″.
Mittlerweile ist also alles wieder gut nachdem Google manuell eingegriffen hat. Unterseiten die auf .tar, .exe, .dll oder .bin enden werden aber nachwievor nicht indiziert. Bei “normalen” Seiten spielt es hinsichtlich der Indizierung keine Rolle ob sie auf .htm, .php, .asp oder .html enden. Sie werden alle gleichermaßen indiziert.