Geir Willy Haugen Skrevet 2. april 2002 Del Skrevet 2. april 2002 Hva er disse robots.txt filene som ligger rundt forbi på diverse nettsteder? En av de jeg så inneholdt: User-agent: * Disallow: / Lenke til kommentar
BBC Skrevet 2. april 2002 Del Skrevet 2. april 2002 Har ikke hørt om det/tenkt over det før, men ett lite søk på Google avslører at robots.txt forteller søkeroboter på Internett om å ikke indexere siden. Det er isåfall opp til søkeroboten å følge reglene i robots.txt. Lenke til kommentar
Geir Willy Haugen Skrevet 2. april 2002 Forfatter Del Skrevet 2. april 2002 OK, ser ikke helt grunnen til å hindre noen å indeksere siden deres, men de har vell sine grunner.. :smile: Takk for svaret! Lenke til kommentar
Razul Skrevet 3. april 2002 Del Skrevet 3. april 2002 Det er faktisk veldig praktisk å hindre søkeverktøy i å ikke indeksere sider. Dersom du for eksempel har et frameset med mange undersider, kan det jo hende at du ikke vil at alle disse sidene skal indekseres. Det kan også være at du legger ut testsider, eller annet som ikke alle uten videre skal kunne komme fram til. Praktisk hvis man driver å utvikler et nettsted for eksempel. Slipper at alle mulige folk roter seg innpå før det er klart. Lenke til kommentar
El Viking Skrevet 5. april 2002 Del Skrevet 5. april 2002 Robots.txt er en fil for ethvert domene/webside som forteller søkemotorene (egentlig søkemotorenes 'spiders') om hva som finnes på denne siden. Du kan fylle den opp med det som beskriver ditt domene (i keywords) eller rett og slett nekte adgang (til visse deler av eller hele domenet). På denne måten slipper ditt domene (og en milliard andre domener) masse unødig trafikk. Noen av disse spiderne kan være ganske agressive og frekvente. Lenke til kommentar
Anbefalte innlegg
Opprett en konto eller logg inn for å kommentere
Du må være et medlem for å kunne skrive en kommentar
Opprett konto
Det er enkelt å melde seg inn for å starte en ny konto!
Start en kontoLogg inn
Har du allerede en konto? Logg inn her.
Logg inn nå