Harald Brombach (digi.no) Skrevet 29. juli 2019 Del Skrevet 29. juli 2019 Robots.txt er 25 år. Ble framprovosert fram av en science fiction-forfatter Lenke til kommentar
Gavekort Skrevet 29. juli 2019 Del Skrevet 29. juli 2019 Det er en vandrehistorie på det universitetet jeg gikk på som var at en professor hadde satt opp en liten webserver med noen fancy rekursive lenker og i etterkant trigget en ung, mindre bugfri Google webcrawler til å gå beserk og i praksis gjøre et Denial of Service angrep som tok ned nettverket på hele campuset. Vet ikke hva moralen i denne historien er. Noen ganger er det greit å kunne bortvise botter? Lenke til kommentar
007CD Skrevet 29. juli 2019 Del Skrevet 29. juli 2019 Det er en vandrehistorie på det universitetet jeg gikk på som var at en professor hadde satt opp en liten webserver med noen fancy rekursive lenker og i etterkant trigget en ung, mindre bugfri Google webcrawler til å gå beserk og i praksis gjøre et Denial of Service angrep som tok ned nettverket på hele campuset. Vet ikke hva moralen i denne historien er. Noen ganger er det greit å kunne bortvise botter? Er jo bare kos å bli DDoSet av Google da! De må jo også få lov til å være med på DDoS festen! Men men, de botene som har andre hensikter ignorerer Robots.txt Så har du dem som dukker opp i søketreffene med teksten "Sperret av robots.txt" eller noe ala den... 1 Lenke til kommentar
vidor Skrevet 29. juli 2019 Del Skrevet 29. juli 2019 Robotene har nok blitt litt smartere på 25 år. Administrerte en kommerisell webside og brukte GoggleAds og Webadministrator tool hvor jeg kunne regulere hvor mye Google skulle crawle, og den justerte jeg opp til max, og det var egentlig fremdeles for lite for at Google skulle være godt oppdatert på forumet. Nyhetssakene var sånn høvelig greit crawlet. Lenke til kommentar
mandela Skrevet 31. juli 2019 Del Skrevet 31. juli 2019 Verdt å merke seg er at robots.txt ikke fjerner sider fra søket; "To properly prevent your URL from appearing in Google Search results, you should password-protect the files on your server or use the noindex meta tag or response header (or remove the page entirely)." https://support.google.com/webmasters/answer/6062608 Lenke til kommentar
Anbefalte innlegg
Opprett en konto eller logg inn for å kommentere
Du må være et medlem for å kunne skrive en kommentar
Opprett konto
Det er enkelt å melde seg inn for å starte en ny konto!
Start en kontoLogg inn
Har du allerede en konto? Logg inn her.
Logg inn nå