Gå til innhold

Linkedin vil forby selskap å skrape nettsidene deres - men her skraper de selv


Anbefalte innlegg

Videoannonse
Annonse

Rett måte å gjøre det på er å begrense antall søk i minutte eller sekundet

 

Jeg hater det når jeg som bruker treffer slike begrensninger.. Legg inn et maksimum søk i timen istedenfor. Det minsker sjansen for at vanlige brukere skal treffe på begrensningen betydelig, men er like effektivt mot skraping (hvis man velger en tilsvarende verdi).
  • Liker 5
Lenke til kommentar

 

Rett måte å gjøre det på er å begrense antall søk i minutte eller sekundet, og eller legge inn capcha for å gå inn på en profil.

 

det vil jo ikke hindre en robot i å lese gjennom informasjonen..

men det er jo i praksis umulig å hindre en robot å lese og bruke nettsider selv om vi brukte DNA-analyse som passord.. så der nok best å begrense oppdateringsfrekvensen for å spare båndbredde ja..

  • Liker 1
Lenke til kommentar

Det er direkte feil når dere skriver at det er ironisk at at Linkedin driver skraping.

 

"Dersom man klistrer inn en lenke til en nyhetssak eller bloggpost i status-feltet, vil det sosiale mediet automatisk hente inn tittel, ingress og bilde fra lenkedestinasjonen. Deretter presenteres det på sin egen måte i brukerne sin nyhetsstrøm."

 

Faktisk så er det slik ting skal fungere - dette er hele brukerhistorien ved å publisere OpenGraph informasjon, og så lenge digi.no benytter OpenGraph (hvilket dere gjør), så er det denne informasjonen som dere selv gir fra dere.

 

Dette her er ikke snakk om skraping på noen som helst måte i fra digi.no.

 

Når det gjelder Linkedin - så publiserer disse ingen OpenGraph informasjon på den enkelte brukers profilsider. Det står også helt klart i policyen deres (punkt 8.2.j) at data ikke kan automatisk hentes ut. Det er dog ingen ting som sier at ikke data manuelt kan kopieres ut fra profilene...

 

Vi forventer bedre etterrettelighet av digi.no. Ikke glem at det er kvaliteten på gratisartiklene som gjør om vi som brukere ønsker å tegne oss for 1 690,- pr år for "Digi Ekstra".

 

Les mer om OpenGraph på http://ogp.me/

  • Liker 9
Lenke til kommentar

Det er direkte feil når dere skriver at det er ironisk at at Linkedin driver skraping.

 

"Dersom man klistrer inn en lenke til en nyhetssak eller bloggpost i status-feltet, vil det sosiale mediet automatisk hente inn tittel, ingress og bilde fra lenkedestinasjonen. Deretter presenteres det på sin egen måte i brukerne sin nyhetsstrøm."

 

Faktisk så er det slik ting skal fungere - dette er hele brukerhistorien ved å publisere OpenGraph informasjon, og så lenge digi.no benytter OpenGraph (hvilket dere gjør), så er det denne informasjonen som dere selv gir fra dere.

 

Dette her er ikke snakk om skraping på noen som helst måte i fra digi.no.

 

Når det gjelder Linkedin - så publiserer disse ingen OpenGraph informasjon på den enkelte brukers profilsider. Det står også helt klart i policyen deres (punkt 8.2.j) at data ikke kan automatisk hentes ut. Det er dog ingen ting som sier at ikke data manuelt kan kopieres ut fra profilene...

 

Vi forventer bedre etterrettelighet av digi.no. Ikke glem at det er kvaliteten på gratisartiklene som gjør om vi som brukere ønsker å tegne oss for 1 690,- pr år for "Digi Ekstra".

 

Les mer om OpenGraph på http://ogp.me/

 

 

Et format gir deg aldri noen automatisk rett til noe spesifikt kontra andre formater, hverken juridisk eller teknisk. Det har rett og slett ingen betydning.

 

 

Forøvrig driver Linkedin med sperrer på ip-adresser og rate-limiting allerede.

Hilsen Linkedin-skraper :)

  • Liker 2
Lenke til kommentar

Et format gir deg aldri noen automatisk rett til noe spesifikt kontra andre formater, hverken juridisk eller teknisk. Det har rett og slett ingen betydning.

 

TU Media (som eier Digi.no) ønsker at en forhåndsvisning av artiklene deres skal vises på eksterne sider i et gitt format. De har derfor valgt å presentere meta-data i OpenGraph-formatet. Dermed er de sikret at nevnte forhåndsvisning vises korrekt; med riktige bilder og tekster. 

 

Hvis man velger å publisere OpenGraph-metadata på artiklene sine, kan man ikke i etterkant klage på at disse blir brukt. Det er på ingen måte ironisk at LinkedIn velger å vise forhåndsvisningen i tråd med TU Media sin ønsker.

 

Tvert imot! Det hadde vært ironisk om LinkedIn boikottet TU Media sitt ønske, og altså presenterte Digis artikler på et helt annet format! Da kunne journalisten gjerne ha brukt tidligere tittel, ingress og bildetekst! Men LinkedIn bruker artiklene fra Digi på eksakt den måte TU Media ønsker – og dermed faller hele avsnittet om 'ironisk skraping' bort.

 

 

PS: Det ser ut til at journalisten i etterkant har forstått dette selv. Tittel og innfallsvinkel på artikkelen har blitt dramatisk endret ... ;-)

Lenke til kommentar

 

Et format gir deg aldri noen automatisk rett til noe spesifikt kontra andre formater, hverken juridisk eller teknisk. Det har rett og slett ingen betydning.

 

TU Media (som eier Digi.no) ønsker at en forhåndsvisning av artiklene deres skal vises på eksterne sider i et gitt format. De har derfor valgt å presentere meta-data i OpenGraph-formatet. Dermed er de sikret at nevnte forhåndsvisning vises korrekt; med riktige bilder og tekster. 

 

Hvis man velger å publisere OpenGraph-metadata på artiklene sine, kan man ikke i etterkant klage på at disse blir brukt. Det er på ingen måte ironisk at LinkedIn velger å vise forhåndsvisningen i tråd med TU Media sin ønsker.

 

Tvert imot! Det hadde vært ironisk om LinkedIn boikottet TU Media sitt ønske, og altså presenterte Digis artikler på et helt annet format! Da kunne journalisten gjerne ha brukt tidligere tittel, ingress og bildetekst! Men LinkedIn bruker artiklene fra Digi på eksakt den måte TU Media ønsker – og dermed faller hele avsnittet om 'ironisk skraping' bort.

 

 

PS: Det ser ut til at journalisten i etterkant har forstått dette selv. Tittel og innfallsvinkel på artikkelen har blitt dramatisk endret ... ;-)

 

 

 

 

Her tar du 100% feil. Å publisere noe i et spesifikt format vil aldri gi deg noe mer eller mindre rett til noe enn dersom du hadde publisert det i et annet format. Dersom dette fortsatt ikke er forståelig anbefaler jeg deg å sette deg inn i lovverket.

Eneste unntaket er hvis det finnes en sperre i formatet, feks kryptering.

 

Siteringsretten gjelder derimot for alle, så det Linkedin gjør skulle jeg tro er tillatt uansett hvilket format Digi publiserte artiklene sine i.

Sitering != skraping

Lenke til kommentar

Her tar du 100% feil. Å publisere noe i et spesifikt format vil aldri gi deg noe mer eller mindre rett til noe enn dersom du hadde publisert det i et annet format. Dersom dette fortsatt ikke er forståelig anbefaler jeg deg å sette deg inn i lovverket.

Eneste unntaket er hvis det finnes en sperre i formatet, feks kryptering.

 

Siteringsretten gjelder derimot for alle, så det Linkedin gjør skulle jeg tro er tillatt uansett hvilket format Digi publiserte artiklene sine i.

Sitering != skraping

 

Formatet 'Open Graph' omhandler jo nettopp sitering! Det trodde jeg var innlysende, men ser i etterkant at det muligens kan misforståes. Beklager det! 

 

Uansett; for å lage sitatet, må man kontakte webserveren og be om kopi av artikkelen (også omtalt som skraping).

 

Formatet sørger for at artikkelen vises etter opphavspersonens ønske. Uten et slikt format ville ikke TU Media kunne påvirke hvordan siteringen ville blitt gjort. Derfor er det lurt av TU Media å bruke formatet. Det er dog verdt å nevne at det (selvfølgelig) følger en linsens til dette formatet. Man bør ikke ta i bruk Open Graph uten å ha satt seg inn i lisensen. Er derfor ikke enig i din påstand om «100% feil» ang. tolkning av lovverk.

 

 

 

 

Her har jeg feilaktig satt likhetstegn mellom skraping og uthenting av data via OpenGraph, som flere nevner. 

 

Den store forskjellen er selvsagt at Linkedin ikke ønsker uthenting, mens vi gjør det. Artikkelen er justert deretter.

 

Flott! Til forskjell fra andre mediehus opplever jeg at TU Media er meget flinke til å lese kommentarer, og å oppdatere artikkelen dersom det trengs! Dette viser at dere tar brukerne på alvor. Egentlig en god nok grunn til å betale for medlemsskap, spør du meg. Fortsett med dette! :-)

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
×
×
  • Opprett ny...