Linkedin vil forby selskap å skrape nettsidene deres - men her skraper de selv

Erlend Tangeraas Lygre · 1. august 2017

Lener seg på gammelt amerikansk lovverk.

Linkedin vil forby selskap å skrape nettsidene deres - men her skraper de selv

Eplekatt · 1. august 2017

Rett måte å gjøre det på er å begrense antall søk i minutte eller sekundet, og eller legge inn capcha for å gå inn på en profil.

Emancipate · 1. august 2017

Rett måte å gjøre det på er å begrense antall søk i minutte eller sekundet

Jeg hater det når jeg som bruker treffer slike begrensninger.. Legg inn et maksimum søk i timen istedenfor. Det minsker sjansen for at vanlige brukere skal treffe på begrensningen betydelig, men er like effektivt mot skraping (hvis man velger en tilsvarende verdi).

Superprofessor X · 1. august 2017

Rett måte å gjøre det på er å begrense antall søk i minutte eller sekundet, og eller legge inn capcha for å gå inn på en profil.

det vil jo ikke hindre en robot i å lese gjennom informasjonen..

Superprofessor X · 1. august 2017

Rett måte å gjøre det på er å begrense antall søk i minutte eller sekundet, og eller legge inn capcha for å gå inn på en profil.

det vil jo ikke hindre en robot i å lese gjennom informasjonen..

men det er jo i praksis umulig å hindre en robot å lese og bruke nettsider selv om vi brukte DNA-analyse som passord.. så der nok best å begrense oppdateringsfrekvensen for å spare båndbredde ja..

*F* · 1. august 2017

Man kan ved skraping sende capcha bilder til bedrifter i lavkostlavd som jobber med å tolke capcha og returnere svaret. Dette for en ganske rimelig pris

Gnarfer · 1. august 2017

Det er direkte feil når dere skriver at det er ironisk at at Linkedin driver skraping.

"Dersom man klistrer inn en lenke til en nyhetssak eller bloggpost i status-feltet, vil det sosiale mediet automatisk hente inn tittel, ingress og bilde fra lenkedestinasjonen. Deretter presenteres det på sin egen måte i brukerne sin nyhetsstrøm."

Faktisk så er det slik ting skal fungere - dette er hele brukerhistorien ved å publisere OpenGraph informasjon, og så lenge digi.no benytter OpenGraph (hvilket dere gjør), så er det denne informasjonen som dere selv gir fra dere.

Dette her er ikke snakk om skraping på noen som helst måte i fra digi.no.

Når det gjelder Linkedin - så publiserer disse ingen OpenGraph informasjon på den enkelte brukers profilsider. Det står også helt klart i policyen deres (punkt 8.2.j) at data ikke kan automatisk hentes ut. Det er dog ingen ting som sier at ikke data manuelt kan kopieres ut fra profilene...

Vi forventer bedre etterrettelighet av digi.no. Ikke glem at det er kvaliteten på gratisartiklene som gjør om vi som brukere ønsker å tegne oss for 1 690,- pr år for "Digi Ekstra".

Les mer om OpenGraph på http://ogp.me/

Visningsnavn123 · 1. august 2017

Det er direkte feil når dere skriver at det er ironisk at at Linkedin driver skraping.

"Dersom man klistrer inn en lenke til en nyhetssak eller bloggpost i status-feltet, vil det sosiale mediet automatisk hente inn tittel, ingress og bilde fra lenkedestinasjonen. Deretter presenteres det på sin egen måte i brukerne sin nyhetsstrøm."

Faktisk så er det slik ting skal fungere - dette er hele brukerhistorien ved å publisere OpenGraph informasjon, og så lenge digi.no benytter OpenGraph (hvilket dere gjør), så er det denne informasjonen som dere selv gir fra dere.

Dette her er ikke snakk om skraping på noen som helst måte i fra digi.no.

Når det gjelder Linkedin - så publiserer disse ingen OpenGraph informasjon på den enkelte brukers profilsider. Det står også helt klart i policyen deres (punkt 8.2.j) at data ikke kan automatisk hentes ut. Det er dog ingen ting som sier at ikke data manuelt kan kopieres ut fra profilene...

Vi forventer bedre etterrettelighet av digi.no. Ikke glem at det er kvaliteten på gratisartiklene som gjør om vi som brukere ønsker å tegne oss for 1 690,- pr år for "Digi Ekstra".

Les mer om OpenGraph på http://ogp.me/

Et format gir deg aldri noen automatisk rett til noe spesifikt kontra andre formater, hverken juridisk eller teknisk. Det har rett og slett ingen betydning.

Forøvrig driver Linkedin med sperrer på ip-adresser og rate-limiting allerede.

Hilsen Linkedin-skraper

qualbeen · 2. august 2017

Et format gir deg aldri noen automatisk rett til noe spesifikt kontra andre formater, hverken juridisk eller teknisk. Det har rett og slett ingen betydning.

TU Media (som eier Digi.no) ønsker at en forhåndsvisning av artiklene deres skal vises på eksterne sider i et gitt format. De har derfor valgt å presentere meta-data i OpenGraph-formatet. Dermed er de sikret at nevnte forhåndsvisning vises korrekt; med riktige bilder og tekster.

Hvis man velger å publisere OpenGraph-metadata på artiklene sine, kan man ikke i etterkant klage på at disse blir brukt. Det er på ingen måte ironisk at LinkedIn velger å vise forhåndsvisningen i tråd med TU Media sin ønsker.

Tvert imot! Det hadde vært ironisk om LinkedIn boikottet TU Media sitt ønske, og altså presenterte Digis artikler på et helt annet format! Da kunne journalisten gjerne ha brukt tidligere tittel, ingress og bildetekst! Men LinkedIn bruker artiklene fra Digi på eksakt den måte TU Media ønsker – og dermed faller hele avsnittet om 'ironisk skraping' bort.

PS: Det ser ut til at journalisten i etterkant har forstått dette selv. Tittel og innfallsvinkel på artikkelen har blitt dramatisk endret ... ;-)

Visningsnavn123 · 2. august 2017

Et format gir deg aldri noen automatisk rett til noe spesifikt kontra andre formater, hverken juridisk eller teknisk. Det har rett og slett ingen betydning.

TU Media (som eier Digi.no) ønsker at en forhåndsvisning av artiklene deres skal vises på eksterne sider i et gitt format. De har derfor valgt å presentere meta-data i OpenGraph-formatet. Dermed er de sikret at nevnte forhåndsvisning vises korrekt; med riktige bilder og tekster.

Hvis man velger å publisere OpenGraph-metadata på artiklene sine, kan man ikke i etterkant klage på at disse blir brukt. Det er på ingen måte ironisk at LinkedIn velger å vise forhåndsvisningen i tråd med TU Media sin ønsker.

Tvert imot! Det hadde vært ironisk om LinkedIn boikottet TU Media sitt ønske, og altså presenterte Digis artikler på et helt annet format! Da kunne journalisten gjerne ha brukt tidligere tittel, ingress og bildetekst! Men LinkedIn bruker artiklene fra Digi på eksakt den måte TU Media ønsker – og dermed faller hele avsnittet om 'ironisk skraping' bort.

PS: Det ser ut til at journalisten i etterkant har forstått dette selv. Tittel og innfallsvinkel på artikkelen har blitt dramatisk endret ... ;-)

Her tar du 100% feil. Å publisere noe i et spesifikt format vil aldri gi deg noe mer eller mindre rett til noe enn dersom du hadde publisert det i et annet format. Dersom dette fortsatt ikke er forståelig anbefaler jeg deg å sette deg inn i lovverket.

Eneste unntaket er hvis det finnes en sperre i formatet, feks kryptering.

Siteringsretten gjelder derimot for alle, så det Linkedin gjør skulle jeg tro er tillatt uansett hvilket format Digi publiserte artiklene sine i.

Sitering != skraping

Erlend Tangeraas Lygre · 3. august 2017

Her har jeg feilaktig satt likhetstegn mellom skraping og uthenting av data via OpenGraph, som flere nevner.

Den store forskjellen er selvsagt at Linkedin ikke ønsker uthenting, mens vi gjør det. Artikkelen er justert deretter.

Takk for tilbakemeldinger.

Hilsen artikkelforfatter.

qualbeen · 3. august 2017

Her tar du 100% feil. Å publisere noe i et spesifikt format vil aldri gi deg noe mer eller mindre rett til noe enn dersom du hadde publisert det i et annet format. Dersom dette fortsatt ikke er forståelig anbefaler jeg deg å sette deg inn i lovverket.

Eneste unntaket er hvis det finnes en sperre i formatet, feks kryptering.

Siteringsretten gjelder derimot for alle, så det Linkedin gjør skulle jeg tro er tillatt uansett hvilket format Digi publiserte artiklene sine i.

Sitering != skraping

Formatet 'Open Graph' omhandler jo nettopp sitering! Det trodde jeg var innlysende, men ser i etterkant at det muligens kan misforståes. Beklager det!

Uansett; for å lage sitatet, må man kontakte webserveren og be om kopi av artikkelen (også omtalt som skraping).

Formatet sørger for at artikkelen vises etter opphavspersonens ønske. Uten et slikt format ville ikke TU Media kunne påvirke hvordan siteringen ville blitt gjort. Derfor er det lurt av TU Media å bruke formatet. Det er dog verdt å nevne at det (selvfølgelig) følger en linsens til dette formatet. Man bør ikke ta i bruk Open Graph uten å ha satt seg inn i lisensen. Er derfor ikke enig i din påstand om «100% feil» ang. tolkning av lovverk.

Her har jeg feilaktig satt likhetstegn mellom skraping og uthenting av data via OpenGraph, som flere nevner.

Den store forskjellen er selvsagt at Linkedin ikke ønsker uthenting, mens vi gjør det. Artikkelen er justert deretter.

Flott! Til forskjell fra andre mediehus opplever jeg at TU Media er meget flinke til å lese kommentarer, og å oppdatere artikkelen dersom det trengs! Dette viser at dere tar brukerne på alvor. Egentlig en god nok grunn til å betale for medlemsskap, spør du meg. Fortsett med dette! :-)

Logg inn

Linkedin vil forby selskap å skrape nettsidene deres - men her skraper de selv

Anbefalte innlegg

Erlend Tangeraas Lygre

Lenke til kommentar

Videoannonse

Eplekatt

Lenke til kommentar

Emancipate

Lenke til kommentar

Superprofessor X

Lenke til kommentar

Superprofessor X

Lenke til kommentar

F

Lenke til kommentar

Gnarfer

Lenke til kommentar

Visningsnavn123

Lenke til kommentar

qualbeen

Lenke til kommentar

Visningsnavn123

Lenke til kommentar

Erlend Tangeraas Lygre

Lenke til kommentar

qualbeen

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Opprett konto

Logg inn

Populær nå

Gode investeringer på 800k

Trump 2025 1 2 3 4 152

RTX 5090 - 8900 XTX (9070 XT) Utgivelse dato - Rytker? 1 2 3 4 111

Elbil-tråden 1 2 3 4 1157

Hvem er aktive 0 medlemmer