Erlend Tangeraas Lygre Skrevet 1. august 2017 Del Skrevet 1. august 2017 Lener seg på gammelt amerikansk lovverk.Linkedin vil forby selskap å skrape nettsidene deres - men her skraper de selv Lenke til kommentar
Eplekatt Skrevet 1. august 2017 Del Skrevet 1. august 2017 Rett måte å gjøre det på er å begrense antall søk i minutte eller sekundet, og eller legge inn capcha for å gå inn på en profil. 1 Lenke til kommentar
Emancipate Skrevet 1. august 2017 Del Skrevet 1. august 2017 Rett måte å gjøre det på er å begrense antall søk i minutte eller sekundet Jeg hater det når jeg som bruker treffer slike begrensninger.. Legg inn et maksimum søk i timen istedenfor. Det minsker sjansen for at vanlige brukere skal treffe på begrensningen betydelig, men er like effektivt mot skraping (hvis man velger en tilsvarende verdi). 5 Lenke til kommentar
Superprofessor X Skrevet 1. august 2017 Del Skrevet 1. august 2017 Rett måte å gjøre det på er å begrense antall søk i minutte eller sekundet, og eller legge inn capcha for å gå inn på en profil. det vil jo ikke hindre en robot i å lese gjennom informasjonen.. Lenke til kommentar
Superprofessor X Skrevet 1. august 2017 Del Skrevet 1. august 2017 Rett måte å gjøre det på er å begrense antall søk i minutte eller sekundet, og eller legge inn capcha for å gå inn på en profil. det vil jo ikke hindre en robot i å lese gjennom informasjonen.. men det er jo i praksis umulig å hindre en robot å lese og bruke nettsider selv om vi brukte DNA-analyse som passord.. så der nok best å begrense oppdateringsfrekvensen for å spare båndbredde ja.. 1 Lenke til kommentar
*F* Skrevet 1. august 2017 Del Skrevet 1. august 2017 Man kan ved skraping sende capcha bilder til bedrifter i lavkostlavd som jobber med å tolke capcha og returnere svaret. Dette for en ganske rimelig pris Lenke til kommentar
Gnarfer Skrevet 1. august 2017 Del Skrevet 1. august 2017 Det er direkte feil når dere skriver at det er ironisk at at Linkedin driver skraping. "Dersom man klistrer inn en lenke til en nyhetssak eller bloggpost i status-feltet, vil det sosiale mediet automatisk hente inn tittel, ingress og bilde fra lenkedestinasjonen. Deretter presenteres det på sin egen måte i brukerne sin nyhetsstrøm." Faktisk så er det slik ting skal fungere - dette er hele brukerhistorien ved å publisere OpenGraph informasjon, og så lenge digi.no benytter OpenGraph (hvilket dere gjør), så er det denne informasjonen som dere selv gir fra dere. Dette her er ikke snakk om skraping på noen som helst måte i fra digi.no. Når det gjelder Linkedin - så publiserer disse ingen OpenGraph informasjon på den enkelte brukers profilsider. Det står også helt klart i policyen deres (punkt 8.2.j) at data ikke kan automatisk hentes ut. Det er dog ingen ting som sier at ikke data manuelt kan kopieres ut fra profilene... Vi forventer bedre etterrettelighet av digi.no. Ikke glem at det er kvaliteten på gratisartiklene som gjør om vi som brukere ønsker å tegne oss for 1 690,- pr år for "Digi Ekstra". Les mer om OpenGraph på http://ogp.me/ 9 Lenke til kommentar
Visningsnavn123 Skrevet 1. august 2017 Del Skrevet 1. august 2017 Det er direkte feil når dere skriver at det er ironisk at at Linkedin driver skraping. "Dersom man klistrer inn en lenke til en nyhetssak eller bloggpost i status-feltet, vil det sosiale mediet automatisk hente inn tittel, ingress og bilde fra lenkedestinasjonen. Deretter presenteres det på sin egen måte i brukerne sin nyhetsstrøm." Faktisk så er det slik ting skal fungere - dette er hele brukerhistorien ved å publisere OpenGraph informasjon, og så lenge digi.no benytter OpenGraph (hvilket dere gjør), så er det denne informasjonen som dere selv gir fra dere. Dette her er ikke snakk om skraping på noen som helst måte i fra digi.no. Når det gjelder Linkedin - så publiserer disse ingen OpenGraph informasjon på den enkelte brukers profilsider. Det står også helt klart i policyen deres (punkt 8.2.j) at data ikke kan automatisk hentes ut. Det er dog ingen ting som sier at ikke data manuelt kan kopieres ut fra profilene... Vi forventer bedre etterrettelighet av digi.no. Ikke glem at det er kvaliteten på gratisartiklene som gjør om vi som brukere ønsker å tegne oss for 1 690,- pr år for "Digi Ekstra". Les mer om OpenGraph på http://ogp.me/ Et format gir deg aldri noen automatisk rett til noe spesifikt kontra andre formater, hverken juridisk eller teknisk. Det har rett og slett ingen betydning. Forøvrig driver Linkedin med sperrer på ip-adresser og rate-limiting allerede. Hilsen Linkedin-skraper 2 Lenke til kommentar
qualbeen Skrevet 2. august 2017 Del Skrevet 2. august 2017 Et format gir deg aldri noen automatisk rett til noe spesifikt kontra andre formater, hverken juridisk eller teknisk. Det har rett og slett ingen betydning. TU Media (som eier Digi.no) ønsker at en forhåndsvisning av artiklene deres skal vises på eksterne sider i et gitt format. De har derfor valgt å presentere meta-data i OpenGraph-formatet. Dermed er de sikret at nevnte forhåndsvisning vises korrekt; med riktige bilder og tekster. Hvis man velger å publisere OpenGraph-metadata på artiklene sine, kan man ikke i etterkant klage på at disse blir brukt. Det er på ingen måte ironisk at LinkedIn velger å vise forhåndsvisningen i tråd med TU Media sin ønsker. Tvert imot! Det hadde vært ironisk om LinkedIn boikottet TU Media sitt ønske, og altså presenterte Digis artikler på et helt annet format! Da kunne journalisten gjerne ha brukt tidligere tittel, ingress og bildetekst! Men LinkedIn bruker artiklene fra Digi på eksakt den måte TU Media ønsker – og dermed faller hele avsnittet om 'ironisk skraping' bort. PS: Det ser ut til at journalisten i etterkant har forstått dette selv. Tittel og innfallsvinkel på artikkelen har blitt dramatisk endret ... ;-) Lenke til kommentar
Visningsnavn123 Skrevet 2. august 2017 Del Skrevet 2. august 2017 Et format gir deg aldri noen automatisk rett til noe spesifikt kontra andre formater, hverken juridisk eller teknisk. Det har rett og slett ingen betydning. TU Media (som eier Digi.no) ønsker at en forhåndsvisning av artiklene deres skal vises på eksterne sider i et gitt format. De har derfor valgt å presentere meta-data i OpenGraph-formatet. Dermed er de sikret at nevnte forhåndsvisning vises korrekt; med riktige bilder og tekster. Hvis man velger å publisere OpenGraph-metadata på artiklene sine, kan man ikke i etterkant klage på at disse blir brukt. Det er på ingen måte ironisk at LinkedIn velger å vise forhåndsvisningen i tråd med TU Media sin ønsker. Tvert imot! Det hadde vært ironisk om LinkedIn boikottet TU Media sitt ønske, og altså presenterte Digis artikler på et helt annet format! Da kunne journalisten gjerne ha brukt tidligere tittel, ingress og bildetekst! Men LinkedIn bruker artiklene fra Digi på eksakt den måte TU Media ønsker – og dermed faller hele avsnittet om 'ironisk skraping' bort. PS: Det ser ut til at journalisten i etterkant har forstått dette selv. Tittel og innfallsvinkel på artikkelen har blitt dramatisk endret ... ;-) Her tar du 100% feil. Å publisere noe i et spesifikt format vil aldri gi deg noe mer eller mindre rett til noe enn dersom du hadde publisert det i et annet format. Dersom dette fortsatt ikke er forståelig anbefaler jeg deg å sette deg inn i lovverket. Eneste unntaket er hvis det finnes en sperre i formatet, feks kryptering. Siteringsretten gjelder derimot for alle, så det Linkedin gjør skulle jeg tro er tillatt uansett hvilket format Digi publiserte artiklene sine i. Sitering != skraping Lenke til kommentar
Erlend Tangeraas Lygre Skrevet 3. august 2017 Forfatter Del Skrevet 3. august 2017 Her har jeg feilaktig satt likhetstegn mellom skraping og uthenting av data via OpenGraph, som flere nevner. Den store forskjellen er selvsagt at Linkedin ikke ønsker uthenting, mens vi gjør det. Artikkelen er justert deretter. Takk for tilbakemeldinger. Hilsen artikkelforfatter. Lenke til kommentar
qualbeen Skrevet 3. august 2017 Del Skrevet 3. august 2017 Her tar du 100% feil. Å publisere noe i et spesifikt format vil aldri gi deg noe mer eller mindre rett til noe enn dersom du hadde publisert det i et annet format. Dersom dette fortsatt ikke er forståelig anbefaler jeg deg å sette deg inn i lovverket. Eneste unntaket er hvis det finnes en sperre i formatet, feks kryptering. Siteringsretten gjelder derimot for alle, så det Linkedin gjør skulle jeg tro er tillatt uansett hvilket format Digi publiserte artiklene sine i. Sitering != skraping Formatet 'Open Graph' omhandler jo nettopp sitering! Det trodde jeg var innlysende, men ser i etterkant at det muligens kan misforståes. Beklager det! Uansett; for å lage sitatet, må man kontakte webserveren og be om kopi av artikkelen (også omtalt som skraping). Formatet sørger for at artikkelen vises etter opphavspersonens ønske. Uten et slikt format ville ikke TU Media kunne påvirke hvordan siteringen ville blitt gjort. Derfor er det lurt av TU Media å bruke formatet. Det er dog verdt å nevne at det (selvfølgelig) følger en linsens til dette formatet. Man bør ikke ta i bruk Open Graph uten å ha satt seg inn i lisensen. Er derfor ikke enig i din påstand om «100% feil» ang. tolkning av lovverk. Her har jeg feilaktig satt likhetstegn mellom skraping og uthenting av data via OpenGraph, som flere nevner. Den store forskjellen er selvsagt at Linkedin ikke ønsker uthenting, mens vi gjør det. Artikkelen er justert deretter. Flott! Til forskjell fra andre mediehus opplever jeg at TU Media er meget flinke til å lese kommentarer, og å oppdatere artikkelen dersom det trengs! Dette viser at dere tar brukerne på alvor. Egentlig en god nok grunn til å betale for medlemsskap, spør du meg. Fortsett med dette! :-) Lenke til kommentar
Anbefalte innlegg
Opprett en konto eller logg inn for å kommentere
Du må være et medlem for å kunne skrive en kommentar
Opprett konto
Det er enkelt å melde seg inn for å starte en ny konto!
Start en kontoLogg inn
Har du allerede en konto? Logg inn her.
Logg inn nå