Gå til innhold

Hente news fra nettsider.


Anbefalte innlegg

Hei.

 

Tenkte å lage et php script hvor jeg henter news fra nettsider litt her og der. Noen som vet hvordan man gjør dette? Helst uten bruk av RSS fordi noen av de nettsidene jeg skal hente news fra ikke bruker RSS. Hvordan? Takk på forhånd....

 

morty :o

Lenke til kommentar
Videoannonse
Annonse

takk for bra script!!

hva kan jeg forandre for å hente nyhetene fra en annen side? må jeg endre andre steder enn i andressen. er ikke helt inni dette enda..

 

 

Edit:

 

kan jeg redigere med dreamwaver? får bare opp vanlig tekst når jeg skal redigere det i "code view"..

 

hva innledes et cgi script med?

Endret av tsmidt
Lenke til kommentar

et perl script kan ligne på et php script.

 

hvordan dreamweaver takler det, aner jeg ikke. det innledes med en såkalt "she-bang", #!/usr/bin/perl som forteller serveren hvilket program som skal kjøre skriptet.

 

det kan imidlertid ikke "legges inn i" et php-skript eller html-fil slik som php-tagger gjøres i en php-fil.

 

hvis serveren kjører shtml, kan du legge inn en eller annen tag som inkluderer cgi-script, skal google litt og se om jeg finner det.

 

 

Du må nok forandre en del for andre aviser... husk at jeg må lete gjennom HTML fra hardware.no, hvis du ser i skriptet f.eks, så leter jeg etter en <table> med width=472, etter å ha funnet den, leter jeg etter <p> tags uten noen attributer, deretter henter jeg ut første <a> tag etter det, for der ligger nyhetene.

 

Hvordan andre aviser har bygget opp sine nettsider er en helt annen sak... Det må spesialiseres for hver avis (med mindre de bruker rss)

Lenke til kommentar

nei, cgi-skriptet parser html fra hardware.no. mao er det gjort for å kjenne igjen utseendet til hardware.no, (med alle tabeller, tager, etc... ), veldig spesifikt mao.

 

med litt fantasi skjønner man hva det gjør, hvis man ser nøyere på det.

 

for eksempel vet jeg på forhånd at nyhetene ligger i en tablell med bredde 472, hvilket er det første jeg leter etter.

 

deretter leter den etter <p> tags uten noen attributter satt og henter ut første linken fra etter hver av dem.

 

det er sånn framsiden ser ut til å være bygget opp.

 

andre html sider har sitt eget design.

 

hvis man derimot bruker rss-feed'en, trenger man ikke parse html (som er grunnen til at man "fant opp" rss feed)

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...