Gå til innhold

Indeksere passordbeskyttet diskusjonsforum i It's learning


Anbefalte innlegg

Jeg er medlem av et "fag" i It's learning som har et gedigent diskusjonsforum.

Det er snakk om rundt 10 tråder og rundt 100 innlegg i måneden.

 

Det kommer masse informasjon her som burde vært søkbar.

 

It's learning har ingen planer om å legge til noe søkefunksjon så jeg lurte på om det var mulig å indeksere forumet på noe måte.

 

Forumet er delt opp i kategorier med Vår (årstall) og Høst (årstall).

 

Jeg har erfaring med PHP, men nesten ikke annet enn if, else og mysql_*.

 

 

Er det mulig å løse egenhånd?

Er det mulig å indeksere dette, lage sin egen "google" på en måte?

Hvordan løses innloggingen?

Lenke til kommentar
Videoannonse
Annonse

Såfremt du ikke får tilgang til databasene til It's Learning (noe som er heller usannsynlig), må du lage et script som selv henter informasjon fra hver tråd og legger dette in i en ekstern database. Så kan du kjøre spørringer mot den nye database, som kan returnere resultater og evt. link til opprinnelig tråd. Sjekk ut file_get_contents() :)

Lenke til kommentar

Du kan bruke curl for å logge inn og laste ned sider, og noe slikt som lucene for å indeksere sidene.

 

Alternativt til php er Apache Nutch (programmert i Java) for å crawle og indeksere i lucene, og istedenfor php til å lage søke side kan du bruke Solr.

Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
  • Hvem er aktive   0 medlemmer

    • Ingen innloggede medlemmer aktive
×
×
  • Opprett ny...