Gå til innhold

Er det noen som har erfaring med DeepSeek R1?


Anbefalte innlegg

1 hour ago, disarer42 said:

Å kjøpe hardware for flere titusener for å kjøre "Ai" lokalt er ikke noe jeg ville gjort. Men hobbyer koster penger...

Det spørs om jeg ikke besinner meg når jeg kommer hjem og får testet på det beste jeg har av hardware. 

Slik som jeg ser det, så er det vikrigste med en slik AI modell ikke hava den kan yte i diverse tekniske tester, men der i mot hva den kan brukes til i praksis i forhold til å gi gode svar og beskrivelser. Da blir nok kvaliteten på treningsdata noe av det som er viktigst. 

Det spørs om ikke ChatGPT er den varianten som fortsatt gir best kvalitet i det som kommer ut av den og som har størst praktisk nytteverdi.

Det spørs om ikke Deepseek-R1  først og fremst er for de som vil lære hvordan sike systemer fungerer, ved å kjøre dem lokalt, og så er den jo kanskje også et brukbart utgangspunkt for alle makthavere som vil forklare sin befolkning litt om historie og sitt mer eller mindre spesielle syn på politikk og samfunn. Da kan et tilpasset og riktig trent AI system være makthaverens røst ut til folket. For ingen kan jo tvile på det som kommer ut i fra et system for AI eller kunstig intelligens.

Lenke til kommentar
Videoannonse
Annonse
4 minutes ago, Gavekort said:

At den kan brukes til (nesten) hva du vil uten at du må forholde deg til f.eks OpenAI (som ironisk nok er en av de som er mest "closed").

Men det er jo bare spesifikasjonene som er opensource. Selve modellen selv er jo bare en stor samlig med tall.

Lenke til kommentar
arne22 skrev (6 minutter siden):

Men det er jo bare spesifikasjonene som er opensource. Selve modellen selv er jo bare en stor samlig med tall.

Omvendt. Modellen er "open source" som betyr at du kan bruke den esoteriske blobben hvordan du vil, men de kommer aldri til å fortelle deg hvordan de laget den blobben.

Deepseek har nesten ikke publisert noe kode, bortsett fra noen små eksempler på hvordan man kan gjøre en inference i modellene demmes.

Lenke til kommentar
12 minutes ago, Gavekort said:

Omvendt. Modellen er "open source" som betyr at du kan bruke den esoteriske blobben hvordan du vil, men de kommer aldri til å fortelle deg hvordan de laget den blobben.

Hvordan går du fram for å lese innholdet i modellen?

"Opensource" brukes jo vanligvis for å beskrive programkode som er i lesbar klartekst.

Her er det som er lagt ut:

https://github.com/deepseek-ai/DeepSeek-R1

Hvor er resten av det som er lagt ut som "opensource"?

Endret av arne22
Lenke til kommentar
arne22 skrev (1 minutt siden):

Hvordan går du fram for å lese innholdet i modellen?

"Opensource" brukes jo vanligvis for å beskrive programkode som er i lesbar klartekst.

Å lese innholdet i modellen er håpløst. Det er bare en diger blob med vektorer. Ja open source som navnet tilsier er jo at kildekoden er tilgjengelig, noe den ikke er.

Lenke til kommentar

RTX 3090 med 24GB VRAM. Selges fra 7000kr på finn.no for mining brukt kort til 9000kr. Sikkert mulig å prute.

Med tanke på kronekurs og at vi har 25%MVA så selges disse kortene billigere i Norge enn i f.eks. USA. 

Lenke til kommentar

Litt info om hvordan tingene fungerer og hvorfor man kaller modellen for "opensource" selv om de tradisjonelle kriteriene for "opensource" ikke er oppfylt.

Det refereres til Llama modellen for sammenligning, og Llama er da Meta eller Facebook sin variant:

https://ai.meta.com/blog/meta-llama-3-1/

Og Phi-4 er som tidligere nevnt Microsoft sin variant.

Alt sammen enkelt tilgjengelig via ollama.

Endret av arne22
Lenke til kommentar

Opprett en konto eller logg inn for å kommentere

Du må være et medlem for å kunne skrive en kommentar

Opprett konto

Det er enkelt å melde seg inn for å starte en ny konto!

Start en konto

Logg inn

Har du allerede en konto? Logg inn her.

Logg inn nå
×
×
  • Opprett ny...