Skip to main content
Arrow Electronics, Inc.
Automatic Water Sprinklers
Artikel

Et indblik i AI: Open-source, non-profit og bæredygtighed

december 10, 2024

Et indblik i AI fra Kasper Ludvigsen: Open-source, non-profit og bæredygtighed

 

Når man taler med Kasper Groes Albin Ludvigsen, er det svært ikke at blive inspireret af hans visioner og arbejde med kunstig intelligens (AI). Kasper er bestyrelsesmedlem i Danish Data Science Community (DDSC), en organisation med over 900 medlemmer. DDSC har som mål at styrke netværk og samarbejde mellem danske data scientists samt at fremme en stærk open-source-kultur. Foreningen gør deres erfaringer, modeller og kode offentligt tilgængelige via Huggingface og hele open-source-princippet bygger på idéen om, at åbenhed og tilgængelighed fremmer innovation og effektivitet – både individuelt og kollektivt. Samtidig gavner open-source-projekter også aktører med begrænsede ressourcer, hvilket er med til at demokratisere adgangen til AI. Et godt eksempel på værdien af open source modeller og data, projektet Skole GPT – en open-source, gratis og sikker generativ AI designet til undervisningsbrug.

 

En NVIDIA A100 GPU til gratis udlån – hvorfor?
Som non-profit organisation kan DDSC have udfordringer med at skaffe den nødvendige computerkraft til at træne deres AI-modeller. Derfor har Arrow ECS Danmark og NVIDIA sponsoreret udlånet af Lenovo serverkapacitet med en installeret NVIDIA A100 GPU, som er blandt de mest avancerede på markedet.

DDSC bruger ikke kun denne GPU til egne projekter, men låner også kapaciteten videre ud til andre aktører. Eksempelvis har Aarhus Universitet lagt billet ind på at anvende kapaciteten til et forskningsprojekt, der undersøger, hvordan sprogmodeller kan trænes effektivt på mindre hardware, såsom almindelige bærbare computere. Succes med dette projekt kan reducere barriererne for at arbejde med AI, da flere vil få adgang til teknologien uden behov for dyre, specialiserede computere. Derudover er der flere andre organisationer, som låner A100 GPU’en – et af projekterne omhandler udviklingen af en computer vision-model, som skal kunne genkende europæisk fauna. Et andet projekt sigter mod at skabe en benchmark til måling af energiforbruget for store sprogmodeller (LLM’er), hvilket er vigtigt for at vurdere deres miljøpåvirkning.

 

Nyt dansk datasæt til søgeforespørgsler
Selv har DDSC har for nyligt udgivet et banebrydende datasæt, der gør det muligt at generere præcise søgeforespørgsler på dansk. Datasættet består af 30.000 artikler fra den danske version af Wikipedia, hvortil en stor sprogmodel (LLM) har genereret matchende søgeforespørgsler. Målet er, at en AI-model kan lære at matche en forespørgsel med den relevante danske artikel hurtigt og præcist.

Datasættet er frit tilgængeligt på Huggingface.co og kan tilpasses til individuelle behov.

 

CO2-aftrykket – en vigtig overvejelse
Kasper Ludvigsen er ikke kun en dygtig data scientist, men også en engageret fortaler for at sætte fokus på AI’s miljøpåvirkning. Han påpeger vigtigheden af at overveje energiforbrug, vandforbrug og den samlede CO2-udledning i arbejdet med kunstig intelligens.

"Vi taler ofte om den grønne omstilling, klimapåvirkning og CO2-aftryk og derfor er det afgørende, at vi også adresserer dette inden for AI,” forklarer Kasper. Miljøpåvirkningen kan dog være svær at måle præcist, da det afhænger af flere faktorer, herunder hardwarens produktionsproces og om den anvendte strøm er grøn.

 

På sin blog på Medium deler Kasper viden og refleksioner om dette og meget mere. Hans artikler, som er blevet læst af over 60.000 personer, er en værdifuld ressource for alle med interesse for AI og bæredygtighed. Læs mere her: Kaspers blog på Medium.

 

Kontakt os for mere information eller et møde om, hvordan vi kan hjælpe dig med AI-løsninger
Kontakt os