Sveriges mest populära poddar

En AI till Kaffet

Leonora Vesterbacka: Sveriges egna transkriberings-modell | En AI till Kaffet #40

51 min • 26 februari 2025

Leonora Vesterbacka är team lead för AI-arbetet på KB-labb, en del av Kungliga biblioteket. Med en Ph.D. i fysik och en bakgrund inom forskningsdata från institutioner som CERN, har hennes fokus idag skiftat till språkdata och AI-modeller för svenska. På KB-labb har hennes team under de senaste åren arbetat med att finjustera den populära tal-till-text-modellen Whisper. Den nya versionen, som tränats på en omfattande mängd svenskt tal och lanserades i februari 2025.

  • Hur används transkriberingsmodeller, och varför är de så viktiga?
  • Vilken roll kan Sverige spela i den globala AI-utvecklingen?
  • Hur går finjusteringen av en AI-modell till i praktiken och var hittar man 50 000 timmar taldata för detta?


DETTA AVSNITT ÄR ENDAST TRANSKRIBERAT AV KB-WHISPER PÅ YOUTUBE


(00:00) - Introduktion

(00:53) - Välkommen och KB-lab

(04:10) - Hur började Leonoras AI-resa?

(08:30) - Språkmodells-projekt på KB-lab

(12:25) - Sveriges nya tal-till-text-modell (KB-Whisper)

(18:10) - Vad kommer datan ifrån?

(20:30) - Vad innebär att träna och jämförelse med Wave2Vec

(22:05) - Förberedelse av data

(27:00) - Hur jobbade ni med dialekter?

(30:20) - Vilka varianter finns det?

(32:40) - Största utmaningarna

(36:05) - AI-kommissionens rekommenderingar

(40:35) - Nästa projekt?

(43:30) - AI-Dilemma: Lögndetektorn

(45:45) - AI för en ljusare framtid?

(50:50) - Tack och hejdå!


#podcast #AI #EnAItillKaffet #ArtificiellIntelligens #Savantic #ChatGPT #OpenAI #Whisper #Wave2Wec #OpenSource #Data #CERN #Radio #SVT #Datascience


Kategorier
Förekommer på
00:00 -00:00