≡ Menu

Jacub svarar om AI-låten som toppar svenska Spotifys topplistor: Vi är ett kollektiv bakom

I veckan gick låten ”Jag vet, du är inte min” upp i topp på svenska Spotify topp 50. Det är därmed första gången en AI-genererad låt är listetta på Spotify. Skaparna bakom låten har varit anonyma och inte kommenterat – förrän nu.
Efter att jag i helgen rapporterade om förstaplaceringen har de nu valt att lyfta på locket och skriver i ett långt mejl om anklagelserna, om synen på AI-musik – och vilka de är.

Här kan du se min video om Jacub är i topp.
Här kan du se min summering av mejlet nedan.

Uppdatering: Här är danska bolaget bakom Jacub

Jag publicerar och klistrar in deras mejl i sin helhet, för att tillgängliggöra deras svar till så många som möjligt.

”Hej Emanuel,

Hoppas att allt är väl. Andra journalister har också hört av sig med frågor, så jag har sammanställt ett gemensamt svar nedan. Jag hoppas att detta är till hjälp.

Det är helt okej för oss att delar av nedanstående citeras ordagrant, och jag delar också ett bredare sammanhang för att ge en helhetsbild av hur vi arbetar och hur vi ser på den pågående diskussionen.

Vi är fullt medvetna om att musikindustrin genomgår stora förändringar, och att vi har fått betydande uppmärksamhet i Sverige efter framgången med vår EP ”Kärleken är bränd”.

Först och främst är det viktigt att klargöra att vi inte är ett anonymt techbolag som bara har ”tryckt på en knapp”. Det kunde inte vara längre från sanningen. Teamet bakom Jacub består av erfarna musikskapare, låtskrivare och producenter som har investerat mycket tid, omsorg, känslor och ekonomiska resurser i denna EP. Processen har inneburit många sena nätter och ett stort personligt engagemang, vilket också är anledningen till att vi är genuint tacksamma för hur starkt lyssnarna har knutit an emotionellt till musiken.

Arbetet har skapats genom en fokuserad, medveten och människostyrd kreativ process, vägledd av en tydlig konstnärlig vision. Vi tar vårt ansvar i musikens ekosystem på allvar och strävar efter att bidra på ett ansvarsfullt och konstruktivt sätt.

Vi är också fullt medvetna om att AI, både tekniskt och juridiskt, utvecklas snabbt. Vår intention är helt tydlig: att följa all gällande lagstiftning och att anpassa oss i takt med att framtida regler utvecklas.

Ur ett etiskt perspektiv – hur ser vi på användningen av AI i musik?

Vårt förhållningssätt till AI är nyanserat. När ny teknik uppstår möts den nästan alltid av motstånd, ofta drivet av rädsla för att förlora det som redan finns. Den reaktionen är förståelig. Liksom många andra inom musikbranschen känner vi både oro, nyfikenhet och fascination.

Vi är starkt kritiska till massuppladdning av musik som ofta benämns som ”AI music slop”, där anonyma aktörer eller teknikdrivna entiteter laddar upp tusentals låtar utan konstnärlig intention. Vi hoppas och förväntar oss att tydlig och ansvarsfull reglering kommer att växa fram inom detta område.

Hittills har mycket AI-genererad musik främst väckt uppmärksamhet på grund av att tekniken i sig är ny. Det tar ofta formen av välkända artister i oväntade stilar, eller låtar som bygger på provokation eller gimmickar snarare än långsiktigt musikaliskt värde. I dessa fall är det sällan själva lyssnarupplevelsen som driver intresset, utan snarare nyfikenhet.

Vi har följt denna utveckling från sidlinjen med både skepsis och obehag. En sak stod dock klart för oss: AI är här för att stanna.

Det ledde oss till att sätta ett annat mål. Vår ambition, driven av en genuin kärlek till musik, var att utforska om det är möjligt att skapa ett sammanhängande musikaliskt verk med verkligt, långsiktigt konstnärligt värde, där AI används som ett verktyg inom en människostyrd kreativ process. Musik som människor vill återvända till – inte bara nu, utan även om flera år.

Vissa journalister har beskrivit oss som ”robotar” eller ”maskiner”. Sådana beskrivningar vittnar om en missuppfattning av hur vår musik skapas. Jacub-projektet formas genom praktiskt kreativt arbete, tid, omsorg och personligt engagemang från alla inblandade. Det bygger på hantverk och bidrag från erfarna musikprofessionella. Texterna är inspirerade av händelser i våra egna liv och skrivna utifrån genuint mänskliga erfarenheter.

Många har frågat oss om vår marknadsföring. Även om vi har lång erfarenhet av musikmarknadsföring ville vi i just detta projekt se hur långt musiken kunde bära på egen hand. Därför valde vi att använda noll betald annonsering, vilket innebär att all spridning har skett organiskt. Samtidigt har vi plockats bort från officiella hitlisteplaceringar, inte får någon radiospelning och inte erhållit traditionellt redaktionellt stöd från Spotify, såsom New Music Friday, som ofta fungerar som viktiga katalysatorer för listframgång.

Trots detta har våra låtar fått ett överväldigande stöd direkt från lyssnarna. Vi ser detta som ett resultat av ett långsiktigt, fokuserat arbete bakom musik som människor faktiskt vill lyssna på – och återvända till.

Hittills har vi identifierat nära 100 låtar som försöker imitera det vi har skapat. Vi har också sett flera stora influencers hävda hur ”enkelt” det är att göra en AI-låt. Vi väntar fortfarande på att se en enda av dessa låtar nå en topp 50-placering.

Vi förnekar inte att det är relativt enkelt att generera en AI-låt som nästan ingen lyssnar på. Däremot menar vi att det krävs något helt annat för att gång på gång skapa låtar som stora mängder människor aktivt väljer att återvända till.

I nuläget tycks delar av musikbranschen sakna ett tydligt och konstruktivt förhållningssätt till ny teknik. I avsaknad av klara riktlinjer har uppmärksamheten riktats mot oss, sannolikt eftersom vår release har nått synlig framgång. I verkligheten anser vi att vi representerar ett seriöst försök att arbeta med tekniken på musikens villkor – med respekt för hantverket, människorna och det ekosystem som musiken verkar inom. Vårt mål är att röra oss ansvarsfullt in i framtiden, även med AI.

Många har påstått att prompten till Jacub-låten skulle vara baserad på den svenska artisten Albin Lee Meldau.

Det påståendet är faktamässigt felaktigt. Den aktuella artisten har inte refererats vid något tillfälle i prompts, referensmaterial eller i den kreativa processen bakom ”Jag vet, du är inte min” eller någon annan av våra utgivningar. Låtarna har skapats genom en människostyrd process med full kreativ kontroll, där AI-musikverktyg endast har använts som assisterande instrument.

Det stämmer att vissa TikTok-videor senare spekulerade kring likheter, men dessa påståenden bygger inte på någon insyn i vår process. Innan dessa videor publicerades fanns ingen nämnvärd offentlig diskussion som gjorde denna jämförelse. Vi har ingen intention att imitera specifika artister. Tvärtom lägger vi stor vikt vid att bygga ett eget, distinkt konstnärligt universum för Jacub.

Vi tar sådana anklagelser på allvar, eftersom de riskerar att ge en missvisande bild av både våra arbetsmetoder och vår respekt för upphovsrätt.

Varför registrerades låten hos Stim om AI var inblandat?

Vi registrerade verket hos Stim eftersom vi har skrivit låtarna. Stims policy är att rent AI-genererat material, utan mänskliga ”fria och kreativa val”, inte skyddas av upphovsrätt och därför inte ska registreras. Det är inte den kategori våra utgivningar tillhör. Våra låtar har skapats genom en kreativ process där AI-verktyg endast använts som hjälpmedel.

För att vara helt tydlig: detta är inte ett projekt där vi ”bara tryckte på en knapp”. En mycket stor mängd tid, energi och omsorg har lagts på denna EP, och till de hundratals personer som har hört av sig till oss med djupt personliga meddelanden vill vi säga: vi hör er, vi ser er, och det finns verkliga människor på andra sidan denna musik.

Finns Jacub på riktigt?

Slutligen frågar många om Jacub är ”verklig”. Det beror på hur man definierar begreppet. Jacub är ett konstnärligt projekt som utvecklas och bärs av ett team av mänskliga låtskrivare, producenter och kreatörer. Känslorna, berättelserna och upplevelserna i musiken är verkliga, eftersom de kommer från verkliga människor.

Vänliga hälsningar,
Team Jacub”

Här ansvarar den som skriver kommentarer för sitt eget innehåll
  • Markus januari 20, 2026, 15:39

    Intressant och bra genomgång, Emanuel.

    En sak jag fortfarande har svårt att få ihop är hur mycket av själva sångrösten som faktiskt är AI-genererad, särskilt givet att det handlar om svenska. I dagsläget finns det, så vitt jag vet, inga öppna text-to-sing- eller text-to-speech-lösningar som konsekvent klarar infödd svenska på den här nivån utan extrem teknisk kompetens, egen modellträning och mycket handpåläggning.

    Att uppnå den prosodi, frasering och språkliga naturlighet som Jacub uppvisar i sång kräver i praktiken antingen:
    1. ett team med mycket avancerad AI-expertis och egna modeller, eller
    2. att en människa faktiskt sjunger, med AI som stöd i delar av processen.

    Det senare känns, rent tekniskt, betydligt mer sannolikt. Till exempel att AI har använts för idéarbete, textstöd (LLM:er som ChatGPT), arrangemang, pitch, timing eller efterbearbetning – men att den faktiska vokalen är mänsklig.

    Det vore därför väldigt intressant med mer transparens kring just röstdelen:
    Vad är AI-genererat, och vad är mänskligt framförande?
    Inte av moraliska skäl, utan för att det sätter ribban för vad som faktiskt är möjligt i dag, särskilt på svenska.

    Som teknikintresserad upplever jag annars att risken är att man tillskriver “AI” kapacitet som i praktiken fortfarande kräver mänskligt hantverk.

    Hade varit spännande att höra mer om detta i uppföljningen.

    • Emanuel Karlsten januari 22, 2026, 15:36
      • Markus januari 25, 2026, 16:48

        Hej Emanuel, tack för länken.

        Jag har läst Soundvenue-artikeln, och det är just därför min fråga kvarstår. Artikeln bekräftar att de kallar rösten AI-genererad, men den beskriver inte hur rösten faktiskt skapats i praktiken.

        Min poäng är inte att ifrågasätta intentioner eller etik, utan att förstå den tekniska processen, särskilt eftersom det rör sig om svenska på en nivå som i dagsläget är svår att uppnå utan mänsklig performance.

        Det som vore avgörande att få klarhet i är därför:
        • Finns det en mänsklig sångperformance i botten som AI sedan transformerar (timbre/identitet)?
        • Eller genereras sången helt utan mänsklig röstinput, alltså text → färdig sång?

        De två sakerna är tekniskt fundamentalt olika.
        Om en människa sjunger och AI används för att förändra rösten, skulle jag snarare kalla det AI-transformerad eller AI-editerad röst, inte AI-genererad i egentlig mening.

        Om det däremot är fullt text-till-sång på svenska i den här kvaliteten, vore det extremt intressant ur ett tekniskt perspektiv. I så fall borde det i teorin inte vara svårt att visa eller beskriva ett sådant flöde, just för att sätta ribban för vad som faktiskt är möjligt idag.

        Utan den transparensen finns annars en risk att man tillskriver “AI” kapacitet som i praktiken fortfarande kräver mänskligt hantverk, vilket jag tycker är olyckligt – särskilt för den tekniska diskussionen.

        Hoppas det klargör vad jag är ute efter.

Lämna ett svar

Denna webbplats använder Akismet för att minska skräppost. Lär dig om hur din kommentarsdata bearbetas.

Upptäck mer från Emanuel Karlsten

Prenumerera nu för att fortsätta läsa och få tillgång till hela arkivet.

Fortsätt läsa