Konsekvensens konst kräver mer än en prompt
Hur får man en karaktär att förbli sig själv i AI-världen? En större utmaning än man kan tro, särskilt i video. Men det rör sig sakta i rätt riktning.
Att skapa konsekventa karaktärer är fortfarande en utmaning för generativ AI. Personer tenderar att förändras subtilt från bild till bild – och efter några generationer kan de bli helt oigenkännliga. Google Gemini och ChatGPT-4o mini-high har hanterat detta relativt väl, och jag kommer att dela mer om mina erfarenheter med dem i ett kommande inlägg.
Runway har nu släppt Gen-4 References för alla prenumeranter – inte längre enbart för företags- eller premiumanvändare. Funktionen är tänkt att möjliggöra konsekventa karaktärer utifrån en enda referensbild. Runways egna exempel (nedan) är imponerande, men i mitt test (ovan) – där jag försökte placera min dotter i 1960-talets Paris – blev resultatet tyvärr inte helt övertygande. Hon är visserligen igenkännbar, men förändras i utseende redan efter någon sekund i videon.
Nu är ju funktionen fortfarande ganska ny, så det finns hopp om att den kan utvecklas till något riktigt användbart med tiden. Synd bara att Runway är så pass dyrt att jag känner mig tveksam att testa vidare just nu.
Jag tar tillbaka allt jag tidigare skrivit om ByteDance:s Dreamina. För bara någon vecka sedan klagade jag på att bildgeneratorn kändes alltför anpassad för en asiatisk målgrupp. Men det var innan jag började skissa på ett gulligt barnprogram med just en modern asiatisk estetik. Nu känns det snarare som att Dreamina var gjord för det här projektet.
Passande nog släppte Vidu – den image-to-video-tjänst som hittills varit bäst på att animera just tecknade filmer – en ny uppdatering den 21 april): Vidu Q1.
Jag postade ett klipp från arbetet med videon ”Shopping for Death” för ett tag sedan. Det var en ny version av en låt som jag skrev 2024. Det jag glömde att nämna då, var att själva anledningen till att jag gjorde om den var för att jag upptäckt att Suno numera tillåter ordet DEATH.
När jag skrev den här låten för ett år sedan var jag tvungen att kringgå begränsningen genom att skriva “Shopping for DEAF” istället – något som verkligen frustrerade mig då. Det är rätt otroligt hur mycket som kan förändras på ett år.
Och om någon har missat det, så finns mina videos på den här YouTube-kanalen:
https://www.youtube.com/@Mylittlebarrio