Tekst og språk
En av de mest praktiske forbedringene er hvordan modellen håndterer tekst. Tidligere AI modeller har slitt med å generere lesbar tekst inne i bilder. Nano Banana 2 gjør dette nå med presisjon som er god nok for markedsføringsmateriale og hilsekort.
Modellen støtter også lokalisering og oversettelse av tekst direkte i bildet. Hvis du for eksempel trenger å lage annonser for ulike markeder, kan du generere bildet med tekst på flere språk uten å måtte redigere etterpå.
Tilgang til googles databaser
Nano Banana 2 er koblet til Googles kunnskapsbase og kan bruke sanntidsinformasjon fra nettsøk. Det betyr at modellen forstår spesifikke steder, mennesker, og fenomener på en måte som tidligere modeller ikke gjorde. Hvis du ber den lage et bilde av et kjent landmerke, vil det se ut som det faktisk sted, ikke en generisk versjon.
For utviklere som bruker API en, er prisingen blitt mer konkurransedyktig. En 4K bilde koster nå $0,15, ned fra $0,24 for Pro modellen. En 1K bilde koster $0,07, ned fra $0,13. Dette gjør det mer rimelig å bygge bildegenerering i skala.
Konklusjon
Nano Banana 2 representerer et betydelig fremskritt innen AI-drevet bildegenerering. Jeg har testet modellen selv relativt mye, og forskjellen fra tidligere modeller er som natt og dag. Da man før fikk helt håpløse resultater med ulesbar tekst er det nå mulig å generere relativt bra bilder. Ikke helt perfekt enda, men det er nok ikke langt unna.
