De beste AI-bildegeneratorene for å lage AI-kunst

Vi testet ti AI-bildegeneratorer. Her er våre favoritter.

  De beste AI-bildegeneratorene for å lage AI-kunst
[Bilder: med tillatelse av forfatteren]

Det er vanskelig å tro at det bare har vært det et år siden betaversjonen av DALL-E, OpenAIs tekst-til-bilde-bildegenerator, ble satt løs på internett. Siden den gang har det vært en eksplosjon av AI-generert visuelt innhold, med folk som har laget et gjennomsnitt på 34 millioner bilder per dag. Det er over 15 milliarder bilder laget ved hjelp av tekst-til-bilde-algoritmer bare i fjor. I følge Everypixel Journal , tok det fotografer 150 år, fra det første bildet tatt i 1826 til 1975, for å nå 15 milliarder-grensen.

Den ekte Cosmo , et av referansebildene som ble brukt. [Bilde: med tillatelse av forfatteren]

Med nye AI-tekst-til-bilde-generatorer som lanseres i et så raskt tempo, er det vanskelig å holde styr på hva som er der ute, og som gir de beste resultatene. Vi er her for å bryte ned de beste AI-bildeverktøyene for å generere bilder av høy kvalitet fra enkle beskrivelser eller nøkkelord, eller for å lage nøyaktige bildemeldinger basert på opplastede referansebilder. For å lette sammenligningen brukte jeg den samme oppfordringen for å teste hver modells evne til å fange et fotorealistisk, men likevel snodig bilde av katten min Cosmo som motiv. For å finne den beste forespørselsbeskrivelsen lastet jeg først opp noen referansebilder av katten min til Midjourney, og basert på dens foreslåtte beskrivelser, foredlet jeg forespørselen ved å legge til noen surrealistiske bildeelementer og en fotografistil: 'en slank korthåret lys beige og ravfarget tabby katt med retrosolbriller på tropisk ferie, svært realistisk, 35 mm film.'

DALL-E 2 og DALL-E 3

[Bilde: med tillatelse av forfatteren]

En av de første som ble lansert i bølgen av AI-tekst-til-bilde-generatorer, DALL-E 2 har vært en god kilde for å lage kunst fra naturlige språkbeskrivelser. Den har 4 ganger høyere oppløsning enn forgjengeren DALL-E 1, og kommer med flere nye sikkerhetstiltak som hindrer brukere i å generere voldelig eller eksplisitt innhold, samt fotorealistiske generasjoner av ekte individers ansikter, inkludert ansikter til offentlige personer. Det lar også skapere velge bort kunsten deres fra OpenAIs treningsdata, men den kjedelige prosessen med å fjerne bilder én etter én har etterlatt mange kunstnere frustrert med den nye utviklingen. Hvis du betaler for ChatGPT Plus, får du tilgang til DALL-E 3 direkte i ChatGPT-grensesnittet, noe som betyr at du ikke trenger å bruke tid på å lage den riktige bildeprompten, du kan bare be ChatGPT om å gjøre det for deg. Bekvemmeligheten vil imidlertid komme til en pris, med premium-nivået som kommer inn på $ 20 / måned.

Fordeler

  • Enkelt brukergrensesnitt, flott for å generere surrealistiske bilder

Ulemper

  • Ikke det beste alternativet på listen for å generere ansikter eller realistiske bilder
  • Kjører på en freemium-modell som kan bli kostbar

Midjourney

[Bilde: med tillatelse av forfatteren]

Midjourney har blitt et av de beste alternativene for å generere realistiske bilder, ansikter eller noe for den saks skyld. I motsetning til de andre modellene på denne listen, har ikke Midjourney sin egen dedikerte plattform, men fungerer som en bot i Discord. Brukere har tilgang til et stort fellesskap av andre skapere innen Discord, og som standard vil kunsten du genererer vises i en av de mange offentlige kanalene med alle andres kreasjoner. Hvis du ikke liker å sortere gjennom den overfylte strømmen av kunst som stadig genereres, kan du kopiere Midjourney-boten til en privat server. Midjourney kjører for øyeblikket på versjon 5.2 og inkluderer moduser med høyere variasjon, nye funksjoner som zoom ut/utmaling for å utvide bildets ramme, og inpainting, som lar brukere gjøre endringer i bestemte områder av et bilde uten å måtte regenerere hele bildet. ledetekst.

Fordeler

  • Utmerket realistisk bildekvalitet
  • Omfattende dokumentasjon på Midjourneys nettside
  • Nyttig Discord-fellesskap for nybegynnere

Ulemper

  • Gratisversjonen er avviklet
  • Å generere bilder på den offentlige Discord-serveren kan bli kaotisk

Adobe Firefly

[Bilde: med tillatelse av forfatteren]

Adobes Firefly kom ut av betafasen i september og har begynt å skille seg fra DALL-E og Midjourney av en rekke årsaker. Den primære forskjellen er Firefly's modellen har blitt trent opp ved hjelp av Adobe Stock Images og materiale fra offentlig eiendom med utløpte opphavsrettigheter, noe som sikrer at opplæringsdataene er innhentet med eksplisitt tillatelse fra skaperne. Nå som det er kommersielt tilgjengelig, har Firefly blitt integrert i ulike Creative Cloud-applikasjoner, inkludert Photoshop, Illustrator og Adobe Express. Brukere kan dra nytte av Generative Fill-funksjonen i Photoshop for å legge til, fjerne eller utvide innhold i bilder med enkle tekstmeldinger. Den har også en tekst-til-vektorgrafikk-funksjon som lar brukere lage redigerbar vektorgrafikk fra tekstmeldinger som kan være en game changer for designere, spesielt ettersom modellen fortsetter å forbedre seg.

Fordeler

  • Brukergrensesnittet er veldig intuitivt
  • Støtter tekst-til-vektor generering

Ulemper

  • Begrensede tilpasningsmuligheter, mangel på kontroll

Stabil diffusjon

[Bilde: med tillatelse av forfatteren]

Stabilitet AI utviklet Stabil diffusjon , en bredt omfavnet tekst-til-bilde-generator tilgjengelig som et åpen kildekodeverktøy. Siden lanseringen har brukere hatt friheten til å laste ned og bruke Stable Diffusion fritt, selv om det vanligvis krever et visst nivå av teknisk ferdighet for ikke bare å navigere i brukergrensesnittet, men også installere den nødvendige programvaren (Python 3.8 eller nyere) og GitHub-filer for å kjøre lokalt på datamaskinen din. Av alle modellene som vises på denne listen, gir Stable Diffusion brukerne mest kontroll og fleksibilitet over bildene de genererer, men det krever betydelig beregningskraft. Vi foreslår å vurdere Nvidia-modeller med minimum 8 til 10 GB for optimal ytelse. I tillegg er det viktig å sikre at PC-systemet har en kapasitet på 16 GB RAM for å forhindre potensielle ustabilitetsproblemer.

Fordeler

  • Gratis
  • Åpen kilde

Ulemper

  • Bratt læringskurve, forvirrende brukergrensesnitt

DreamStudio

For brukere som er interessert i å få tilgang til Stable Diffusion uten å trenge programvareinstallasjon, kodeekspertise eller en høyytelses lokal GPU, har Stability AI også gitt ut et brukervennlig nettgrensesnitt som et betalt alternativ. I motsetning til noen av de andre modellene på denne listen som tilbyr et månedlig abonnement for ubegrensede generasjoner, er DreamStudio prismodellen er betal-per-bilde der brukere må kjøpe kreditter etter de første 25 gratis kredittene. DreamStudio tilbyr alle funksjonene du kan forvente fra de mer populære tekst-til-bilde-generatorene, som inpainting, eller muligheten til å laste opp eksisterende referansebilder, og den tilbyr også flere forskjellige forhåndsinnstillinger for stiler og muligheten til å jobbe i lag som gir den kreative arbeidsflyten din mye mer fleksibilitet.

Fordeler

  • Enkelt brukergrensesnitt
  • Mulighet for å jobbe i lag

Ulemper

  • Betaling-per-bilde kredittprismodell tilbyr ikke månedlige ubegrensede generasjoner

Rullebane ML

[Bilde: med tillatelse av forfatteren]

Rullebane ML tilbyr en rekke AI-drevne verktøy i tillegg til tekst-til-bilde generering, inkludert videoredigering og tilpasset modellopplæring. Den har også Frame Interpolation, som lar deg gjøre en sekvens av bilder til en animert video. Plattformen kan nås via hvilken som helst stasjonær eller mobil enhet i nettleseren, selv om den fungerer best når den brukes med Google Chrome. For å begynne, besøk app.runwayml.com uten behov for nedlastinger. Generering av tekst til bilde medfører en kostnad på fem kreditter hver gang, som kan oppnås ved å kjøpe en standard- eller pro-plan til $0,01 per kreditt, og starter med et minimumskjøp på $10. For å få tilgang til nedlastinger i høyere oppløsninger vil det imidlertid kreves en Standard- eller Pro-konto.

Fordeler

  • Flott one-stop shop for tekst-til-bilde-generering med videofunksjoner
  • Tilgjengelig via en mobilapp eller desktopversjon

Ulemper

  • Begrenset lagringskapasitet og eksportmuligheter med gratisversjonen

Canva

[Bilde: med tillatelse av forfatteren]

Canvas AI-bildegenerator Magiske medier er et godt alternativ for brukere som allerede betaler for et månedlig abonnement på Canva, men totalt sett fant vi ut at kvaliteten på Canvas bildegenerator var bedre enn noen av de andre modellene på denne listen, selv om den er drevet av Stable Diffusion. Canva tilbyr et magisk viskelær og redigeringsverktøy som kan fjerne bakgrunner eller objekter og forbedre bilder gjennom oppskalering. I tillegg gir den tilgang til DALL-E og Imagen by Google Cloud direkte i Canva-arbeidsområdet. Brukere kan lage opptil 50 bilder med et gratis abonnement eller velge Canva Pro, noe som tillater 500 bruk per månedlig bruker.

Fordeler

  • Godt alternativ hvis du allerede er Canva-bruker

Ulemper

  • Mindre kontroll/færre tilpasningsmuligheter enn andre modeller på denne listen

Bing Image Creator

[Bilde: med tillatelse av forfatteren]

Microsoft avduket Bing Image Creator tilbake i mars i år, og den utnytter mulighetene til DALL-E 3, den nyeste modellen fra OpenAI. Tidligere brukte Microsoft en tidligere iterasjon av DALL-E for sin bildegenerator, men med integrasjonen av DALL-E 3 har det vært en økning i bildekvalitet og mer presis umiddelbar tolkning. Det er også den eneste måten å bruke DALL-E 3 gratis, siden tilgang til den gjennom Open AIs grensesnitt vil kreve et ChatGPT Plus-abonnement. Bing Image Creator er tilgjengelig via Bing.com og krever ikke en OpenAI-konto. Du kan også få tilgang til den direkte gjennom Bing Chat i Microsoft Edge-nettleseren, som lar brukere lage og avgrense bilder i samtale ved å samhandle med chatboten i stedet for bare å skrive inn en grunnleggende melding.

Fordeler

  • Gir brukere et smutthull for å få tilgang til DALL-E 3 gratis
  • Chatbot kompatibel gjennom Bing Chat

Ulemper

  • Krever en Microsoft-konto
  • Ikke alltid bra på fotorealistiske generasjoner

Jasper

[Bilde: med tillatelse av forfatteren]

Jasper kan være mer kjent for AI-innholdsskriving og SEO-generering, men den har også en anstendig tekst-til-bilde-generator. Den kan lage høyoppløselige bilder uten merkevannmerker og har et enkelt brukergrensesnitt med en rullegardinmeny for utvalgte forhåndsinnstillinger for kunstnerisk stil, stemninger eller medier. Den primære ulempen med Jasper er prisen; Bildegeneratoren er kun tilgjengelig via en Pro-plan som koster 69 dollar per måned.

Fordeler

  • Enkelt brukergrensesnitt
  • Ingen merkede vannmerker å fjerne

Ulemper

  • Mye dyrere enn andre modeller på denne listen
  • Bildekvaliteten er egentlig ikke verdt prisen

Googles bilde 2

[Bilde: med tillatelse av forfatteren]

Google debuterte stille Bilde 2 , selskapets AI-bildegenerator forrige uke, utvidet tilgangen til Google Cloud-kunder som bruker Vertex AI. Oppdateringer av modellen inkluderer forbedret tekstgjengivelse, som mange grafiske designere vil være ivrige etter å få tak i, ettersom typografi har vært et spesielt utfordrende emne for AI å gjengi nøyaktig. Imagen 2 kan også produsere logogenerasjoner av høy kvalitet og støtter flerspråklige spørsmål, samt en eksperimentell digital vannmerketjeneste, drevet av Google DeepMinds SynthID, som gjør det mulig for brukere å generere usynlige vannmerker og verifisere bilder generert av Imagen.

Fordeler

  • Økt tekstgjengivelse for typografisk bruk

Ulemper

  • Foreløpig ikke tilgjengelig for allmennheten