Hvordan lager du bilder med AI?

Skal du krydre en artikkel med et illustrasjonsbilde? Ønsker du deg et spesifikt uttrykk? Lag ditt eget bilde med kunstig intelligens.

Det finnes en rekke kunstige intelligenser som du bruke for å lage bilder. En av disse er DALL-E, en bildegenerator som er utviklet av OpenAI. Bildegeneratorer, og annen kunstig intelligens, kan være en enorm ressurs for folk i bransjen vår, hvis man lærer seg å bruke det på en effektiv måte.

Les mer om AI her.

DALL-E er en generativ modell og den kan brukes til å generere bilder basert på tekstbeskrivelser. Det er altså en tekst til bilde-modell. Det vil si at man gir DALL-E en beskrivelse av hva slags bilde det er man ønsker seg, i form av en beskrivende tekst. Og så gir DALL-E deg bildet du har beskrevet i retur. Disse tekstlige beskrivelsene kalles en prompt.

Her er noen tips for å skrive en god prompt:

  1. Vær spesifikk: jo mer nøyaktig du beskriver hva du vil at bildet skal inneholde, jo mer sannsynlig er det at du får det du vil ha.
  2. Bruk klare og konkrete beskrivelser: beskriv farger, størrelser, former, belysning og andre detaljer som du vil at bildet skal ha.
  3. Unngå å være vag: ikke bruk abstrakte beskrivelser eller begreper som «fint» fordi en slik beskrivelse ikke gir modellen nok informasjon til å lage et nøyaktig bilde.
  4. Vær kreativ: du kan bruke fantasifulle eller absurde beskrivelser for å få unike og interessante bilder.

Et eksempel på en promt kan være: lag et bilde av en grønn elefant med en regnbue i ryggen som spiser en iskrem med små stjerner i stedet for is. Her har vi gitt DALL-E denne beskrivelsen, og da fikk vi bildene under i retur.

Bildene generert av DALL-E basert på prompten over.

Promt engineer

Nøkkelen for å få generert gode bilder er å skrive gode promoter. Allerede nå ansettes det prompt engineers og dette kommer til å blir enda mer vanlig i fremtiden. Dette er personer som er spesialister på å utvikle og designe tekst- eller tale-baserte prompts. En prompt engineer jobber med å designe prompts som gir systemet, for eksempel DALL-E, en klar idé om hva slags sluttresultat man ønsker.

En prompt engineers arbeid inkluderer ofte testing og justering av prompts for å sikre at de er så intuitive og brukervennlige som mulig, og at de gir brukeren den informasjonen de trenger for å utføre ønskede handlinger.

I prompten vi har brukt for å generer illustrasjonsbildet over kunne vi for eksempel spesifisert hvordan elefanten skulle holdt iskremen med snabelen. Dette ville typisk vært er videreutvikling av prompten, slik at vi fikk justert bildet til å bli seende ut akkurat slik vi ville ha det.

Men hva med opphavsretten til bildene?

Foreløpig kan alle brukere av DALL-E kommersialisere bildene de lager med den kunstige intelligensen. Samtidig er det viktig å merke seg at DALL-E kan generere bilder som ligner på eksisterende bilder. Dette må man være oppmerksom på slik at det ikke oppstår rettighetsproblemer knyttet til dette.

Det er også viktig å merke seg at det kan være visse juridiske begrensninger og restriksjoner som gjelder for kommersialisering av bilder avhengig av lokale lover og regler. Det anbefales å konsultere en juridisk rådgiver for å sikre at du overholder alle gjeldende regler og bestemmelser.

OpenAI oppfordrer videre til at man er transparent om at det er brukt AI til å generere grafisk materiell. Man skal rett og slett være mest mulig ærlig om at det grafiske arbeidet ikke er 100% menneskelaget. Det kan man gjøre ved å kreditere DALL-E i bildeteksten.

Les mer om OpenAI sine retningslinjer for bruk av DALL-E-generert innhold her.

Del dette innlegget: