Το DALL-E μπορεί τώρα να χρησιμοποιήσει την τεχνητή νοημοσύνη για να επεκτείνει τις εικόνες όπως θα μπορούσε ένας άνθρωπος καλλιτέχνης

Περισσότεροι από ένα εκατομμύριο άνθρωποι χρησιμοποιούν τώρα τον δημιουργό εικόνας AI και πολλοί από αυτούς ζήτησαν ένα εργαλείο που να επεκτείνει την αναλογία διαστάσεων των εικόνων.

  Το DALL-E μπορεί τώρα να χρησιμοποιήσει την τεχνητή νοημοσύνη για να επεκτείνει τις εικόνες όπως θα μπορούσε ένας άνθρωπος καλλιτέχνης
Ο καλλιτέχνης Μάχη Αυγούστου χρησιμοποίησε τη ζωγραφική για να διευρύνει αυτή την εικόνα ενός αστροναύτη σε έναν εξωγήινο κόσμο. [Εικόνα: ευγενική προσφορά του OpenAI]

Από τότε που ανακοινώθηκε τον Απρίλιο, το εργαλείο τεχνητής νοημοσύνης κειμένου σε εικόνα DALL-E 2 έχει εντυπωσιάσει καλλιτέχνες, ερευνητές και τύπους μέσων ενημέρωσης υψηλή ποιότητα εικόνες. Τώρα, τέσσερις μήνες αργότερα, ο προγραμματιστής OpenAI δίνει στο DALL-E 2 ένα νέο τέχνασμα: τη δυνατότητα να επεκτείνει τις αρχικές εικόνες που δημιουργεί πέρα ​​από τα αρχικά τους σύνορα με λογικούς και δημιουργικούς τρόπους.

Το νέο χαρακτηριστικό, το οποίο το OpenAI αποκαλεί 'outpainting', θα μπορούσε να είναι χρήσιμο σε γραφίστες που πρέπει να δημιουργήσουν πολλαπλά μεγέθη και σχήματα μιας συγκεκριμένης εικόνας για να το παρουσιάσουν σε διαφορετικά περιβάλλοντα. Μια εικόνα προώθησης ταινίας, για παράδειγμα, μπορεί να απαιτεί ένα τέλεια τετράγωνο σχήμα σε ένα πλαίσιο και ένα ψηλό ορθογώνιο σχήμα σε ένα άλλο. Για το τελευταίο απαιτείται νέα τέχνη για να συμπληρώσει τον επιπλέον χώρο.

Ο καλλιτέχνης Paul Trillo χρησιμοποίησε το outpaintining για να επεκτείνει αυτήν την εικόνα ενός UFO προς τα κάτω για να συμπεριλάβει την πισίνα. Κάντε κλικ στο επεκτείνουν [Εικόνα: ευγενική προσφορά του OpenAI]
Το DALL-E 2 δημιουργεί πρωτότυπες εικόνες 1024 X 1024 pixel με βάση τις περιγραφές μιας λέξης-κλειδιού που εισάγει ο χρήστης. Μπορεί επίσης να δημιουργήσει εικόνες με βάση αντικείμενα και στυλ που βλέπει σε άλλες εικόνες. Για παράδειγμα, μπορεί να του δοθεί μια εικόνα street art ενός ποντικιού μαζί με μια έκδοση art deco και, στη συνέχεια, να συνδυάσει στοιχεία των δύο στυλ σε μια πρωτότυπη εικόνα του τρωκτικού. Έχει επίσης δυνατότητες επεξεργασίας, που σημαίνει ότι ένας χρήστης μπορεί να διαγράψει ένα τμήμα μιας εικόνας που δημιουργήθηκε και στη συνέχεια να πει στο DALL-E να προσθέσει ένα συγκεκριμένο αντικείμενο ή στυλ σε αυτήν την περιοχή. Για παράδειγμα, αν στον σχεδιαστή δεν αρέσουν τα εξπρεσιονιστικά κόκκινα τριαντάφυλλα στο προσκήνιο μιας εικόνας, μπορεί να τα σβήσει και να ζητήσει από το DALL-E να βάλει φωτορεαλιστικές λευκές ορχιδέες εκεί.



Τώρα, η διεπαφή επεξεργασίας αποκτά μερικά νέα κουμπιά για τον έλεγχο της επέκτασης των εικόνων. Σε μια επίδειξη την Τρίτη, παρακολούθησα τον μηχανικό του OpenAI David Schnurr να επεκτείνει μια εικόνα που είχε δημιουργήσει νωρίτερα η DALL-E με βάση τις λέξεις-κλειδιά ' δύο αρκουδάκια που αναμειγνύουν αστραφτερές χημικές ουσίες μέσα σε ένα εργαστήριο». Είδα μια εικόνα σε στυλ steampunk με δύο χαριτωμένα αρκουδάκια που φορούσαν γυαλιά να στέκονται σε ένα τραπέζι εργαστηρίου στο πρώτο πλάνο. Ο Schnurr ήθελε να επεκτείνει την εικόνα για να δείχνει περισσότερη περιοχή πάνω από τα αρκουδάκια. Ετσι αυτός τοποθετήθηκε το κάτω μισό ένα μπλε τετράγωνο πάνω από το επάνω αριστερό τμήμα της εικόνας, το οποίο είπε στην τεχνητή νοημοσύνη να χρησιμοποιήσει το εργαστηριακό περιβάλλον του βιβλίου ιστοριών και την ατμόσφαιρα στο κάτω μισό του τετραγώνου ως βάση για την επέκταση της εικόνας στο επάνω μισό του τετραγώνου.

«Προσθέτουμε περισσότερα είδη εργαστηριακών εννοιών στην εικόνα και στη συνέχεια μπορούμε επίσης να επεκταθούμε προς τα πάνω και πραγματικά απλά δημιουργήστε μια εικόνα τόσο μεγάλη όσο θα θέλαμε», λέει ο Schnurr.

Ας πούμε ότι ο Schnurr ήθελε το DALL-E να περιλαμβάνει κάτι συγκεκριμένο στην εκτεταμένη περιοχή της εικόνας, όπως ένα ρολόι Κούκου που κρέμεται στον τοίχο πάνω από τις αρκούδες. Θα μπορούσε να το κάνει αυτό δίνοντας στο DALL-E μερικές επιπλέον λέξεις-κλειδιά.

Στην πραγματικότητα, μου λέει ο Schnurr, το DALL-E δημιουργεί τέσσερις διαφορετικές εκδόσεις της εκτεταμένης περιοχής, από τις οποίες ο χρήστης μπορεί να επιλέξει. Εάν δεν τους αρέσει κανένα από τα τέσσερα, μπορούν να δοκιμάσουν ξανά τη λειτουργία επέκτασης, ίσως με διαφορετικές λέξεις-κλειδιά.

Η υπεύθυνη προϊόντων DALL-E, Joanne Jang, λέει ότι η νέα δυνατότητα προήλθε απευθείας από τα σχόλια των χρηστών του DALL-E. Οι σκηνοθέτες χρησιμοποιούν το DALL-E για να μειώσουν τον χρόνο του storyboard στο μισό, λέει ο Jang. Μπορεί να θέλουν να πειραματιστούν με πιο κοντινές ή πλατιές λήψεις κατά τη δημιουργική διαδικασία. Οι σχεδιαστές παιχνιδιών χρησιμοποιούν το DALL-E για να μειώσουν τον χρόνο που χρειάζεται συνήθως για τη δημιουργία νέων σκηνών και δράσεων με καλλιτέχνες concept.

Το χαρακτηριστικό outpainting δεν είναι δωρεάν πρόσθετο. Κάθε χρήστης DALL-E beta λαμβάνει 50 δωρεάν πιστώσεις κατά τον πρώτο μήνα χρήσης και 15 δωρεάν μονάδες κάθε επόμενο μήνα. Κάθε φορά που ένας χρήστης δημιουργεί ένα επιπλέον τμήμα μιας εικόνας του κοστίζει μια πίστωση. Οι χρήστες μπορούν να αγοράσουν πρόσθετες πιστώσεις σε πακέτα 115 γενιάς για 15 $, λέει η OpenAI.

Ο Jang λέει ότι περισσότεροι από ένα εκατομμύριο χρήστες έχουν προσκληθεί στο πρόγραμμα DALL-E beta, συμπεριλαμβανομένων περισσότερων από 3.000 εργαζόμενων καλλιτεχνών. Ως αποτέλεσμα, το OpenAI παρέχει πολλά διαφορετικά είδη σχολίων σχετικά με τον τρόπο βελτίωσης των εργαλείων του DALL-E.

Αλλά μια ερώτηση φάνηκε να περιορίζει τους τύπους χρηστών, προσθέτει η Jang: «Νομίζω ότι μεταξύ όλων αυτών των σημείων ανατροφοδότησης, ένα πράγμα που συνήθως ζητήθηκε ήταν η ευελιξία στις αναλογίες διαστάσεων», λέει.

συνοδευτική επιστολή ή βιογραφικό πρώτα