Intelligence artificielle : on vous explique ce qu'est DALL-E et comment s'en servir ?

Stephane
Publié le 02/04/2024 40
Share
Une IA qui créé une image d'un homme qui créé avec une IA
On entend beaucoup parler de l'IA ces temps-ci. Cette dernière se taille peu à peu une place dans nos foyers sous diverses formes : fonctionnalités dans nos smartphones ou nos voitures, programmes sur ordinateur, site web... parmi toutes ces nouveautés, certains noms reviennent souvent. Par exemple, DALL-E, une IA générative qui permet de créer des images de mille manières différentes. Qu'est-ce que c'est et comment s'en servir ? Décryptage.

DALL-E, c'est quoi ?

DALL-E est une intelligence artificielle qui génère des images. Conçue par OpenAI, qui a également créé l'IA conversationnelle ChatGPT, DALL-E est le pendant artistique de ce duo. La version en date la plus avancée est DALL-E 3. Elle est disponible sur le web via plusieurs plateformes que nous allons évoquer.

Comment fonctionne l'intelligence artificielle DALL-E ?

DALL-E fonctionne avec plus de 12 milliards de paramètres pour proposer les images les plus cohérentes et en accord avec les souhaits des internautes. Concrètement, DALL-E fonctionne via une fenêtre de chat sur internet. Depuis cette fenêtre, l'internaute rentre la description de l'image qu'il veut créer. Par exemple : "un chien assis sur la lune".

Cette description à rentrer dans la fenêtre de chat est appelée un "prompt". Il existe plusieurs règles et moyens de créer un prompt plus ou moins efficace pour DALL-E.

D'ailleurs, ce type de tâche a créé un nouveau métier : ingénieur en prompt ! En effet, l'intitulé de la demande est tellement crucial et peut tellement changer le résultat de l'image générée que cela en est devenu un métier à part entière. 

> Voir aussi : PC portables

Comment utiliser correctement DALL-E pour générer une image ?

Comment se connecter à DALLE ? 

Il existe plusieurs manières de se connecter à DALL-E. Vous pouvez d'abord y accéder via la plateforme officielle d'OpenAI. Vous aurez alors accès à DALL-E 2. Autre moyen, vous connecter à ChatGPT en version payante. De là, vous pourrez créer un nouveau chat avec le robot DALL-E pour lui demander de vous créer une image.

Autre solution : Bing ! Eh oui, DALL-E est disponible gratuitement dans ce moteur de recherche. Il vous suffit de vous créer un compte pour y avoir accès via Copilot, l'IA de la firme américaine.

Vous pouvez également y avoir accès via le site internet Bing images créator. 

> Voir aussi : bons plans PC portables

Image

L'instruction donnée à l'IA, ou "prompt" 

Le prompt définit ce que l'internaute doit rentrer dans la fenêtre de chat de chacun des sites web ou DALL-E est disponible. Certaines IA vont mieux fonctionner avec un prompt littéral, comme "crée une image d'un chat qui fait un saut en parachute", là ou d'autres programmes vont préférer des prompts créés via des mots-clés. Si on reprend notre exemple, cela donnerait : "un chat. Saut en parachute". Toutes les IA fonctionnent avec les deux types de prompt, mais certaines vont mieux fonctionner que d'autres. 

C'est pour cela que le prompt est très important. C'est lui qui va définir l'image que vous allez obtenir.

De manière générale, le prompt doit être le plus clair et littéral possible. Il faut garder à l'esprit que vous parlez à un robot. Vous devez donc dire les choses clairement et être le plus complet possible, sans pour autant être trop exhaustif.

Par exemple, si vous écrivez "une personne sur une île déserte", vous ne donnez que peu d'informations à DALL-E. Il va donc devoir combler les trous de lui même : Quelle taille pour l'île déserte ? Quelle végétation ? Un homme ou une femme ? Quel âge ? etc.

Au contraire, si vous écrivez "un homme désespéré sur une île déserte d'environ 30 kilomètres carrés, composée de quelques palmiers et de fougères. Il fait beau avec quelques nuages à l'horizon et les vagues sont fortes au bord de la plage", il y a peut être trop d'informations, et l'IA va produire une image incohérente.

Un prompt juste, clair, précis et compréhensible se présenterait plus sous cette forme : Un homme est sur une île déserte. L'île est de petite taille. Il fait beau, et il y a des vagues sur la plage de l'île. L'homme est triste".

De cette manière, vous définissez les grandes lignes de l'image et vous vous assurez un meilleur résultat. Cependant, le prompt n'est pas encore une science exacte. Parfois, un prompt très clair va créer une image à l'opposé de ce que vous cherchez, tout comme un prompt très complexe va parfois donner une belle image. 

Autre élément à savoir : si l'image créée ne vous convient pas, vous pouvez continuer à parler dans le même chat pour que DALL-E la retouche ! Par exemple, nous reprenons le prompt de l'homme sur une île déserte. Une fois l'image créée, nous voulons finalement qu'il porte un costume. Il suffit de le dire dans la fenêtre de chat juste après que l'IA ait créé l'image pour qu'elle reproduise la même scène avec nos modifications ! 

> Voir aussi : iPads

Image

Pour quels usages utiliser l'IA DALL-E ?

Créer des images pour votre propre plaisir ou vos besoins

Bien sûr, l'utilisation principale de DALL-E, c'est la création d'images. L'IA est capable de générer bien des choses et dans plusieurs styles différents, qu'il s'agisse de photos réalistes, de fonds d'écran rétro ou encore de scènes plus décalées.

Par exemple, vous souhaitez monter votre site web de boulangerie et vous avez besoin d'une image d'illustration ? DALL-E peut vous faire ça et en quelques secondes seulement ! Le prompt était ici "crée une boulangère qui pétrit du pain. L'image doit être réaliste, comme une vraie photographie." 

Image

Vous voudriez un nouveau fond d'écran pour votre écran d'ordinateur mais vous n'en trouvez pas à votre goût ? Essayez de demander l'image idéale à DALL-E ! Voici ce que nous avons obtenu en lui disant ceci : "Crée un décor de ville futuriste dans le même style que Blade Runner ou Ghost in The Shell, mais avec un style retrowave." 

Image

Vous cherchez plutôt des visuels amusants, comme par exemple une poire qui parle à une framboise dans un restaurant, tout en se faisant servir par un chien ? C'est possible, si si ! 

Image

Vous l'aurez compris, DALL-E permet de créer toute une myriade d'images, de la photo réaliste qui décrit une scène de la vie quotidienne aux fonds d'écrans, en passant par des idées loufoques ou décalées ! C'est un outil très puissant qui permet de libérer la créativité de chacun et chacune et d'aider bien des personnes dans bien des domaines : création graphique, recherche de logo, inspiration... 

Retoucher des images

DALL-E vous permet également de retoucher des images générées. Il existe la méthode la plus générale que nous avons vu plus haut, consistant à reformuler la demande après que l'IA ait généré l'image, comme "remplace le ciel bleu par un ciel gris", etc.

Il existe une autre méthode plus précise, disponible sur la version de DALL-E accessible via ChatGPT. Si l'on reprend l'exemple de la photo de boulangère, vous aurez peut-être remarqué que l'une d'elles a une trace bleue au niveau des mains. Nous avons donc demandé à DALL-E de corriger cela. Pour ce faire, il vous suffit de cliquer sur la photographie, sélectionner à l'aide de l'outil pinceau la zone à corriger, et taper dans le chat qui se trouve désormais sur la droite la modification voulue. Et le tour est joué ! 

Image

Via Copilot de Bing, l'opération est similaire, mais moins précise. Vous devrez lui demander via le chat de modifier un élément de l'image, sans possibilité de le sélectionner avec un pinceau. La version payante de DALL-E est donc plus complète sur ce plan. 

Télécharger les visuels au format de votre choix

Une fois votre image créée, vous pouvez bien sûr la télécharger et la retoucher sur votre ordinateur ou votre smartphone pour la mettre au bon format. Mais vous pouvez aussi demander à DALL-E de la redimensionner pour vous. Il se peut cependant que l'IA décide de changer totalement votre photo au passage... dans ce cas, faites le prompt en écrivant directement à la fin le format d'image voulu ! Par exemple : "crée moi une image d'un homme sur une île déserte. Au format 4:3". Les images ainsi créées seront automatiquement aux bonnes dimensions. 

Est-ce que DALL-E est payant ?

DALL-E existe en version payante et gratuite. La version gratuite est accessible via le navigateur web Bing et son outil IA Copilot. Si vous voulez accéder à DALL-E via ChatGPT, il vous faudra un abonnement

> Voir aussi : smartphones Xiaomi

Quelle différence entre DALL-E via ChatGPT et via Bing ?

La grosse différence est que DALL-E via ChatGPT est payant, là où l'IA accessible via Bing est gratuite. Les deux accès vous permettent de bénéficier de la dernière version en date, DALL-E 3. Via le site web OpenAI, vous n'aurez accès qu'à DALL-E 2 et de manière gratuite. Au niveau des options, ChatGPT est supérieur grâce à un outil de modification par zonage directement sur l'image