L'année écoulée a été le théâtre d'une révolution artistique sans précédent grâce à l'intelligence artificielle. Des modèles novateurs ont conduit cette explosion créative.
Par K. A.
L’univers de l'intelligence artificielle (IA) a connu une révolution spectaculaire au cours de la dernière année, avec plus de 15 milliards d'images créées grâce à des algorithmes textevers-image. Pour mettre ce phénomène en perspective, il a fallu aux photographes 150 ans, de la première photographie en 1826 jusqu'en 1975, pour atteindre le cap des 15 milliards. Cette fulgurante avancée témoigne de l'impact majeur des modèles d'IA générale sur la création visuelle.
Depuis le lancement de Dalle2, les utilisateurs génèrent en moyenne 34 millions d'images par jour. Ce modèle, développé par OpenAI, a été initialement accessible sur invitation seulement. Cependant, depuis septembre 2022, il est disponible pour tous les utilisateurs sans aucune restriction. La communauté a rapidement adopté Dalle-2, générant plus de 2 millions d'images par jour. Un autre acteur majeur de cette révolution est Midjourney, un modèle d'IA générative qui a été lancé en juillet 2022. Avec une base de 15 millions d'utilisateurs, Midjourney opère via Discord, recevant environ 20 à 40 requêtes par seconde.
Ces utilisateurs, au nombre de 1,5 à 2,5 millions actifs à tout moment, contribuent à la création quotidienne de jusqu'à 2,5 millions d'images. Depuis son lancement, Midjourney a ainsi généré près d'un milliard d'œuvres. Un modèle particulièrement intéressant est Stable Diffusion, développé par Stability AI et publié en août 2022. Disponible sur Dreamstudio et sur l'espace Hugging Face de Stability AI, Stable Diffusion compte plus de 10 millions d'utilisateurs.
Les chiffres suggèrent que, via les canaux officiels, les utilisateurs génèrent quotidiennement 2 millions d'images. Cependant, la nature open source de Stable Diffusion signifie que son utilisation ne se limite pas aux espaces officiels. Les multiples plateformes, applications et services construits sur cette technologie, contribuent à une estimation totale de 690 millions d'images générées depuis le lancement. L'aspect le plus remarquable de Stable Diffusion réside dans sa nature open source, permettant la création de contenu au-delà des espaces contrôlés par Stability AI. Des plateformes populaires telles que GitHub, HuggingFace et Civitai hébergent des milliers de modèles basés sur Stable Diffusion, conduisant à une estimation de plus de 11 milliards d'images générées.
En incluant d'autres modèles comme Runway, ce chiffre atteint 12,590 milliards, représentant 80% de toutes les images générées par des algorithmes texte-vers-image. Adobe Firefly, la dernière innovation de cette ère, a été publié en mars 2023. Cette suite de modèles d'IA générative s'est rapidement imposée avec plus de 100 millions d'éléments créés dans les six semaines suivant son lancement. L'intégration de Firefly dans Adobe Photoshop en mai 2023 a propulsé le nombre d'images créées à 1 milliard en seulement trois mois. En somme, plus de 15 milliards d'images ont été créées grâce à Stable Diffusion, Adobe Firefly, Midjourney et Dalle-2.
Ce chiffre colossal dépasse la bibliothèque complète de photos, vecteurs et illustrations de Shutterstock, représentant également un tiers du nombre d'images jamais téléchargées sur Instagram. Cependant, en dépit de ces statistiques, cette conception générative soulève des questions sur la sécurité et la prévention de contenus inappropriés. Elle présente des risques tels que la diffusion de désinformation, des atteintes à la vie privée et des dilemmes éthiques.
Les chercheurs ont montré que des modèles tels que Stable Diffusion et Dalle-2 peuvent être détournés pour générer du contenu violent ou sexuellement explicite, soulignant la nécessité d'améliorer les filtres de sécurité. Malgré les défis auxquels elle est confrontée, la croissance exponentielle de la création d'images par l'IA ouvre de nouvelles perspectives dans le domaine de l'art et de la créativité. Les contours précis de cette révolution restent à définir. À mesure que la technologie progresse rapidement, ces statistiques ne représentent qu'une introduction au potentiel apparemment illimité que l'intelligence artificielle offre à l'expression visuelle.