GPT‑5, le dernier modèle d’OpenAI, introduit une véritable multimodalité : texte, images, audio et même vidéo en temps réel. Pour créer des images et des vidéos, voici un guide pratique étape par étape.


Prérequis et accès

  1. Assurez-vous d’avoir un compte ChatGPT Plus ou Pro, ou accès à l’API GPT‑5.

  2. Vérifiez que le modèle GPT‑5 inclut bien la sortie visuelle et vidéo, disponible via les interfaces mises à jour.


Générer des images avec GPT-5

GPT‑5 combine des capacités avancées en inférence visuelle et textuelle. Il vous suffit de fournir un prompt clair en langage naturel. Exemple :

Créer une image d’un chat robot futuriste assis sur un skateboard, style néon synthwave.

Le modèle produira une image cohérente avec ce prompt, en tenant compte du style, des couleurs, et des détails.

GPT‑5 corrige les hallucinations visuelles courantes. Il peut analyser un graphique ou une photo et répondre précisément à vos questions, réduisant ainsi les erreurs de génération.


H2 : Générer des vidéos avec GPT-5

GPT‑5 a introduit des capacités vidéo natives, notamment via le modèle Sora, disponible depuis décembre 2024 pour les utilisateurs Plus et Pro.

H3 : Exemple de prompt vidéo

Créer une vidéo d’un papillon bleu voletant dans un champ de fleurs, résolution 1920x1080, durée 20 secondes.

Le résultat : un clip fluide et immersif, généré à partir d’une simple description textuelle.

GPT‑5 peut aussi prolonger une vidéo existante vers l’avant ou l’arrière, une fonction pratique pour créer des séquences plus longues.


H2 : Exemple complet avec code (via l’API)

Voici un exemple en Python pour générer une image :

from openai import OpenAI
client = OpenAI(api_key="VOTRE_CLEF")

response = client.images.generate(
    model="gpt-5",
    prompt="Un renard astronaute flottant dans l'espace, style cartoon",
    n=1,
    size="1024x1024"
)

with open("image.png", "wb") as f:
    f.write(response.data[0])

Et pour générer une vidéo avec Sora (via l’API si supportée) :

response = client.videos.generate(
    model="sora",
    prompt="Un coucher de soleil sur la plage, résolution 1920x1080, 30 secondes",
)

with open("video.mp4", "wb") as f:
    f.write(response.data)

Ces exemples illustrent la simplicité de génération à partir d’un prompt.


H2 : Conseils pratiques et limites

  • Soyez précis : mentionnez le style, la résolution, la durée.

  • Réduisez les hallucinations : GPT‑5 reconnaît mieux ses limites et vous le signale.

  • Utilisez la fenêtre de contexte étendue (jusqu’à 256 000 tokens sur ChatGPT, ou 400 000 via l’API) pour conserver la cohérence sur plusieurs générations.

  • Sora a des limites de durée (souvent jusqu’à 1 minute max) et peut rencontrer des difficultés avec des éléments complexes comme la physique avancée.


Conclusion

GPT‑5 révolutionne la création visuelle grâce à des capacités nativement multimodales. Que ce soit pour générer des images stylisées, des vidéos immersives, ou prolonger une séquence existante, le processus reste simple et puissant. Avec des prompts bien pensés, vous pouvez obtenir des rendus de qualité, utiles pour la création, l’éducation, le marketing ou le design.