Topic de KillerJamme :

[IA] Tuto stable diffusion sur son propre PC ! (2025)

Possible d'avoir le lien du serveur en MP les gars svp ? :svp:

Question concernant ComfyUI et les lora, j'ai l'interface configurée pour image to video
https://image.noelshack.com/fichiers/2025/41/3/1759928505-image.png
Si j'ai téléchargé plusieurs Loras comment je les place dans ce workflow?

la logique me dit de faire comme ca dans l'ordre de priorité, est-ce correcte?
https://image.noelshack.com/fichiers/2025/41/3/1759928634-image.png

Dites moi svp, merci :)

Le 08 octobre 2025 à 15:04:58 alastorworld a écrit :
Question concernant ComfyUI et les lora, j'ai l'interface configurée pour image to video
https://image.noelshack.com/fichiers/2025/41/3/1759928505-image.png
Si j'ai téléchargé plusieurs Loras comment je les place dans ce workflow?

la logique me dit de faire comme ca dans l'ordre de priorité, est-ce correcte?
https://image.noelshack.com/fichiers/2025/41/3/1759928634-image.png

Dites moi svp, merci :)

Oui, ils sont bien placés (juste après le modèle).

Part contre, l'ordre n'a aucune importance.
Si tu veux pondérer le poids qu'on les Lora (forcer un plus l'un ou l'autre ou réduire le poids d'un autre), il faut jouer avec les réglages "Strength_Model".

1.0 = "100%", donc ils seront entièrement "intégrés" au modèle principal, et va donc beaucoup le modifier.
0.0 = "0%", donc c'est comme si tu ne l'avais pas mis.

Si veux forcer ton premier Lora, tu le laisses à 1.0 par exemple (ou moins si tu veux qu'il ne modifie par trop ton modèle principal) et les 2 autres Lora à 0.5 pour qu'ils modifient moins le modèle principal https://image.noelshack.com/fichiers/2017/30/4/1501187858-risitassebestreup.png

Le 08 octobre 2025 à 19:27:48 :

Le 08 octobre 2025 à 15:04:58 alastorworld a écrit :
Question concernant ComfyUI et les lora, j'ai l'interface configurée pour image to video
https://image.noelshack.com/fichiers/2025/41/3/1759928505-image.png
Si j'ai téléchargé plusieurs Loras comment je les place dans ce workflow?

la logique me dit de faire comme ca dans l'ordre de priorité, est-ce correcte?
https://image.noelshack.com/fichiers/2025/41/3/1759928634-image.png

Dites moi svp, merci :)

Oui, ils sont bien placés (juste après le modèle).

Part contre, l'ordre n'a aucune importance.
Si tu veux pondérer le poids qu'on les Lora (forcer un plus l'un ou l'autre ou réduire le poids d'un autre), il faut jouer avec les réglages "Strength_Model".

1.0 = "100%", donc ils seront entièrement "intégrés" au modèle principal, et va donc beaucoup le modifier.
0.0 = "0%", donc c'est comme si tu ne l'avais pas mis.

Si veux forcer ton premier Lora, tu le laisses à 1.0 par exemple (ou moins si tu veux qu'il ne modifie par trop ton modèle principal) et les 2 autres Lora à 0.5 pour qu'ils modifient moins le modèle principal https://image.noelshack.com/fichiers/2017/30/4/1501187858-risitassebestreup.png

Merci bro :ok:

Le 08 octobre 2025 à 15:04:58 :
Question concernant ComfyUI et les lora, j'ai l'interface configurée pour image to video
https://image.noelshack.com/fichiers/2025/41/3/1759928505-image.png
Si j'ai téléchargé plusieurs Loras comment je les place dans ce workflow?

la logique me dit de faire comme ca dans l'ordre de priorité, est-ce correcte?
https://image.noelshack.com/fichiers/2025/41/3/1759928634-image.png

Dites moi svp, merci :)

La logique est bonne mais ne l'est pas pour l'utilisation des lora Lightx2v.

Dans tes Ksampler tu devrais mettre le nombre de steps à 4
CFG à 1 si tu mets plus ça sert à rien d'utiliser les lora Lightx2v.
Start at step 1, end at step 2
Start at step 2, end at 4 = les 4 étapes sont bien la dans les deux Ksampler.

Tips 1 : Si tu veux pas temmerder à mettre plein de nodes pour chaques lora tu peux utiliser Power Lora Loader the rgthree.

Tips 2 : tu peux tester des versions gguf de wan 2.2 se rapprochant + de la version fp16 à partir de la Q6_K. Je les préfère à la version FP8 scaled.

Tips 3 : renseigne toi pour triton et sage attention (optimisation et gain de rapidité) , si ta carte graphique est compatible.

Tips 4 : si tu constates que tes résultats vidéo sont trop lent, vois pour changer ta version Lightx2v actuelle par celle ci https://huggingface.co/Kijai/WanVideo_comfy/blob/main/Lightx2v/lightx2v_T2V_14B_cfg_step_distill_v2_lora_rank64_bf16.safetensors

Les versions Lightx2v actuelle pour wan 2.2 i2v ont quelques souci et apparemment la version t2v de wan 2.1 marche beaucoup mieux sur WAN 2.2 . Tu peux mettre le strength en 2.0 pour le high et 1.5 pour low.

Aussi passe tes étape en 6. Donc start at step 1 puis end 3 puis start 3 puis end 6 dans tes Ksampler.

Tips 5 : étant donné qu'on utilise un CFG à 1 pour utiliser les lora Lightx2v, ce qui empêche le bon fonctionnement des prompts négatif, il est vivement conseillé d'utiliser le node WanVIdeoNAG. (certains le connectent même au positif il paraît que c'est encore mieux.)

ça fait deux ans que j'y utilise, autant dire que je maitrise super bien maintenant :hap:
Je fais de ces trucs :rire2:
topic intéressant mais faire un tuto de fou pour faire des images pokémon c'est non :rire:

Le 09 octobre 2025 à 01:35:56 nikaya8362 a écrit :
topic intéressant mais faire un tuto de fou pour faire des images pokémon c'est non :rire:

Tu peux faire des images de tous ce que tu veux :noel:

Le 09 octobre 2025 à 01:32:13 Fuh a écrit :

Le 08 octobre 2025 à 15:04:58 :
Question concernant ComfyUI et les lora, j'ai l'interface configurée pour image to video
https://image.noelshack.com/fichiers/2025/41/3/1759928505-image.png
Si j'ai téléchargé plusieurs Loras comment je les place dans ce workflow?

la logique me dit de faire comme ca dans l'ordre de priorité, est-ce correcte?
https://image.noelshack.com/fichiers/2025/41/3/1759928634-image.png

Dites moi svp, merci :)

La logique est bonne mais ne l'est pas pour l'utilisation des lora Lightx2v.

Dans tes Ksampler tu devrais mettre le nombre de steps à 4
CFG à 1 si tu mets plus ça sert à rien d'utiliser les lora Lightx2v.
Start at step 1, end at step 2
Start at step 2, end at 4 = les 4 étapes sont bien la dans les deux Ksampler.

Tips 1 : Si tu veux pas temmerder à mettre plein de nodes pour chaques lora tu peux utiliser Power Lora Loader the rgthree.

Tips 2 : tu peux tester des versions gguf de wan 2.2 se rapprochant + de la version fp16 à partir de la Q6_K. Je les préfère à la version FP8 scaled.

Tips 3 : renseigne toi pour triton et sage attention (optimisation et gain de rapidité) , si ta carte graphique est compatible.

Tips 4 : si tu constates que tes résultats vidéo sont trop lent, vois pour changer ta version Lightx2v actuelle par celle ci https://huggingface.co/Kijai/WanVideo_comfy/blob/main/Lightx2v/lightx2v_T2V_14B_cfg_step_distill_v2_lora_rank64_bf16.safetensors

Les versions Lightx2v actuelle pour wan 2.2 i2v ont quelques souci et apparemment la version t2v de wan 2.1 marche beaucoup mieux sur WAN 2.2 . Tu peux mettre le strength en 2.0 pour le high et 1.5 pour low.

Aussi passe tes étape en 6. Donc start at step 1 puis end 3 puis start 3 puis end 6 dans tes Ksampler.

Tips 5 : étant donné qu'on utilise un CFG à 1 pour utiliser les lora Lightx2v, ce qui empêche le bon fonctionnement des prompts négatif, il est vivement conseillé d'utiliser le node WanVIdeoNAG. (certains le connectent même au positif il paraît que c'est encore mieux.)

https://image.noelshack.com/fichiers/2017/11/1489850295-denis-ah.png

J'eusse répondu sur mes anciennes connaissances quasi uniquement sur les images https://image.noelshack.com/fichiers/2017/30/4/1501187858-risitassebestreup.png

du coup stable diffusion c'est que des images et wan c'est les vidéos ?

Le 09 octobre 2025 à 01:35:56 nikaya8362 a écrit :
topic intéressant mais faire un tuto de fou pour faire des images pokémon c'est non :rire:

On se revoit sur le quai mon Khey https://image.noelshack.com/fichiers/2017/39/1/1506353927-vacances-de-mr-bean-2007-14-g.png

Le 09 octobre 2025 à 01:38:29 :

Le 09 octobre 2025 à 01:32:13 Fuh a écrit :

Le 08 octobre 2025 à 15:04:58 :
Question concernant ComfyUI et les lora, j'ai l'interface configurée pour image to video
https://image.noelshack.com/fichiers/2025/41/3/1759928505-image.png
Si j'ai téléchargé plusieurs Loras comment je les place dans ce workflow?

la logique me dit de faire comme ca dans l'ordre de priorité, est-ce correcte?
https://image.noelshack.com/fichiers/2025/41/3/1759928634-image.png

Dites moi svp, merci :)

La logique est bonne mais ne l'est pas pour l'utilisation des lora Lightx2v.

Dans tes Ksampler tu devrais mettre le nombre de steps à 4
CFG à 1 si tu mets plus ça sert à rien d'utiliser les lora Lightx2v.
Start at step 1, end at step 2
Start at step 2, end at 4 = les 4 étapes sont bien la dans les deux Ksampler.

Tips 1 : Si tu veux pas temmerder à mettre plein de nodes pour chaques lora tu peux utiliser Power Lora Loader the rgthree.

Tips 2 : tu peux tester des versions gguf de wan 2.2 se rapprochant + de la version fp16 à partir de la Q6_K. Je les préfère à la version FP8 scaled.

Tips 3 : renseigne toi pour triton et sage attention (optimisation et gain de rapidité) , si ta carte graphique est compatible.

Tips 4 : si tu constates que tes résultats vidéo sont trop lent, vois pour changer ta version Lightx2v actuelle par celle ci https://huggingface.co/Kijai/WanVideo_comfy/blob/main/Lightx2v/lightx2v_T2V_14B_cfg_step_distill_v2_lora_rank64_bf16.safetensors

Les versions Lightx2v actuelle pour wan 2.2 i2v ont quelques souci et apparemment la version t2v de wan 2.1 marche beaucoup mieux sur WAN 2.2 . Tu peux mettre le strength en 2.0 pour le high et 1.5 pour low.

Aussi passe tes étape en 6. Donc start at step 1 puis end 3 puis start 3 puis end 6 dans tes Ksampler.

Tips 5 : étant donné qu'on utilise un CFG à 1 pour utiliser les lora Lightx2v, ce qui empêche le bon fonctionnement des prompts négatif, il est vivement conseillé d'utiliser le node WanVIdeoNAG. (certains le connectent même au positif il paraît que c'est encore mieux.)

https://image.noelshack.com/fichiers/2017/11/1489850295-denis-ah.png

J'eusse répondu sur mes anciennes connaissances quasi uniquement sur les images https://image.noelshack.com/fichiers/2017/30/4/1501187858-risitassebestreup.png

1 mois que j'utilise wan 2.2. J'ai du me forcer à apprendre comfyUI, maintenant je surkiff cet UI.

Je me suis pris d'ailleurs un nvme 2to pour charger les modèles et optimiser loffload vers la ram (wan 2.2 c'est pas même le trip que sdxl) . Malgré mes 12go de vram c'est putain de rapide une fois tout optimisé.

Le 09 octobre 2025 à 01:40:13 spermedetortue9 a écrit :
du coup stable diffusion c'est que des images et wan c'est les vidéos ?

Grosso-merdo...

En fait, Stable Diffusion, c'est un modèle (en fait plusieurs version d'un modèle), mais beaucoup d'autres groupes/entreprises ont développé d'autres modèles, aussi bien images que vidéos...

Et plus seulement du T2I (Text To Image), mais aussi du I2I (Image To Image), du I2V (Image To Video), et même du S2V (Sound To Video) https://image.noelshack.com/fichiers/2017/30/4/1501187858-risitassebestreup.png

Le 09 octobre 2025 à 01:40:13 :
du coup stable diffusion c'est que des images et wan c'est les vidéos ?

Tu fais tes images sur sdxl puis tu fais du img2vid sur WAN 2.2. Les deux ont une bonne synergies pour ça.

Le 09 octobre 2025 à 01:43:29 Fuh a écrit :

Le 09 octobre 2025 à 01:38:29 :

Le 09 octobre 2025 à 01:32:13 Fuh a écrit :

Le 08 octobre 2025 à 15:04:58 :
Question concernant ComfyUI et les lora, j'ai l'interface configurée pour image to video
https://image.noelshack.com/fichiers/2025/41/3/1759928505-image.png
Si j'ai téléchargé plusieurs Loras comment je les place dans ce workflow?

la logique me dit de faire comme ca dans l'ordre de priorité, est-ce correcte?
https://image.noelshack.com/fichiers/2025/41/3/1759928634-image.png

Dites moi svp, merci :)

La logique est bonne mais ne l'est pas pour l'utilisation des lora Lightx2v.

Dans tes Ksampler tu devrais mettre le nombre de steps à 4
CFG à 1 si tu mets plus ça sert à rien d'utiliser les lora Lightx2v.
Start at step 1, end at step 2
Start at step 2, end at 4 = les 4 étapes sont bien la dans les deux Ksampler.

Tips 1 : Si tu veux pas temmerder à mettre plein de nodes pour chaques lora tu peux utiliser Power Lora Loader the rgthree.

Tips 2 : tu peux tester des versions gguf de wan 2.2 se rapprochant + de la version fp16 à partir de la Q6_K. Je les préfère à la version FP8 scaled.

Tips 3 : renseigne toi pour triton et sage attention (optimisation et gain de rapidité) , si ta carte graphique est compatible.

Tips 4 : si tu constates que tes résultats vidéo sont trop lent, vois pour changer ta version Lightx2v actuelle par celle ci https://huggingface.co/Kijai/WanVideo_comfy/blob/main/Lightx2v/lightx2v_T2V_14B_cfg_step_distill_v2_lora_rank64_bf16.safetensors

Les versions Lightx2v actuelle pour wan 2.2 i2v ont quelques souci et apparemment la version t2v de wan 2.1 marche beaucoup mieux sur WAN 2.2 . Tu peux mettre le strength en 2.0 pour le high et 1.5 pour low.

Aussi passe tes étape en 6. Donc start at step 1 puis end 3 puis start 3 puis end 6 dans tes Ksampler.

Tips 5 : étant donné qu'on utilise un CFG à 1 pour utiliser les lora Lightx2v, ce qui empêche le bon fonctionnement des prompts négatif, il est vivement conseillé d'utiliser le node WanVIdeoNAG. (certains le connectent même au positif il paraît que c'est encore mieux.)

https://image.noelshack.com/fichiers/2017/11/1489850295-denis-ah.png

J'eusse répondu sur mes anciennes connaissances quasi uniquement sur les images https://image.noelshack.com/fichiers/2017/30/4/1501187858-risitassebestreup.png

1 mois que j'utilise wan 2.2. J'ai du me forcer à apprendre comfyUI, maintenant je surkiff cet UI.

Je me suis pris d'ailleurs un nvme 2to pour charger les modèles et optimiser loffload vers la ram (wan 2.2 c'est pas même le trip que sdxl) . Malgré mes 12go de vram c'est putain de rapide une fois tout optimisé.

ComfyUI >>>>>>> ALL

Je l'ai toujours dit https://image.noelshack.com/fichiers/2018/27/4/1530827992-jesusreup.png

Tellement de souplesse, de possibilités, de personnalisation... https://image.noelshack.com/fichiers/2017/30/4/1501187858-risitassebestreup.png

Le 09 octobre 2025 à 01:44:06 :

Le 09 octobre 2025 à 01:40:13 spermedetortue9 a écrit :
du coup stable diffusion c'est que des images et wan c'est les vidéos ?

Grosso-merdo...

En fait, Stable Diffusion, c'est un modèle (en fait plusieurs version d'un modèle), mais beaucoup d'autres groupes/entreprises ont développé d'autres modèles, aussi bien images que vidéos...

Et plus seulement du T2I (Text To Image), mais aussi du I2I (Image To Image), du I2V (Image To Video), et même du S2V (Sound To Video) https://image.noelshack.com/fichiers/2017/30/4/1501187858-risitassebestreup.png

ok ok merci :hap:

Et c'est quoi qui genere les meilleures vidéos entre du wan et comfyui ? :hap:

Le 09 octobre 2025 à 01:45:02 :

Le 09 octobre 2025 à 01:43:29 Fuh a écrit :

Le 09 octobre 2025 à 01:38:29 :

Le 09 octobre 2025 à 01:32:13 Fuh a écrit :

Le 08 octobre 2025 à 15:04:58 :
Question concernant ComfyUI et les lora, j'ai l'interface configurée pour image to video
https://image.noelshack.com/fichiers/2025/41/3/1759928505-image.png
Si j'ai téléchargé plusieurs Loras comment je les place dans ce workflow?

la logique me dit de faire comme ca dans l'ordre de priorité, est-ce correcte?
https://image.noelshack.com/fichiers/2025/41/3/1759928634-image.png

Dites moi svp, merci :)

La logique est bonne mais ne l'est pas pour l'utilisation des lora Lightx2v.

Dans tes Ksampler tu devrais mettre le nombre de steps à 4
CFG à 1 si tu mets plus ça sert à rien d'utiliser les lora Lightx2v.
Start at step 1, end at step 2
Start at step 2, end at 4 = les 4 étapes sont bien la dans les deux Ksampler.

Tips 1 : Si tu veux pas temmerder à mettre plein de nodes pour chaques lora tu peux utiliser Power Lora Loader the rgthree.

Tips 2 : tu peux tester des versions gguf de wan 2.2 se rapprochant + de la version fp16 à partir de la Q6_K. Je les préfère à la version FP8 scaled.

Tips 3 : renseigne toi pour triton et sage attention (optimisation et gain de rapidité) , si ta carte graphique est compatible.

Tips 4 : si tu constates que tes résultats vidéo sont trop lent, vois pour changer ta version Lightx2v actuelle par celle ci https://huggingface.co/Kijai/WanVideo_comfy/blob/main/Lightx2v/lightx2v_T2V_14B_cfg_step_distill_v2_lora_rank64_bf16.safetensors

Les versions Lightx2v actuelle pour wan 2.2 i2v ont quelques souci et apparemment la version t2v de wan 2.1 marche beaucoup mieux sur WAN 2.2 . Tu peux mettre le strength en 2.0 pour le high et 1.5 pour low.

Aussi passe tes étape en 6. Donc start at step 1 puis end 3 puis start 3 puis end 6 dans tes Ksampler.

Tips 5 : étant donné qu'on utilise un CFG à 1 pour utiliser les lora Lightx2v, ce qui empêche le bon fonctionnement des prompts négatif, il est vivement conseillé d'utiliser le node WanVIdeoNAG. (certains le connectent même au positif il paraît que c'est encore mieux.)

https://image.noelshack.com/fichiers/2017/11/1489850295-denis-ah.png

J'eusse répondu sur mes anciennes connaissances quasi uniquement sur les images https://image.noelshack.com/fichiers/2017/30/4/1501187858-risitassebestreup.png

1 mois que j'utilise wan 2.2. J'ai du me forcer à apprendre comfyUI, maintenant je surkiff cet UI.

Je me suis pris d'ailleurs un nvme 2to pour charger les modèles et optimiser loffload vers la ram (wan 2.2 c'est pas même le trip que sdxl) . Malgré mes 12go de vram c'est putain de rapide une fois tout optimisé.

ComfyUI >>>>>>> ALL

Je l'ai toujours dit https://image.noelshack.com/fichiers/2018/27/4/1530827992-jesusreup.png

Tellement de souplesse, de possibilités, de personnalisation... https://image.noelshack.com/fichiers/2017/30/4/1501187858-risitassebestreup.png

Pour sdxl je reste toujours sur Forge car j'ai une technique bien rodé dessus que je peux pas reproduire sur comfy. Mais pour le reste c'est comfy. Notamment wan 2.2 (je me sert aussi de wan pour faire de lupscale et deblur, c'est super puissant) et qwen image / image edit. J'en ai totalement rien à faire de flux.

Le 09 octobre 2025 à 01:45:36 spermedetortue9 a écrit :

Le 09 octobre 2025 à 01:44:06 :

Le 09 octobre 2025 à 01:40:13 spermedetortue9 a écrit :
du coup stable diffusion c'est que des images et wan c'est les vidéos ?

Grosso-merdo...

En fait, Stable Diffusion, c'est un modèle (en fait plusieurs version d'un modèle), mais beaucoup d'autres groupes/entreprises ont développé d'autres modèles, aussi bien images que vidéos...

Et plus seulement du T2I (Text To Image), mais aussi du I2I (Image To Image), du I2V (Image To Video), et même du S2V (Sound To Video) https://image.noelshack.com/fichiers/2017/30/4/1501187858-risitassebestreup.png

ok ok merci :hap:

Et c'est quoi qui genere les meilleures vidéos entre du wan et comfyui ? :hap:

Wan, c'est un modèle, "une IA" de génération d'image...

ComfyUI, c'est juste une interface qui permet d'utiliser Wan (et d'autres modèles de génération d'images/vidéos) pour générer des images/vidéos (en gros, c'est un logiciel qui permet d'utiliser un modèle de génération d'images/vidéos), comme l'est A1111, Forge, etc... et autres dérivés ("fork") https://image.noelshack.com/fichiers/2017/30/4/1501187858-risitassebestreup.png

Perso j'utilise stable diffusion avec ZLUDA pour générer avec ma 7900 xt
Illutrous en modèle :oui:

Le 09 octobre 2025 à 01:50:41 :

Le 09 octobre 2025 à 01:45:36 spermedetortue9 a écrit :

Le 09 octobre 2025 à 01:44:06 :

Le 09 octobre 2025 à 01:40:13 spermedetortue9 a écrit :
du coup stable diffusion c'est que des images et wan c'est les vidéos ?

Grosso-merdo...

En fait, Stable Diffusion, c'est un modèle (en fait plusieurs version d'un modèle), mais beaucoup d'autres groupes/entreprises ont développé d'autres modèles, aussi bien images que vidéos...

Et plus seulement du T2I (Text To Image), mais aussi du I2I (Image To Image), du I2V (Image To Video), et même du S2V (Sound To Video) https://image.noelshack.com/fichiers/2017/30/4/1501187858-risitassebestreup.png

ok ok merci :hap:

Et c'est quoi qui genere les meilleures vidéos entre du wan et comfyui ? :hap:

Wan, c'est un modèle, "une IA" de génération d'image...

ComfyUI, c'est juste une interface qui permet d'utiliser Wan (et d'autres modèles de génération d'images/vidéos) pour générer des images/vidéos (en gros, c'est un logiciel qui permet d'utiliser un modèle de génération d'images/vidéos), comme l'est A1111, Forge, etc... et autres dérivés ("fork") https://image.noelshack.com/fichiers/2017/30/4/1501187858-risitassebestreup.png

aaah ok donc grosso modo wan= python, comfyui=pycharm ? :hap:

Données du topic

Auteur
KillerJamme
Date de création
2 avril 2025 à 10:38:14
Nb. messages archivés
510
Nb. messages JVC
501
Voir le topic sur JVC

Afficher uniquement les messages de l'auteur du topic

En ligne sur JvArchive

JvArchive compagnon

Découvrez JvArchive compagnon , l'userscript combattant la censure abusive sur le 18-25 !