[Sammelthread] AI - Bildgenerierung (Stable Diffusion, Midjourney & Co)

@samuelclemens Ja und Nein. LTX kann das durchaus, da es beides Unterstützt. Aber ich finde T2I mit Flux und mit T2V/I2V in Kombi auf LTX/WAN dann Animieren. Flux für Video wäre Useless ^^
Ergänzung ()

Hier mal ein Zwischenstand zu WAN 2.2

Videogenerierung dauert durchaus länger. Hat aber Vorteile weil Bewegungen weitaus besser verlaufen als bei LTX. Wie @Keuleman immer schon sagte, LTX ist King bei ruhigen Videos, weil es eben auch echt Flott ist in der Generierung, und auch Gesichtszüge sehr gut hinbekommt. Aber WAN kann sogar Ballerei ganz gut. Kampfsituationen muss man extrem Nachbearbeiten um es perfekt hinzubekommen.

Da ich aber auch total auf Kampfszenen und Ballerei stehe, werde ich mal größere Modells via Cloudpower testen. Für Shorts/Reels und kurze/knackige Image bzw Werbevideos ist Flux/LTX und ChatGPT (gutes Image Modell) echt eine Solide Kombi.
 

Anhänge

Zuletzt bearbeitet:
  • Gefällt mir
Reaktionen: samuelclemens
@Keuleman Wie kann man in dein Dinoworkflow ein Node für ein Startframe korrekt einbinden?
Ohne ist es kaum möglich mehrere Szenen mit Kontinuität zu erzeugen. Egal wie exakt das Prompt ist, es kommt immer was anderes raus.

Für das Audio bräuchte man auch noch ein Node mit dem man Stimmproben hunzufügen kann damit sprecher immer gleich klingen!
 
Jetzt bist Du an der schwierigen Stelle der KI gekommen. Da gehe ich folgenden Weg: Bild, Person oder Gegenstand oder... rein editieren, das dann als Startframe für LTX 2.3 image to video. Es gibt auch Workflows mit keyframes, ich habe bis heute keinen lauffähig bekommen leider. Sprache generiere ich separat, die nehme ich dann für LTX als audio to video Grundlage (bzw. noch genauer audio und image to video). So zum Beispiel bei Manuela ;-D Oder aber Du fängst an, eigene LORA zu trainieren für LTX, da bin ich selber (noch) raus.
 
  • Gefällt mir
Reaktionen: samuelclemens
@samuelclemens
Stimmprobe hinzufügen ist damit möglich. (unter dem Video ist alles verlinkt, inkl. wf mit i2v/t2v switch)
 
  • Gefällt mir
Reaktionen: chr1zZo und samuelclemens
Jo, gibt ja sogar ein Standard-ID-Lora Template aber leider weniger als 40% brauchbare Ergebnisse bei mir.
 
Guten Morgen :)

so fühl ich mich heut...

ai_monkey_3.png
 
  • Gefällt mir
Reaktionen: chr1zZo
Stress' Dich nicht!
 

Anhänge

  • Ideogram_4.0_00036_.png
    Ideogram_4.0_00036_.png
    1,6 MB · Aufrufe: 15
  • Gefällt mir
Reaktionen: chr1zZo und qualle
Da ich mich ja auch mit dem EU AI Act beschäftige der ja bald eine neue Version im Herbst bekommt und mich auch mit Voice Kloning usw. beschäftige stelle ich mir folgende Fragen:

- Ich sehe viele YT sowie Insta Kanäle die Deutsche Sync Stimmen von Hollywood Schauspielern nutzen, sowie deren Person (Gesicht), sagen wir Qui-Gonn (Liam Neeson) oder Chuck Norris. Ich vermute das sich früher oder später Kanzleien darauf stürzen werden (Die dies aktuell gerne bei Musik tun die Gewerbetreibene in den Reels genutzt haben, erst Recht wenn Personen damit A. Geld erwirtschaften B. das Gewerblich nutzen.

Jetzt schwirt noch viel Content rum und wir erfreuen uns daran. Aber ich vermute keiner von denen hat die Einwilligung der Personen bekommen für AI Voice Training oder deren Gesicht verwenden zu dürfen ^^

Klar könnte man es unter "Parodie" einordnen, dennoch eine harte Grauzone.

Ich vermute da wird es Zeitnah wieder viele erwischen die dann teuer blechen müssen. Wie seht ihr das?
 
Zuletzt bearbeitet:
Entspannt. Ein 10 Sekunden LTX Video generiert, in der eine Person spricht nach genauen Vorgaben. Das nutze ich dann als Vorlage für Stimmen.
 
Moin...

ai_generated_image (1).jpg

Die Kanne rechts dampft ein wenig, obwohl ein Deckel drauf ist...

Leider ist SD nicht immer physikalisch ganz korrekt bzw. realistisch, auch wenn man es vorher sagt.
 
Zurück
Oben