Zum Inhalt springen
📄 Audio & Video KI – Suno, ElevenLabs, Sora, Runway

Audio & Video KI-Modelle

🎵 Audio & Musik

Suno v4

Musikgenerierung aus Textbeschreibung. Erstelle komplette Songs mit Gesang in Sekunden.

  • Preis: Free (10 Songs/Tag) oder Pro ab $10/Mo
  • Stärke: Beeindruckende Qualität, viele Genres

ElevenLabs

Text-zu-Sprache mit extrem natürlichen Stimmen. Voice Cloning möglich.

  • Preis: Free (10k Zeichen/Mo) oder ab $5/Mo
  • Stärke: Realistische Stimmen, mehrsprachig, Dubbing

Whisper (OpenAI)

Sprache-zu-Text Transkription. Open Source, extrem genau.

  • Preis: Kostenlos (Open Source) oder $0.006/Min via API
  • Stärke: Beste Transkription am Markt, 99 Sprachen

🎬 Video

Sora (OpenAI)

Text-zu-Video Generierung. Erstelle realistische Videos aus Textbeschreibungen.

  • Preis: In ChatGPT Plus/Pro
  • Stärke: Hohe Qualität, physikalisch plausibel

Runway Gen-3 Alpha

Video-Editing und -Generierung. Bild-zu-Video, Text-zu-Video, Inpainting.

  • Preis: Ab $15/Mo
  • Stärke: Professionelle Video-Workflows, Motion Brush

Veo 2 (Google)

Googles Videogenerierung. Hochwertige, längere Clips.

  • Preis: In Google-Produkten verfĂĽgbar
  • Stärke: Lange Clips, konsistente Qualität

đź’ˇ Empfehlung

Für den Einstieg: Suno (Musik) + ElevenLabs (Sprache) + Sora (Video). Alle bieten kostenlose Einstiegspläne.