
Audio & Video KI-Modelle
🎵 Audio & Musik
Suno v4
Musikgenerierung aus Textbeschreibung. Erstelle komplette Songs mit Gesang in Sekunden.
- Preis: Free (10 Songs/Tag) oder Pro ab $10/Mo
- Stärke: Beeindruckende Qualität, viele Genres
ElevenLabs
Text-zu-Sprache mit extrem natürlichen Stimmen. Voice Cloning möglich.
- Preis: Free (10k Zeichen/Mo) oder ab $5/Mo
- Stärke: Realistische Stimmen, mehrsprachig, Dubbing
Whisper (OpenAI)
Sprache-zu-Text Transkription. Open Source, extrem genau.
- Preis: Kostenlos (Open Source) oder $0.006/Min via API
- Stärke: Beste Transkription am Markt, 99 Sprachen
🎬 Video
Sora (OpenAI)
Text-zu-Video Generierung. Erstelle realistische Videos aus Textbeschreibungen.
- Preis: In ChatGPT Plus/Pro
- Stärke: Hohe Qualität, physikalisch plausibel
Runway Gen-3 Alpha
Video-Editing und -Generierung. Bild-zu-Video, Text-zu-Video, Inpainting.
- Preis: Ab $15/Mo
- Stärke: Professionelle Video-Workflows, Motion Brush
Veo 2 (Google)
Googles Videogenerierung. Hochwertige, längere Clips.
- Preis: In Google-Produkten verfĂĽgbar
- Stärke: Lange Clips, konsistente Qualität
đź’ˇ Empfehlung
Für den Einstieg: Suno (Musik) + ElevenLabs (Sprache) + Sora (Video). Alle bieten kostenlose Einstiegspläne.