Genel bakış
AI Sonar video oluşturmayı tek bir birleşik API üzerinden sunar. Üretim asenkron olarak çalışır: istek gönderirsiniz,task_id ve poll_url alırsınız, ardından nihai sonuç hazır olana kadar durumu düzenli olarak sorgularsınız.
Kullanılabilirlik ve polling
Eğer oluşturma yanıtıpoll_url döndürüyorsa, doğrudan o adresi kullanın. Bu URL /v1/tasks/{id} ise, bunu video işleri için kanonik durum uç noktası olarak kabul edin; /v1/videos/generations/{id} yalnızca geriye dönük uyumluluk içindir.
Güncel herkese açık video modeli envanterini Models API üzerinden veya modeller sayfasında görebilirsiniz.
Model ve medya davranışı
Ses davranışı modele bağlıdır. AI Sonar’daoutput_audio gönderilmezse Veo 3 ailesi varsayılan olarak sesi açık kabul eder. Diğer herkese açık modeller sessiz olabilir ya da kararlı bir ses anahtarı sunmayabilir.
Üretim entegrasyonlarında görsel, video ve ses girdileri için herkese açık https URL’lerini tercih edin. Uyumlu modeller data: URL’lerini kabul etmeye devam eder, ancak herkese açık URL’ler yeniden deneme, gözlemlenebilirlik ve hata ayıklama açısından daha sağlamdır.
Asenkron akış
Güncel herkese açık işlemler
AI Sonar’nın güncel herkese açık video sözleşmesi şu işlemlere odaklanır:text-to-videoimage-to-videoreference-to-videostart-end-to-videovideo-to-videomotion-control
audio-to-video ve video-extension değerlerini de kabul eder, ancak bu doküman derlemesinde geniş şekilde etkinleştirilmiş herkese açık model listesinde bu iki yeteneği açıkça sunan bir model yoktur.
Yetenek matrisi
Gösterim: ✅ Bu sağlayıcı ailesinde ilgili yeteneğe sahip en az bir etkin herkese açık model var | ❌ Etkin herkese açık modellerde şu anda temsil edilmiyor| Seri | T2V | I2V | Referans | İlk-Son | V2V | Hareket |
|---|---|---|---|---|---|---|
| OpenAI | ✅ | ✅ | ❌ | ❌ | ❌ | ❌ |
| Kuaishou | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| ✅ | ✅ | ✅ | ✅ | ❌ | ❌ | |
| ByteDance | ✅ | ✅ | ❌ | ❌ | ❌ | ❌ |
| MiniMax | ✅ | ✅ | ❌ | ❌ | ❌ | ❌ |
| Alibaba | ✅ | ✅ | ✅ | ❌ | ❌ | ❌ |
| Shengshu | ✅ | ✅ | ✅ | ✅ | ❌ | ❌ |
| xAI | ✅ | ✅ | ❌ | ❌ | ✅ | ❌ |
| Diğer | ❌ | ❌ | ❌ | ❌ | ✅ | ❌ |
Yetenek tanımları
- T2V (Text-to-Video): metin prompt’undan video üretme
- I2V (Image-to-Video): başlangıç görselinden video üretme; en geniş uyumluluk için
image_urlönerilir - Referans:
reference_imagesile bir veya daha fazla referans görsel üzerinden koşullandırma - İlk-Son:
start_imageveend_imageile ilk ve son kareyi kontrol etme - V2V (Video-to-Video): mevcut bir videoyu birincil girdi olarak kullanma
- Hareket: özne görseli ile hareket referans videosunu birlikte kullanma
Güncel herkese açık model envanteri
Kuaishou
| Model | Herkese açık işlemler |
|---|---|
kling-3.0-motion-control | Hareket kontrolü |
kling-3.0-video | Metinden videoya, image-to-video, start-end-to-video, element referansları |
kling-v2.1-master | Metinden videoya, image-to-video |
kling-v2.1-pro | image-to-video, start-end-to-video |
kling-v2.1-standard | image-to-video |
kling-v2.5-turbo-pro | Metinden videoya, image-to-video, start-end-to-video |
kling-v2.5-turbo-std | Metinden videoya, image-to-video |
kling-v2.6-pro | Metinden videoya, image-to-video, start-end-to-video |
kling-v2.6-std | Metinden videoya, image-to-video |
kling-v3.0-pro | Metinden videoya, image-to-video, start-end-to-video |
kling-v3.0-std | Metinden videoya, image-to-video, start-end-to-video |
kling-video-o1-pro | Metinden videoya, image-to-video, reference-to-video, start-end-to-video, video-to-video |
kling-video-o1-std | Metinden videoya, image-to-video, reference-to-video, start-end-to-video, video-to-video |
| Model | Herkese açık işlemler |
|---|---|
veo3 | Metinden videoya, image-to-video |
veo3-fast | Metinden videoya, image-to-video |
veo3-pro | Metinden videoya, image-to-video |
veo3.1 | Metinden videoya, image-to-video, reference-to-video, start-end-to-video |
veo3.1-fast | Metinden videoya, image-to-video, reference-to-video, start-end-to-video |
veo3.1-pro | Metinden videoya, image-to-video, start-end-to-video |
ByteDance
| Model | Herkese açık işlemler |
|---|---|
seedance-1.5-pro | Metinden videoya, image-to-video |
MiniMax
| Model | Herkese açık işlemler |
|---|---|
hailuo-2.3-fast | Görüntüden videoya |
hailuo-2.3-pro | Metinden videoya, image-to-video |
hailuo-2.3-standard | Metinden videoya, image-to-video |
Alibaba
| Model | Herkese açık işlemler |
|---|---|
wan-2.2-plus | Metinden videoya, image-to-video |
wan-2.5 | Metinden videoya, image-to-video |
wan-2.6 | Metinden videoya, image-to-video, reference-to-video |
Shengshu
| Model | Herkese açık işlemler |
|---|---|
viduq2 | Metinden videoya, reference-to-video |
viduq2-pro | Görüntüden videoya, referanstan videoya, başlangıç-bitişten videoya |
viduq2-pro-fast | Görüntüden videoya, başlangıç-bitişten videoya |
viduq2-turbo | Görüntüden videoya, başlangıç-bitişten videoya |
viduq3-pro | Metinden videoya, image-to-video, start-end-to-video |
viduq3-turbo | Metinden videoya, image-to-video, start-end-to-video |
xAI
| Model | Herkese açık işlemler |
|---|---|
grok-imagine-video | Metinden videoya, görüntüden videoya, reference-to-video, video-to-video |
grok-imagine-video-1.5-preview | Görüntüden videoya |
grok-imagine-image-to-video | Görüntüden videoya |
grok-imagine-text-to-video | Metinden videoya |
grok-imagine-upscale | Videodan videoya |
Diğer
| Model | Herkese açık işlemler |
|---|---|
topaz-video-upscale | Videodan videoya |
Kullanım örnekleri
Text-to-video
Görselden videoya
Kling 3.0 Elements
Öğe referanslarına ihtiyacınız olduğundakling_elements alanını kling-3.0-video ile kullanın. Görüntü koşullu bir istek (image_url, image_urls, start_image veya end_image) sağlayın ve prompt içinde her öğeyi @name ile referanslayın. kling_elements ile output_audio=true birlikte kullanılamaz; öğe referanslı isteklerde output_audio alanını kaldırın veya false yapın.
Reference-to-video
seedance-2.0 ve seedance-2.0-fast için AI Sonar şu anda en fazla 9 referans görseli, ayrıca en fazla 3 referans video ve 3 referans sesi destekler. duration yalnızca üretilen çıktının süresini kontrol eder; referans video girdisi için ayrı bir süre sınırı tanımlamaz. grok-imagine-video için reference-to-video en fazla 7 görüntü referansı (reference_images veya image_urls) kabul eder ve duration en fazla 10 saniyedir. Referans görüntüleri image_url / image ilk kare girdileriyle birlikte göndermeyin. grok-imagine-video-1.5-preview yalnızca image-to-video destekler.
Start-end-to-video
Videodan videoya
grok-imagine-video video-to-video için video_url içinde herkese açık HTTPS .mp4 URL gönderin. AI Sonar bunu xAI REST video.url gövdesine çevirir. resolution için 480p veya 720p gönderebilirsiniz; bu düzenleme akışı duration ve aspect_ratio kabul etmez.
Motion control
Parametre referansı
| Parametre | Tür | Not |
|---|---|---|
operation | string | Üretimde açıkça göndermeniz önerilir |
image_url | string | Görsel girdileri için en sağlam biçim |
image | string | Yerel testler ve küçük entegrasyonlar için data: URL |
reference_images | string[] | Referans görsel koşullandırması için kanonik herkese açık alan |
reference_image_type | string | İsteğe bağlı asset / style seçicisi |
video_url | string | Güncel herkese açık video-to-video ve motion-control modelleri için gereklidir |
audio_url | string | Uygun olduğunda modele özgü ses koşullu akışlarda kullanılır |
output_audio | boolean | Veo 3 ailesi alan gönderilmezse true kabul eder. kling-3.0-video bu seçiciyi upstream sound kontrolü için kabul eder ve alan atlanırsa sessizdir. |
Hızlı model seçimi rehberi
En yüksek kalite
Kalite hızdan daha önemliyse veo3.1-pro, kling-video-o1-pro ve viduq3-pro güçlü seçeneklerdir.
Hızlı iterasyon
Hızlı denemeler için veo3.1-fast, hailuo-2.3-fast ve viduq3-turbo iyi başlangıç noktalarıdır.
Referans ağırlıklı akışlar
Özel referans görsel kontrolü gerekiyorsa veo3.1, veo3.1-fast, wan-2.6 veya kling-video-o1-pro / std ile başlayın.
Videodan videoya
Şu anda genel olarak etkin herkese açık
video-to-video yolları ağırlıklı olarak topaz-video-upscale, grok-imagine-upscale ve kling-video-o1-pro / std modellerini kapsar.