Genel Bakış
Desteklenen herhangi bir dildeki sesi İngilizce metne çevirir. Transkripsiyondan farklı olarak, bu endpoint girdi dilinden bağımsız olarak her zaman İngilizce metin çıktısı üretir.İstek Gövdesi
Senkron istek zaman aşımı: Bu chat dışı endpoint, yönlendirilen modelin tamamlanmasını bekler. Büyük girdiler, uzun sesler veya büyük batch’ler yaygın 30s istemci varsayılanlarını aşabilir; bu yüzden HTTP istemcisi zaman aşımını en az120s olarak ayarlayın.
Çevrilecek ses dosyası. Desteklenen formatlar:
flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. Maksimum dosya boyutu 25 MB’dir.Kullanılacak model. Şu anda yalnızca
whisper-1 desteklenmektedir.Modelin stilini yönlendirmek veya önceki bir segmenti devam ettirmek için isteğe bağlı bir metin. İngilizce olmalıdır.
Çıktının formatı. Seçenekler:
json, text, srt, verbose_json, vtt.0 ile 1 arasında örnekleme temperature değeri. 0.8 gibi daha yüksek değerler daha rastgele çıktı üretirken, 0.2 gibi daha düşük değerler çıktıyı daha odaklı ve deterministik hale getirir.
Yanıt
İngilizceye çevrilmiş metin.
verbose_json formatı için, yanıt ayrıca şunları içerir:
Girdi sesinin algılanan dili.
Girdi sesinin saniye cinsinden süresi.
Zaman damgalarıyla birlikte çevrilmiş metin segmentleri.
Çeviri vs Transkripsiyon
| Özellik | Çeviri | Transkripsiyon |
|---|---|---|
| Çıktı dili | Her zaman İngilizce | Girdi ile aynı |
| Kullanım durumu | Yabancı dildeki sesi İngilizceye dönüştürme | Orijinal dili koruma |
| Dil parametresi | Uygulanamaz | İsteğe bağlı ipucu |
Çeviri endpoint’i kaynak dili otomatik olarak algılar ve İngilizceye çevirir. Transkripsiyondaki
language parametresi yok sayılır.