Übersetzung erstellen

curl -X POST "https://api.aisonar.dev/v1/audio/translations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@german_audio.mp3" \
  -F "model=whisper-1"

{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}

Überblick

Übersetzt Audio in jeder unterstützten Sprache in englischen Text. Im Gegensatz zur Transkription gibt dieser Endpoint unabhängig von der Eingabesprache immer englischen Text aus.

Anfragekörper

Timeout für synchrone Anfragen: Dieser Nicht-Chat-Endpunkt wartet, bis das geroutete Modell fertig ist. Große Eingaben, lange Audiodateien oder große Batches können übliche 30s-Client-Defaults überschreiten; setzen Sie das Timeout Ihres HTTP-Clients daher auf mindestens 120s.

file

erforderlich

Die Audio-Datei, die übersetzt werden soll. Unterstützte Formate: flac, mp3, mp4, mpeg, mpga, m4a, ogg, wav, webm. Die maximale Dateigröße beträgt 25 MB.

model

string

Standard:"whisper-1"

Das zu verwendende Modell. Derzeit wird nur whisper-1 unterstützt.

prompt

string

Ein optionaler Text, um den Stil des Modells zu steuern oder ein vorheriges Segment fortzusetzen. Sollte auf Englisch sein.

response_format

string

Standard:"json"

Das Format der Ausgabe. Optionen: json, text, srt, verbose_json, vtt.

temperature

number

Die Sampling-Temperatur zwischen 0 und 1. Höhere Werte wie 0.8 erzeugen zufälligere Ausgaben, während niedrigere Werte wie 0.2 die Ausgabe fokussierter und deterministischer machen.

Antwort

text

string

Der übersetzte Text auf Englisch.

Für das Format verbose_json enthält die Antwort außerdem:

language

string

Die erkannte Sprache des Eingabe-Audios.

duration

number

Die Dauer des Eingabe-Audios in Sekunden.

segments

array

Segmente des übersetzten Textes mit Zeitstempeln.

curl -X POST "https://api.aisonar.dev/v1/audio/translations" \
  -H "Authorization: Bearer sk-your-api-key" \
  -F "file=@german_audio.mp3" \
  -F "model=whisper-1"

{
  "text": "Hello, my name is Wolfgang and I come from Germany. Where are you from?"
}

Übersetzung vs. Transkription

Funktion	Übersetzung	Transkription
Ausgabesprache	Immer Englisch	Gleich wie die Eingabe
Anwendungsfall	Fremdsprachiges Audio in Englisch umwandeln	Originalsprache beibehalten
Sprachparameter	Nicht anwendbar	Optionaler Hinweis

Der Übersetzungs-Endpoint erkennt die Ausgangssprache automatisch und übersetzt ins Englische. Der language-Parameter aus der Transkription wird ignoriert.

Transkription erstellen Realtime WebSocket

⌘I

​Überblick

​Anfragekörper

​Antwort

​Übersetzung vs. Transkription

Überblick

Anfragekörper

Antwort

Übersetzung vs. Transkription