요청 본문
대화를 구성하는 메시지 목록입니다.각 메시지 객체는 다음을 포함합니다:
role(string):system,user, 또는assistantcontent(string | array): 메시지 내용
content가 배열인 경우, AI Sonar는 호환되는 모델에 대해 구조화된 멀티모달 블록을 지원합니다:- text:
{ "type": "text", "text": "..." } - 이미지:
{ "type": "image_url", "image_url": { "url": "https://..." } } - 비디오:
{ "type": "video_url", "video_url": { "url": "https://..." } } - 오디오:
{ "type": "audio_url", "audio_url": { "url": "https://..." } }
https URL을 우선 사용하세요. AI Sonar는 이러한 미디어 블록을 라우팅된 물리적 모델에서 요구하는 제공자별 요청 형식으로 변환합니다.0과 2 사이의 샘플링 온도입니다. 값이 높을수록 출력이 더 무작위적입니다.
생성할 최대 토큰 수입니다.
true로 설정하면 부분 메시지 델타가 SSE 이벤트로 전송됩니다.
스트리밍 옵션입니다. 스트림 청크에서 토큰 사용량을 받으려면
include_usage: true로 설정하세요.Nucleus 샘플링 파라미터입니다. 온도 또는 top_p 중 하나만 조정하는 것을 권장합니다.
-2.0에서 2.0 사이의 숫자입니다. 양수 값은 반복되는 토큰에 페널티를 부과합니다.
-2.0에서 2.0 사이의 숫자입니다. 양수 값은 이미 텍스트에 있는 토큰에 페널티를 부과합니다.
API가 토큰 생성을 중단할 최대 4개의 시퀀스입니다.
모델이 호출할 수 있는 도구 목록입니다 (함수 호출).
모델이 도구를 사용하는 방식을 제어합니다. 옵션:
auto, none, required, 또는 특정 도구 객체.병렬 함수 호출을 활성화할지 여부입니다. 함수를 순차적으로 호출하려면 false로 설정하세요.
완성에 대한 최대 토큰 수입니다.
max_tokens의 대안으로, 추론이 가능한 최신 모델군에서 유용합니다.추론 지원 모델에 대한 추론 노력 수준입니다. 옵션:
low, medium, high.결정론적 샘플링을 위한 랜덤 시드입니다.
생성할 완성 수 (1-128).
로그 확률을 반환할지 여부입니다.
반환할 상위 로그 확률의 수 (0-20).
logprobs: true가 필요합니다.Top-K 샘플링 파라미터입니다 (Anthropic/Gemini 모델용).
응답 형식 명세입니다. JSON 모드에서는
{"type": "json_object"}를 사용하세요. {"type": "json_schema", "json_schema": {...}}는 선택한 모델 및 라우팅 동작에 따라 최선의 노력으로 처리되는 경로로 간주하세요.특정 토큰이 나타날 확률을 수정합니다. 토큰 ID(문자열로)를 -100에서 100 사이의 bias 값으로 매핑하세요.
오용 모니터링을 위해 귀하의 최종 사용자를 나타내는 고유 식별자입니다.
응답
완성에 대한 고유 식별자입니다.
항상
chat.completion입니다.완성이 생성된 Unix 타임스탬프입니다.
완성에 사용된 모델입니다.
완성 선택지 목록입니다.각 선택지는 다음을 포함합니다:
index(integer): 선택지의 인덱스message(object): 생성된 메시지finish_reason(string): 모델이 중단된 이유 (stop,length,tool_calls)
토큰 사용 통계입니다.
prompt_tokens(integer): 프롬프트의 토큰 수completion_tokens(integer): 완성의 토큰 수total_tokens(integer): 사용된 총 토큰 수