Audio & Speech Models

Speech-to-text, text-to-speech, and audio processing models.

28 Models

Show only MB certified models

Compare Model Creator Context Length Input Price Output Price Image Generation Video Generation Open Weight

Codex Security	OpenAI	1050000 tokens	text: $2.5	text: $15	-	-	No
Gemini 2.5 Flash Native Audio	Google	131072 tokens	-	-	-	-	No
Gemini 2.5 Flash Preview TTS	Google	8192 tokens	-	-	-	-	No
Gemini 2.5 Pro Preview TTS	Google	8192 tokens	-	-	-	-	No
Gemini 3.1 Flash Live	Google	-	-	-	-	-	No
Gemini 3.1 Flash TTS	Google	-	-	-	-	-	No
Gemini 3.5 Live Translate	Google	-	-	-	-	-	No
GPT-4o Audio Preview	OpenAI	128000 tokens	audio: $40 text: $2.5	audio: $80 text: $10	-	-	No
GPT-4o Mini Audio Preview	OpenAI	128000 tokens	audio: $10 text: $0.15	audio: $20 text: $0.6	-	-	No
GPT-4o Mini Realtime Preview	OpenAI	16000 tokens	audio: $10 text: $0.6	audio: $20 text: $2.4	-	-	No
GPT-4o Mini Transcribe	OpenAI	16000 tokens	audio: $1.25	audio: $5	-	-	No
GPT-4o Mini TTS	OpenAI	2000 tokens	text: $0.6	audio: $12	-	-	No
GPT-4o Realtime Preview	OpenAI	32000 tokens	audio: $40 text: $5	audio: $80 text: $20	-	-	No
GPT-4o Transcribe	OpenAI	16000 tokens	audio: $2.5	audio: $10	-	-	No
GPT-4o Transcribe Diarize	OpenAI	16000 tokens	audio: $2.5	audio: $10	-	-	No
GPT-5.3 Instant	OpenAI	400000 tokens	text: $1.75	text: $14	-	-	No
GPT-Audio	OpenAI	128000 tokens	audio: $32 text: $2.5	audio: $64 text: $10	-	-	No
GPT-Audio 1.5	OpenAI	128000 tokens	audio: $32 text: $2.5	audio: $64 text: $10	-	-	No
GPT-Audio Mini	OpenAI	128000 tokens	text: $0.6	text: $2.4	-	-	No
GPT-Realtime 1.5	OpenAI	32000 tokens	audio: $32 image: $5 text: $4	audio: $64 text: $16	-	-	No
GPT-Realtime 2	OpenAI	128000 tokens	audio: $32 image: $5 text: $4	audio: $64 text: $24	-	-	No
GPT-Realtime 2.1 Mini	OpenAI	128000 tokens	audio: $10 image: $0.8 text: $0.6	audio: $20 text: $2.4	-	-	No
GPT-Realtime Translate	OpenAI	16000 tokens	audio: $0.034	audio: $0.034	-	-	No
GPT-Realtime Whisper	OpenAI	16000 tokens	audio: $0.017	-	-	-	No
Lyria 3 Clip	Google	-	-	-	-	-	No
Lyria 3 Pro	Google	-	-	-	-	-	No
TTS-1	OpenAI	-	-	-	-	-	No
TTS-1 HD	OpenAI	0 tokens	text: $30	audio: $30	-	-	No