API simples para transcrição de áudio usando Groq e OpenAI Whisper.
- 🚀 Async: Processamento assíncrono para melhor performance
- 🔄 Multi-provider: Suporte a Groq e OpenAI
- 📝 Documentação: Swagger UI automática
- ⚙️ Configurável: Provider e modelo padrão configuráveis
- 🎵 Formatos: Suporte a múltiplos formatos de áudio
# Instalar UV (se não tiver)
pip install uv
# Instalar dependências
uv sync
# Configurar variáveis de ambiente
cp .env.example .env
# Edite o .env com suas API keys
Configure pelo menos uma API key no arquivo .env
:
GROQ_API_KEY=your_groq_api_key_here
OPENAI_API_KEY=your_openai_api_key_here
# Desenvolvimento
uv run uvicorn main:app --reload
# Produção
uv run uvicorn main:app --host 0.0.0.0 --port 8000
Lista todos os providers e modelos disponíveis.
Transcreve um arquivo de áudio.
Parâmetros:
file
: Arquivo de áudio (obrigatório)provider
: "groq" ou "openai" (opcional)model
: Modelo específico (opcional)
Formatos suportados: mp3, mp4, mpeg, mpga, m4a, wav, webm, flac, ogg
Tamanho máximo: 25MB
# Transcrição com provider padrão
curl -X POST "http://localhost:8000/transcribe" \
-F "[email protected]"
# Transcrição com provider específico
curl -X POST "http://localhost:8000/transcribe" \
-F "[email protected]" \
-F "provider=groq" \
-F "model=whisper-large-v3-turbo"
Acesse http://localhost:8000/docs
para a documentação interativa Swagger UI.