Skip to content

Miglioramento AI

Funzionalità Opzionale - Puoi Saltarla!

Questo passaggio è completamente opzionale. Vox funziona perfettamente senza il Miglioramento AI - le tue trascrizioni saranno già accurate. Configura questo solo se vuoi lucidare automaticamente le tue trascrizioni (correggere la grammatica, rimuovere parole di riempimento come "uhm" o "eh").

Se non sei sicuro di cosa sia o non vuoi configurarlo adesso, sentiti libero di passare alla sezione successiva!

Il Miglioramento AI usa l'intelligenza artificiale (come ChatGPT o Claude) per ripulire automaticamente le tue trascrizioni, rendendole più curate e professionali.

Cosa Fa il Miglioramento AI?

In termini semplici: Prende la tua trascrizione (che è già accurata) e la rende più professionale.

Esempio:

  • Prima dell'AI: "Uhm, quindi fondamentalmente, tipo, dobbiamo, eh, programmare una riunione per, sai, martedì prossimo"
  • Dopo l'AI: "Dobbiamo programmare una riunione per martedì prossimo"

Principali Vantaggi

  • Corregge la grammatica: Corregge gli errori automaticamente
  • Rimuove le parole di riempimento: Si libera di "uhm", "eh", "tipo", ecc.
  • Lo rende più pulito: Più professionale e facile da leggere
  • Mantiene il tuo significato: Il tuo messaggio originale rimane lo stesso

Ne Hai Bisogno?

Potresti volere il Miglioramento AI se:

  • Usi Vox per documenti o email professionali
  • Vuoi trascrizioni curate senza modifiche
  • Sei a tuo agio nell'usare servizi AI (come ChatGPT)

NON hai bisogno del Miglioramento AI se:

  • Stai solo prendendo appunti veloci per te stesso
  • Preferisci la privacy completa (il Miglioramento AI invia testo a servizi esterni)
  • Non ti dispiace modificare le trascrizioni manualmente
  • Non sai cos'è una "chiave API"

Nota sulla Privacy

Il tuo audio non lascia mai il tuo dispositivo. Solo la trascrizione testuale viene inviata al servizio AI che scegli. Se vuoi privacy completa, lascia il Miglioramento AI disabilitato.

Come Configurarlo

Requisiti

Per usare il Miglioramento AI, hai bisogno di:

  1. Un account con un servizio AI (come OpenAI, Anthropic, AWS, ecc.)
  2. Una chiave API (pensala come una password per il servizio AI)
  3. Pochi dollari per i costi AI (di solito $0,01-0,05 per trascrizione)

Prossimamente: Stiamo lavorando su un'opzione a pagamento integrata così non dovrai configurarla tu stesso.

Impostazioni Miglioramento AI

Passo 1: Aprire le Impostazioni Miglioramento AI

  1. Apri le impostazioni di Vox
  2. Clicca su Miglioramento AI nella barra laterale
  3. Attiva Migliora le Mie Trascrizioni con l'AI

Miglioramento AI Abilitato

Passo 2: Scegliere il Tuo Fornitore AI

Seleziona un servizio AI dal menu a discesa. Opzioni popolari:

  • OpenAI (ChatGPT) - Il più popolare, facile da usare
  • Anthropic (Claude) - Buona qualità, orientato alla privacy
  • AWS Bedrock - Per utenti avanzati
  • Ollama - Esegui l'AI localmente (gratuito, ma richiede configurazione)

Passo 3: Aggiungere la Tua Chiave API

  1. Ottieni una chiave API dal tuo fornitore scelto (vedi le sezioni dei fornitori di seguito)
  2. Incollala nel campo Chiave API
  3. Clicca su Testa Connessione per assicurarti che funzioni

Prima Volta?

Se non hai mai usato API AI prima, consigliamo di iniziare con OpenAI (ChatGPT). Hanno prezzi chiari ($0,002 per richiesta) e buona documentazione.

Fornitori Supportati

Menu a Discesa Fornitori

Vox supporta più fornitori AI. Clicca sul menu a discesa Fornitore per selezionare:

AWS Bedrock

Migliore per: Uso in produzione, ambienti aziendali, varietà di modelli

Configurazione AWS Bedrock

Configurazione:

Regione

  • Seleziona la tua regione AWS (es.: eu-west-1)
  • Scegli una regione vicina a te per latenza ridotta

Profilo AWS

  • Inserisci il nome del tuo profilo AWS (es.: sso-bedrock)
  • Usa le credenziali AWS CLI configurate sul tuo sistema

ID Chiave di Accesso

  • Opzionale: Inserisci la tua chiave di accesso AWS
  • Richiesto se non si usano profili AWS CLI
  • Formato: AKIA... (20 caratteri)

Chiave di Accesso Segreta

  • Opzionale: Inserisci la tua chiave di accesso segreta
  • Richiesto se non si usano profili AWS CLI
  • Archiviata in modo sicuro nel Portachiavi macOS / Gestore credenziali di Windows

ID Modello

  • Specifica il modello Bedrock da usare
  • Esempio: global.anthropic.claude-haiku-4-5-20251101-v1:0
  • Vedi Modelli AWS Bedrock

Configurazione AWS

AWS Bedrock richiede:

  1. Un account AWS con accesso a Bedrock
  2. Autorizzazioni IAM per il modello selezionato
  3. AWS CLI configurato con SSO o chiavi di accesso

DeepSeek

Migliore per: Miglioramento AI conveniente, buone prestazioni

Configurazione DeepSeek

Configurazione:

Chiave API

  • Ottieni una chiave API su DeepSeek
  • Archiviata in modo sicuro nel Portachiavi macOS / Gestore credenziali di Windows

Modello

Endpoint

  • Predefinito: https://api.deepseek.com
  • Cambia solo se si usa un endpoint personalizzato

Microsoft Foundry

Migliore per: Utenti Azure, integrazione aziendale

Configurazione:

  • Simile ad AWS Bedrock
  • Richiede abbonamento Azure e accesso a Foundry
  • Usa l'autenticazione Azure

OpenAI

Migliore per: Modelli GPT di alta qualità, configurazione più semplice

Configurazione:

  • Chiave API: Ottieni da OpenAI Platform
  • Modello: gpt-4, gpt-4-turbo, gpt-3.5-turbo, ecc.
  • Endpoint: Predefinito https://api.openai.com/v1

GLM (Zhipu AI)

Migliore per: Trascrizione in lingua cinese, utenti Asia-Pacifico

Configurazione:

  • Chiave API: Ottieni da Zhipu AI
  • Modello: glm-4, glm-4-air, ecc.

Anthropic

Migliore per: Modelli Claude con alta capacità di ragionamento

Configurazione:

  • Chiave API: Ottieni da Anthropic Console
  • Modello: claude-3-5-sonnet-20241022, claude-3-opus-20240229, ecc.

LiteLLM

Migliore per: Utenti avanzati, routing di modelli personalizzato, API unificata

Configurazione:

Testare la Connessione

Test Connessione Riuscito

Dopo aver configurato il tuo fornitore:

  1. Clicca su Testa Connessione
  2. Attendi il completamento del test
  3. Cerca il messaggio "Connessione riuscita!"

Se il test fallisce:

  • Verifica che le tue chiavi API/credenziali siano corrette
  • Controlla la tua connessione internet
  • Assicurati che il tuo account abbia accesso al modello specificato
  • Rivedi i messaggi di errore per problemi specifici

Accesso al Portachiavi

Potresti dover concedere il permesso Portachiavi per archiviare le chiavi API in modo sicuro.

Prompt Personalizzati

Scheda Prompt Personalizzato

Personalizza come l'AI migliora le tue trascrizioni:

Usare Prompt Personalizzati

  1. Clicca sulla scheda Prompt Personalizzato
  2. Inserisci le tue istruzioni personalizzate
  3. Le impostazioni vengono salvate automaticamente

Esempio di Prompt Personalizzato

Esempio Prompt Personalizzato

Esempio di prompt:

turn everything to chinese

Questo tradurrà tutte le trascrizioni in cinese.

Prompt Predefinito

Se non specifichi un prompt personalizzato, Vox usa un'istruzione predefinita per:

  • Correggere grammatica e ortografia
  • Rimuovere le parole di riempimento (uhm, eh, tipo, ecc.)
  • Preservare termini tecnici e nomi
  • Mantenere il significato originale

Suggerimenti per i Prompt

Buoni prompt:

  • "Correggere la grammatica ma mantenere il gergo tecnico"
  • "Rimuovere le parole di riempimento e formattare come punti"
  • "Tradurre in spagnolo e correggere la grammatica"
  • "Rendere più formale e professionale"

Evitare:

  • Prompt estremamente lunghi (potrebbero raggiungere i limiti di token)
  • Prompt che cambiano il significato in modo significativo
  • Prompt che aggiungono informazioni non presenti nella trascrizione

Sperimenta

Testa diversi prompt con la stessa trascrizione per trovare ciò che funziona meglio per il tuo caso d'uso.

Istruzioni di Esempio

Esempio di istruzioni personalizzate mostrate nell'interfaccia:

Istruzioni di Esempio

Clicca su Istruzioni di Esempio per vedere prompt di esempio:

  • "Aggiungi istruzioni aggiuntive oltre al comportamento predefinito di Vox come grammatica, rimuovi parole di riempimento, frasi di esitazione"
  • Fornisce indicazioni su come strutturare le tue istruzioni personalizzate

Guide Specifiche per Fornitore

Configurazione AWS Bedrock

Prerequisiti:

  1. Account AWS con accesso a Bedrock
  2. Accesso al modello abilitato nella Console AWS
  3. Autorizzazioni IAM configurate

Uso del Profilo AWS CLI (Consigliato):

bash
# Configura AWS CLI con SSO
aws configure sso

# Testa il tuo profilo
aws bedrock list-foundation-models --profile sso-bedrock

In Vox:

  1. Seleziona il fornitore AWS Bedrock
  2. Inserisci il nome del profilo (es.: sso-bedrock)
  3. Seleziona la regione
  4. Inserisci l'ID del modello
  5. Clicca su Testa Connessione

Uso delle Chiavi di Accesso:

  1. Crea chiavi di accesso in AWS IAM
  2. Inserisci l'ID Chiave di Accesso e la Chiave di Accesso Segreta in Vox
  3. Seleziona la regione e il modello
  4. Clicca su Testa Connessione

Sicurezza

Archivia le chiavi di accesso in modo sicuro. I profili AWS CLI con SSO sono più sicuri delle chiavi di accesso statiche.

Configurazione DeepSeek

Prerequisiti:

  1. Account su platform.deepseek.com
  2. Chiave API generata

Configurazione:

  1. Registrarsi su DeepSeek
  2. Generare una chiave API
  3. In Vox, selezionare il fornitore DeepSeek
  4. Inserire la propria chiave API
  5. Usare il modello deepseek-chat
  6. Cliccare su Testa Connessione

Costo: DeepSeek è conveniente rispetto ad altri fornitori.

Configurazione OpenAI

Prerequisiti:

  1. Account OpenAI
  2. Chiave API con crediti

Configurazione:

  1. Ottenere la chiave API da platform.openai.com/api-keys
  2. In Vox, selezionare il fornitore OpenAI
  3. Inserire la propria chiave API
  4. Scegliere il modello (es.: gpt-4-turbo, gpt-3.5-turbo)
  5. Cliccare su Testa Connessione

Costo: OpenAI addebita per token. GPT-4 è più costoso ma di qualità superiore rispetto a GPT-3.5.

Considerazioni sui Costi

Panoramica dei Prezzi

I costi del Miglioramento AI variano per fornitore:

FornitoreCosto per 1M tokenNote
DeepSeek~$0,14Più conveniente
OpenAI GPT-3.5~$0,50Buon valore
OpenAI GPT-4~$10-30Alta qualità, costoso
AWS Bedrock~$0,25-15Varia per modello
Anthropic Claude~$3-15Alta qualità

Stima dei Costi

Trascrizione media: 50-100 token Costo per trascrizione: $0,001-0,01 (a seconda del fornitore)

Esempio di utilizzo:

  • 100 trascrizioni/giorno con DeepSeek: ~$0,50/mese
  • 100 trascrizioni/giorno con GPT-4: ~$30/mese

Risparmia Denaro

  • Usa modelli più piccoli e meno costosi per trascrizioni semplici
  • Usa GPT-4 o Claude solo quando hai bisogno della massima qualità
  • DeepSeek offre il miglior rapporto qualità-prezzo

Prezzi Futuri

AI Integrata in Arrivo

Attualmente, Vox usa le tue proprie chiavi API per il miglioramento AI. In futuro, potremmo offrire un'opzione di modello AI integrato a pagamento per comodità.

Questo eliminerebbe la necessità di gestire le chiavi API e potenzialmente offrirebbe:

  • Configurazione semplificata (nessuna chiave API necessaria)
  • Prezzi mensili prevedibili
  • Fatturazione integrata
  • Modelli ottimizzati per la trascrizione

Resta aggiornato!

Migliori Pratiche

Quando Usare il Miglioramento AI

Usa il Miglioramento AI per:

  • Email e documentazione professionale
  • Note e riepiloghi di riunioni
  • Creazione di contenuti e scrittura
  • Comunicazioni formali

Salta il Miglioramento AI per:

  • Note personali veloci
  • Quando è richiesta privacy completa
  • Trascrizioni semplici e brevi
  • Quando la velocità è critica

Scegliere un Fornitore

Scegli AWS Bedrock se:

  • Usi già AWS per altri servizi
  • Hai bisogno di sicurezza di livello aziendale
  • Vuoi accesso a più fornitori di modelli
  • Hai crediti AWS esistenti

Scegli DeepSeek se:

  • Vuoi l'opzione più conveniente
  • Hai bisogno di buona qualità a basso costo
  • Trascrivi frequentemente

Scegli OpenAI se:

  • Vuoi la configurazione più semplice
  • Hai bisogno di risultati affidabili e di alta qualità
  • Hai già crediti OpenAI

Scegli Anthropic se:

  • Hai bisogno di ragionamento avanzato e precisione
  • Lavori con contenuti complessi e tecnici
  • Vuoi le capacità specifiche di Claude

Suggerimenti per la Progettazione dei Prompt

  1. Sii specifico: "Rimuovere parole di riempimento e correggere grammatica" è meglio di "migliorare"
  2. Testa iterazioni: Prova diversi prompt per trovare quello che funziona
  3. Combina istruzioni: "Correggere grammatica, rimuovere riempimenti e formattare come punti"
  4. Considera il contesto: Adatta i prompt per diversi casi d'uso (email vs. commenti di codice)

Risoluzione dei Problemi

Il Test di Connessione Fallisce

AWS Bedrock:

  • Verifica che le autorizzazioni IAM includano l'accesso al modello Bedrock
  • Controlla che la regione corrisponda a dove è disponibile il modello
  • Testa AWS CLI: aws bedrock list-foundation-models --region <region>
  • Assicurati che l'ID del modello sia corretto

DeepSeek/OpenAI/Anthropic:

  • Verifica che la chiave API sia valida
  • Controlla che il tuo account abbia crediti/abbonamento attivo
  • Assicurati che l'URL dell'endpoint sia corretto
  • Testa la chiave API con curl:
    bash
    curl https://api.deepseek.com/v1/models \
      -H "Authorization: Bearer YOUR_API_KEY"

Il Miglioramento AI Impiega Troppo Tempo

Soluzioni:

  • Passa a un modello più veloce (es.: GPT-3.5 invece di GPT-4)
  • Usa un fornitore con latenza inferiore
  • Controlla la tua connessione internet
  • Riduci la complessità del prompt personalizzato

Il Testo Migliorato È Errato

Soluzioni:

  • Adatta il tuo prompt personalizzato per essere più specifico
  • Prova un modello diverso (i modelli più grandi sono spesso più accurati)
  • Usa un prompt più semplice o il comportamento predefinito
  • Verifica prima che la tua trascrizione base sia accurata

Chiave API Archiviata Incorrettamente

Soluzione:

  1. Naviga verso Impostazioni → Miglioramento AI
  2. Reinserisci la tua chiave API
  3. Concedi l'accesso al Portachiavi quando richiesto
  4. Clicca su Testa Connessione per verificare

Costi API Elevati

Soluzioni:

  • Passa a un fornitore più economico (DeepSeek)
  • Usa il Miglioramento AI selettivamente (disabilita per note veloci)
  • Monitora l'utilizzo nel pannello del tuo fornitore
  • Considera l'uso di modelli più piccoli
  • Ottimizza il tuo prompt personalizzato per ridurre i token di output

Sicurezza e Privacy

Privacy dei Dati

Cosa viene inviato ai fornitori AI:

  • Solo trascrizione testuale (dopo l'elaborazione locale di Whisper)
  • Il tuo prompt personalizzato
  • Nessun audio, nessuna informazione personale oltre al testo della trascrizione

Cosa NON viene inviato:

  • Registrazioni audio originali
  • Altre trascrizioni (ogni richiesta è indipendente)
  • Informazioni personali dalle impostazioni di Vox

Archiviazione Sicura

  • Chiavi API: Archiviate cifrate nel Portachiavi macOS / Gestore credenziali di Windows
  • Credenziali: Mai trasmesse ai server di Vox
  • Trascrizioni: Possono essere conservate localmente (vedi Conservazione Audio)

Politiche sulla Privacy dei Fornitori

Rivedi le politiche sulla privacy del tuo fornitore scelto:

Elaborazione dei Dati

Quando abiliti il Miglioramento AI, le tue trascrizioni vengono inviate a fornitori AI di terze parti. Se lavori con informazioni sensibili, considera:

  • Di usare solo la trascrizione locale (disabilitare il Miglioramento AI)
  • Di scegliere fornitori con forti garanzie di privacy
  • Di usare deployment privati (AWS PrivateLink, Azure Private Link)

Configurazione Avanzata

Endpoint Personalizzati

Alcuni fornitori consentono endpoint personalizzati per:

  • Deployment privati
  • Installazioni on-premise
  • Server proxy
  • Ottimizzazioni regionali

Inserisci endpoint personalizzati nel campo Endpoint durante la configurazione di un fornitore.

LiteLLM per il Routing Avanzato

Fornitore LiteLLM

LiteLLM consente:

  • Interfaccia unificata verso 100+ fornitori LLM
  • Fallback e retry automatici
  • Bilanciamento del carico tra più fornitori
  • Monitoraggio dei costi e budget

Configurazione:

  1. Distribuire il server LiteLLM: https://docs.litellm.ai
  2. Selezionare il fornitore LiteLLM in Vox
  3. Inserire l'URL del tuo server LiteLLM
  4. Configurare il routing nella configurazione LiteLLM

Variabili d'Ambiente

Se usi profili AWS CLI o variabili d'ambiente, Vox rispetta:

  • AWS_PROFILE
  • AWS_REGION
  • AWS_ACCESS_KEY_ID
  • AWS_SECRET_ACCESS_KEY

Prossimi Passi

Costruito con 💜 dalla comunità open-source e dai principali collaboratori