Guia pràctica · analítica de veu
Com utilitzar l’anàlisi de veu en temps real per millorar la qualitat del servei telefònic
Si el teu equip només pot escoltar una petita mostra de trucades, sempre arribes tard: els problemes ja han passat. L’analítica de veu en temps real (també coneguda com speech analytics o voice analytics) converteix converses en senyals accionables mentre la trucada és en curs: qualitat, compliment, fricció, oportunitats de venda i necessitats reals del client.
En 2 minuts: què guanyaràs amb aquesta tecnologia.
- ✅ Qualitat mesurable: auditoria contínua i criteris coherents (no només “opinions”).
- ✅ Acció immediata: alertes i assistència a l’agent quan apareix risc o fricció.
- ✅ Millor formació: coaching basat en patrons reals, no en casos puntuals.
- ✅ Compliment més robust: detecció d’omissions en scripts o avisos quan importa.
En aquesta guia
- Què és l’anàlisi de veu en temps real i en què es diferencia del “post-call”
- Què pot detectar (més enllà de transcriure)
- Beneficis directes per a qualitat, CX i eficiència
- Casos d’ús pràctics per a centres d’atenció i equips de vendes
- Requisits i dades necessàries per fer-ho bé
- Com implementar-ho pas a pas (sense projectes eterns)
- KPIs recomanats per demostrar impacte
- Privadesa, RGPD i bones pràctiques de compliment
- Preguntes freqüents
Consell: si tens poc temps, llegeix el pla pas a pas i els KPIs.
Què és l’anàlisi de veu en temps real (i per què ara és clau)
L’anàlisi de veu en temps real és l’aplicació d’IA que interpreta una conversa telefònica mentre passa i la transforma en: transcripció, temes, paraules clau, indicadors de qualitat (silencis, interrupcions, ritme), i senyals de risc (frustració, queixa, intenció de baixa, incompliment d’un script, etc.).
Temps real vs. anàlisi “post-call” (fora de línia)
- Post-call: útil per auditar i fer informes… però l’agent ja ha penjat.
- Temps real: permet intervenir (supervisor) o assistir (agent assist) durant la conversa: recordatori d’un pas crític, accés ràpid a informació, alertes de risc o guiatge en casos sensibles.
En pràctica, molts equips combinen ambdues: temps real per actuar, i post-call per resumir, classificar i entrenar.
El canvi important no és “tenir transcripcions”, sinó tancar el bucle: de la conversa → a un senyal → a una acció → i a una millora mesurable (qualitat, CSAT, FCR, AHT, reclamacions…).
Què pot detectar (més enllà de “passar veu a text”)
Una bona solució d’analítica de veu no es limita a transcriure. El valor apareix quan pots combinar contingut (què s’ha dit) amb senyals de conversa (com s’ha dit) i context operatiu (qui, quan, cua, motiu, resultat).
Senyals habituals que realment serveixen per millorar qualitat
Aquestes són categories típiques d’anàlisi que aporten accions concretes en contact centers.
Transcripció & resum Temes i motius de trucada Paraules clau i frases crítiques Detecció de queixes Risc de baixa (churn) Compliment d’script Silencis i solapaments Ritme i claredat Sentiment (orientatiu)- Motiu real de trucada (no només el “ticket type”): ajuda a detectar causes arrel, friccions de producte i punts de ruptura del procés.
- Compliment: avisos obligatoris, verificacions, consentiments o passos de seguretat. Ideal per sectors regulats.
- Qualitat de la conversa: silencis llargs, interrupcions constants, solapaments, canvi de tema, “looping” (repeticions)…
- Risc i escalat: clients molt enfadats, llenguatge agressiu, amenaces de baixa, peticions d’escalat, queixes repetides.
- Assistència a l’agent: suggeriments de pròxim pas, accés a base de coneixement, recordatoris d’script i resums en temps real.
Important: el “sentiment” i les emocions s’han d’usar com a indicadors (per prioritzar i investigar), no com a “veritats absolutes”.
Beneficis directes per a qualitat, CX i eficiència (els que es poden demostrar)
Quan l’analítica de veu està ben implantada, el guany principal és que deixes de treballar a cegues. Pases de decisions basades en percepcions a decisions basades en evidència.
On es veu impacte més ràpid
- Auditoria de qualitat: més cobertura, més consistència i menys biaix.
- Reducció de retrucades: detectes què falla i ho corregeixes (procés, guions, producte, informació).
- Coaching i formació: identifiques patrons (no casos aïllats) i enfoques la formació on realment hi ha retorn.
- Compliment i risc: alertes de desviacions quan encara es poden corregir.
- Millor gestió operativa: cues i equips amb problemes concrets, no “sensacions”.
Casos d’ús pràctics (els que més es repeteixen)
A continuació tens els casos d’ús que, habitualment, donen millor retorn perquè estan lligats a processos repetibles i a KPIs clars. Pots començar per un i escalar quan tinguis evidència.
1) Control de qualitat a escala (QA real)
Passar de revisar “algunes trucades” a revisar el volum complet (sempre que hi hagi accés a l’àudio i la metadada).
- Scorecards consistents (guió, resolució, empatia, claredat, tancament).
- Detecció automàtica de desviacions per cua, campanya, producte o agent.
- Mostres de qualitat “intel·ligents”: no a l’atzar, sinó per risc/impacte.
2) Assistència a l’agent (agent assist) en temps real
- Recordatoris de passos crítics (verificació, avisos, següent pregunta).
- Accés ràpid a base de coneixement (respostes consistents i actualitzades).
- Guia per gestionar objeccions o situacions sensibles.
3) Compliment i reducció de risc
- Detecció d’omissions d’avisos i disclaimers.
- Traçabilitat d’accions i evidències per auditoria interna.
- Alertes de paraules/temes que requereixen escalat o registre.
4) Veu del client (VoC) i causa arrel
- Classificació de motius de trucada (temes i subtemes) amb evolució temporal.
- Detecció de tendències: incidències que creixen, canvis sobtats, productes amb fricció.
- Priorització d’actions: què arreglar primer per reduir volum i reclamacions.
5) Qualitat comercial i conversió (per equips de vendes)
- Anàlisi d’objeccions, competidors esmentats i punts de fuga.
- Coaching basat en patrons: obertura, descoberta, proposta de valor, tancament.
- Detecció d’oportunitats i senyals d’interès.
Requisits i dades: què necessites per implementar-ho sense sorpreses
La tecnologia és important, però el que marca la diferència és la combinació de qualitat d’àudio, metadades, objectius clars i integració.
Checklist ràpida (mínim viable)
- Accés a l’àudio: streaming o gravacions (segons cas d’ús).
- Metadada bàsica: cua/campanya, agent, timestamp, resultat, motiu (si existeix).
- Mapa d’objectius: què vols millorar i com ho mesuraràs (KPIs).
- Definició de criteris de qualitat: scorecard o regles d’avaluació.
- Polítiques de privadesa: retenció, accessos, informació al client, xifrat i auditories.
Quan convé integrar també CRM/helpdesk
Si vols passar de “insights” a “acció”, la integració és el pas que dona retorn.
- Crear/actualitzar tiquets automàticament amb resum i motiu.
- Afegir etiquetes, sentiment orientatiu i “next best action” a la fitxa del client.
- Enviar alertes a supervisors (Teams/Slack/email) quan hi ha risc o incompliment.
Vols portar-ho a producció amb seguretat?
A Bastelia solem treballar aquests projectes com a integració d’IA + automatització + governança. Si vols, aquí tens serveis relacionats (en català):
- Integració i Implementació d’IA (APIs, RAG, observabilitat i desplegament per fases)
- Automatitzacions amb IA (fluxos, alertes i accions automàtiques)
- Agents conversacionals (xat i veu, amb handoff i context)
- Compliment i Legal Tech (risc, traçabilitat i programes de compliment)
- Contacte (o escriu a info@bastelia.com)
Com implementar l’anàlisi de veu en temps real pas a pas
Per evitar projectes que “s’allarguen”, el secret és començar per un cas d’ús amb retorn clar i construir una base reutilitzable. Aquest és un esquema pràctic que funciona molt bé:
-
Defineix objectiu i mètrica
Exemple: “reduir incidències de guió” o “millorar FCR” o “detectar queixes abans que escalin”. -
Dissenya la scorecard o les regles
Què és una bona trucada? Quins passos són obligatoris? Quins senyals indiquen risc? -
Prepara dades i qualitat d’àudio
Soroll, solapaments, accents, canvis d’idioma… tot això es pot gestionar, però cal tenir-ho en compte des del principi. -
Pilot controlat (2–4 setmanes) amb mostra representativa
Ajust de vocabulari, temes, paraules clau i calibratge de regles. -
Integració amb operació
Dashboards, alertes, i (si té sentit) accions cap a CRM/helpdesk. -
Adopció i coaching
Defineix com s’usa: qui mira què, quan s’activa una alerta i com es dona feedback. -
Millora contínua
Revisions periòdiques de falsos positius/negatius, noves categories i canvis de processos.
Un bon senyal que vas bé: les alertes acaben convertint-se en millores de procés i en formació concreta (no en “més control” sense impacte).
KPIs recomanats per demostrar impacte (i evitar “projectes bonics”)
Si vols que el projecte sigui sostenible, posa KPIs des del principi. Aquí tens una taula de mètriques habituals i per què serveixen. (La taula és scrollable en mòbil per adaptar-se a espais estrets.)
| KPI | Què indica | Com hi ajuda l’analítica de veu |
|---|---|---|
| QA Score | Qualitat global segons scorecard | Detecció i puntuació consistent; focus en patrons i “moments crítics”. |
| FCR (resolució en primera trucada) | Resolució sense retrucada | Identifica causes de retrucada i punts del procés que no resolen. |
| AHT (durada mitjana) | Temps total per interacció | Detecta silencis, repeticions, desviacions i informació que falta a l’agent. |
| Compliment d’script | Passos/avisos obligatoris | Alertes de desviació en temps real i evidència per auditoria. |
| Ratio d’escalat | Casos que pugen a supervisor | Detecta triggers de risc i millora guiatge/recursos per resoldre abans. |
| Temes & motius | Per què truquen realment | Classificació automàtica, tendències i causa arrel per reduir volum. |
| CSAT/NPS | Satisfacció i fidelització | Connecta comportaments i patrons de conversa amb resultats de satisfacció. |
Pro-tip: tria 2–3 KPIs principals i 3–5 “drivers”.
Exemple: QA Score + FCR com a principals, i drivers com compliment d’script, silencis llargs i temes repetits. Això facilita govern i acció.
Privadesa, RGPD i bones pràctiques (sense fricció innecessària)
La veu és una dada sensible en el sentit operatiu: pot contenir dades personals i, segons el context, informació delicada. Per això és clau dissenyar el sistema amb privadesa i seguretat des del principi.
Bones pràctiques que recomanem en projectes reals
- Minimització: guarda només el que necessites (àudio complet, transcripció, o només metadades/insights segons cas).
- Retenció definida: períodes clars i eliminació automàtica quan no cal conservar.
- Xifrat i controls d’accés: permisos per rol, logs i auditories d’accés.
- Anonimització/pseudonimització quan sigui possible (especialment en entrenaments i analítica agregada).
- Transparència: informació adequada als interlocutors (segons el teu cas i el marc aplicable).
- Avaluació de riscos: especialment si hi ha decisions sensibles o ús intensiu d’IA en processos crítics.
Nota: aquesta secció és informativa i no substitueix assessorament legal. Cada organització ha d’avaluar el seu cas (sector, ubicació, finalitats, base jurídica i proveïdors).
Errors comuns (i com evitar-los)
- Objectius massa genèrics → defineix 1 cas d’ús i 2–3 KPIs abans de construir.
- Sense scorecard clara → si “qualitat” no està definida, l’analítica no pot ser accionable.
- Àudio dolent → millora captació, codecs, reducció de soroll o segmentació per cues.
- Alertes massa sorolloses → calibratge, llindars i priorització per impacte.
- Sense adopció → defineix rituals: revisió setmanal, coaching, responsable i accions.
- Privadesa a última hora → dissenya govern, retenció i accessos des del dia 1.
Preguntes freqüents sobre analítica de veu en temps real
És necessari gravar totes les trucades?
No sempre. Per a “temps real” pots treballar amb streaming. Per a auditoria i millora contínua sovint interessa disposar també de gravacions o, com a mínim, transcripcions i metadades. L’important és definir el cas d’ús i la política de retenció.
Es pot analitzar el 100% del volum?
Es pot arribar a cobrir pràcticament tot el volum si hi ha accés a l’àudio i a la metadada, i si la infraestructura escala (processament, cues, emmagatzematge i governança). Molts equips comencen amb un pilot per cues/campanyes i després escalen.
Quins idiomes suporta? (Català inclòs?)
Depèn del motor de reconeixement de veu i de la configuració. En entorns reals, el repte no és només l’idioma, sinó accents, soroll i canvis d’idioma a la mateixa trucada. Per això el pilot i la calibració són crítics.
Què és millor: sentiment o paraules clau?
Normalment, una combinació. Les paraules clau i temes són més “objectius”. El sentiment és útil com a indicador per prioritzar i detectar tendències. El millor resultat s’obté combinant contingut + senyals de conversa + context operatiu.
Com es calcula el cost d’una solució d’aquest tipus?
El cost sol dependre de volum (minuts/trucades), latència requerida (temps real vs post-call), integracions (CRM/helpdesk/telefonia), retenció d’àudio/transcripcions i requisits de seguretat/compliment. Una bona pràctica és començar amb un cas d’ús i escalar amb ROI demostrat.
Quin és el primer pas recomanat?
Definir un objectiu mesurable i una scorecard mínima. Si vols, escriu a info@bastelia.com amb el teu context (volum, canal, idioma, objectiu) i et proposem un enfocament de pilot i mètriques.
Següent pas: passar de la idea a un pilot amb KPIs
Si vols millorar la qualitat del servei telefònic amb anàlisi de veu en temps real, el més eficient és començar amb un pilot acotat: una cua/campanya, una scorecard simple i un quadre de KPIs.
- Objectiu: què vols millorar (qualitat, compliment, eficiència, vendes)?
- Volum: minuts/trucades aproximades i franges punta.
- Stack: centraleta/CCaaS + CRM/helpdesk + canals.
- Idiomes: català/castellà/altres i si hi ha code-switching.
Escriu-nos a info@bastelia.com i et respondrem amb una proposta de pilot (abast, dades, integracions i mètriques).
