Arran de la polèmica que van provocar les declaracions de l’Àlex Hinojo el passat reportatge del 30 minuts de TV3, on ell declarava que en un futur no llunyà voldria parlar amb la seva torradora en català, he volgut recuperar la iniciativa Common Voice que permetrà a qualsevol empresa, gran o petita, l’accés a dades lingüístiques per desenvolupar aplicacions innovadores per als aparells i el web que puguin reconèixer la parla en català.
 

Què és Common Voice?

El projecte Common Voice de Mozilla, impulsat a Catalunya per l’associació Softcatalà, disposa ja de 117 hores de veu validades, de les 1.000 que són necessàries per poder publicar una base de dades de veu en català amb llicència oberta. Dels 29 idiomes que recullen mostres de veu, el català és la cinquena llengua pel que fa a nombre d’aportacions, per darrere de l’anglès, l’alemany, el cabilenc i el francès.

La iniciativa permetrà a qualsevol empresa, gran o petita, l’accés a dades lingüístiques per desenvolupar aplicacions innovadores per als aparells i el web que puguin reconèixer la parla en català. 

Font: Common Voice

Com puc col·laborar?

Es fa una crida a la societat per tal que participi en aquest projecte en què hi pot col·laborar qualsevol persona que parli català (és indiferent el nivell/registre/dialecte)

La dinàmica de participació és senzilla i pot fer-se des de qualsevol telèfon mòbil. Consisteix a llegir i enregistrar 5 frases aleatòries. També es pot participar validant les frases que prèviament han introduït altres usuaris. Tot i que per fer aportacions no cal crear un perfil personal és recomanable fer-ho per permetre generar models lingüístics més acurats i extraure estadístiques com el gènere o dialectes.

A banda, també hi ha la possibilitat de participar com a experts en la valoració de talls de veu, traducció de la interfície del Common Voice al català o la creació del corpus de lectura, creant o cedint frases al projecte. 
 

Per què hi hauria de col·laborar?

Per ajudar les màquines a aprendre com parlem les persones de debò. A més del conjunt de dades del Common Voice, també s’està construint un motor de reconeixement de veu de codi obert anomenat Deep Speech. Tots dos projectes formen part dels esforços per reduir les desigualtats en el món de la veu digital. Les tecnologies de reconeixement de veu aporten una dimensió humana als nostres dispositius, però els desenvolupadors necessiten una gran quantitat de dades de veu per crear-les. Actualment, la majoria d’aquestes dades són cares i propietàries. Es vol que les dades de veu siguin lliures i públiques, i garantir que les dades representin la diversitat de la gent real

Us animem a participar!

 

 

Foto de capçalera: Pixabay

 

 

 

Artificial Intelligence,Open,