Jornades de tecnologies lingüístiques lliures en català

Us presentem «Jornades de tecnologies lingüístiques lliures en català» per promocionar i donar suport al desenvolupament obert de les eines lliures en català. Volíem compartir la informació amb vosaltres perquè volem la creació d’una comunitat per millorar i mantenir aquestes eines obertes; i 3 de les 6 sessions estan dissenyades per explicar l’ús d’eines lliures de la parla amb exemples en Python. Seran sessions gratuïtes i en-línia. Us deixem els detalls en dues llengües (castellà a baix):


Català:

Les tecnologies de la parla són uns dels elements molt importants de la indústria 4.0, perquè permeten el control dels ordinadors amb comandaments orals. Les empreses grans ja proveeixen solucions en la forma d’APIs i serveis, però aquestes solucions no són personalitzables, molts serveis no donen suport a les llengües minoritzades, i més important té implicacions greus per la privacitat de dades.

Si formeu part del sector, o us interessa entrar-hi com a desenvolupador/a, emprenedor/a o usuari/ària, us presentem les «Jornades de tecnologies lingüístiques lliures en català» dedicades a assegurar l’ús, el desenvolupament i el manteniment de les eines lingüístiques de programari lliure i obert. Les sessions pels desenvolupadors presentarà la temàtica amb exemples pràctics en Python. Les sessions es realitzaran en-línia per mitjans telemàtics i la participació és gratuïta gràcies al suport del Departament de Cultura.

Per més informació sobre les sessions, consulta https://collectivat.cat/jornades

Per la inscripció aquí

Castellà:

Las tecnologías del habla son unos de los elementos muy importantes de la industria 4.0, porque permiten el control de los ordenadores con mandos orales. Las empresas grandes ya proveen soluciones en la forma de APIs y servicios, pero estas soluciones no son personalizables, muchos servicios no apoyan a lenguas minorizadas, y más importante tiene implicaciones graves para la privacidad de datos.

Si formáis parte del sector, u os interesa entrar como desarrollador/a, emprendedor/a o usuario/ a, os presentamos las «Jornadas de tecnologías lingüísticas libres en catalán» dedicadas a asegurar el uso, el desarrollo y el mantenimiento de las herramientas lingüísticas de software libre y abierto. Las sesiones para los desarrolladores presentará la temática con ejemplos prácticos en Python. Las sesiones se realizarán en-línea por medios telemáticos y la participación es gratuita gracias al apoyo del Departament de Cultura.

Para más información sobre las sesiones, consulta https://collectivat.cat/jornades

Para la inscripción aquí

1 me gusta

Hola!

En aquest fil us faré el resum de cada sessió de les jornades de tecnologies lingüístiques lliures en català. Si heu participat en les sessions o simplement teniu suggeriments, us invito a discutir en aquest fil.

Abans de tot, per les persones que no van participar en les sessions d’aquesta setmana:

Després de cada sessió els continguts d’aquests enllaços seran actualitzats. Podreu trobar tots els continguts sempre al mateix lloc.

Un petit resum de la sessió 24N, Com els meus dispositius poden parlar en català? Ofertes al mercat i les alternatives lliures:

Després dels detalls de la tecnologia actual de la síntesi de la parla. Hem parlat dels productes que depenen de la funcionalitat de síntesi de la parla, sobretot els productes d’accessibilitat, navegadors (de cotxes), i en àmbit d’edició (diaris, portals de web, podcasts). Un tema molt important era quins d’aquests productes estan en català. Tot i que hi ha alternatives al mercat, les empreses grans (sobretot Google, Apple i Amazon) no tenen suport per al català, a més impedeixen la integració dels serveis externs.

Suggeriments:

  • Ja tenim certes tecnologies (com festival i Catotron) el problema és que no estan integrades als productes al mercat
  • Per impulsar la integració del català als serveis de les empreses grans, podem crear la demanda, mitjançant l’ús dels productes alternatius en català en lloc dels productes de les empreses grans. (exemple en lloc d’utilitzar Google Maps, Android Auto, Carplay d’Apple i Apple maps; utilitzar Waze que està en català)
  • Com podem millorar el motor de Catotron? Ja tenim un conjunt de dades bastant bons del Common Voice, creada per la comunitat. Tot i que és per reconeixement de la parla, es pot investigar maneres d’aprofitar hores extensives dels enregistraments per millorar el suport de dialectes, i prosodi.

Què heu pensat de la sessió? Us agraïm si podeu compartir els vostres suggeriments sobre els productes de la parla, i el suport de la comunitat.

Resum de la sessió de 26N, Donar veu als nostres productes tecnològics: Les eines lliures de Síntesi de la Parla:

Per aquesta sessió el nostre company Alex Peiró Lilja ens va explicar amb tots els detalls tècnics dels motors de la síntesi de la parla (SP) a més exposar les innovacions recents al camp. Després vam fer un repàs dels nous repositoris de SP al github, i vam comparar diverses opcions. Al final vam entrar als detalls de com desplegar un servidor de Catotron.

Suggeriments:

  • El projecte de TTS de Mozilla destaca com un repositori molt interessant perquè permet contribucions de les altres llengües. Si contribuïm a aquest repositori, afegint funcionalitats/models del català, la llengua podria tenir una bona visibilitat. A més pel futur, potser tindrem l’interès de Mozilla per la integració del català als seus productes.
  • El projecte de Catotron sempre necessita aportacions, organitzarem els repositoris i la informació per facilitar la contribució al projecte
  • Com una innovació, hi ha interès de la comunitat per treballar amb sistemes de traducció automàtica speech-to-speech. Ja hi ha grups de recerca treballant en això, a més hi ha repositoris de programari lliure desenvolupat per la comunitat (específicament dins del repositori d’ESPnet.)

Si voleu començar utilitzar Catotron, podeu donar una ullada a les llibretes de Python. Si voleu qualsevol funcionalitat extra, ja podeu proposar als issues del catotron i el catotron-cpu. Nosaltres també documentarem les necessitats que detectem, i les publicarem mitjançant els issues de github, d’aquesta manera les persones que volen contribuir al repositori, podrien tenir una idea de la direcció del desenvolupament.

Com sempre

  • Podeu veure el vídeo de la sessió a l’enllaç de la sala
  • Podeu descarregar els continguts, les diapositives aquí

Què penseu sobre les innovacions recents al camp de la SP? Voleu integrar aquestes funcionalitats als vostres projectes i productes? Per qualsevol confluència, necessitat o contribució als projectes comunitaris us esperem els vostres comentaris.