Com triem la paraula del dia al Mooot
Una de les preguntes que més rebem a través del botó de Feedback és: com es tria la paraula del dia al Mooot? És una pregunta justa, sobretot els dies que la solució resulta inesperadament difícil. En aquest article expliquem el procés sencer, sense floritures, perquè vegis exactament què passa entre el moment en què una paraula entra al diccionari i el moment en què apareix com a paraula del dia al teu navegador.
Resum: el Mooot fa servir una llista curada de paraules de 5 lletres validades pel DIEC2 (Diccionari de la llengua catalana de l'Institut d'Estudis Catalans) i el DISC (diccionari Scrabble). No fem servir noms propis, sigles, abreviatures ni paraules ofensives. La paraula concreta de cada dia es tria seguint un calendari preassignat per garantir que mai no es repeteix dins la mateixa temporada.
1. D'on surten les paraules
La base del joc és una llista mestra de paraules de 5 lletres extreta del DISC. El DISC és el diccionari oficial de Scrabble en català i és, en termes pràctics, el corpus normatiu més complet en format consultable per màquina. Conté unes 700.000 entrades en total, de les quals unes 18.000 fan exactament 5 lletres.
A partir d'aquesta llista en brut, fem diversos filtres successius:
- Filtre normatiu. Validem que cada paraula aparegui també al DIEC2. El DIEC2 és més restrictiu que el DISC i deixa fora arcaísmes molt extrems o variants dialectals poc esteses. Així evitem que la paraula del dia sigui un terme que ningú coneixeria.
- Filtre de tipologia. Eliminem noms propis (toponímics, antropònims), sigles (CCOOM, PUNTA com abreviatura, etc.), abreviatures i símbols.
- Filtre lèxic. Excloem paraules amb significat ofensiu, despectiu o sensible. Aquest filtre és més subjectiu però necessari: el Mooot el juguen des de criatures fins a persones grans.
- Filtre de dificultat. Excloem paraules amb tres o més lletres rares (Ç, X, K, W, Y) com a paraules del dia obligatòries. No vol dir que no apareguin mai, sinó que no apareixen com a solució per evitar partides molt frustrants.
2. Tractament dels accents i la Ç
El català té caràcters que no comparteix amb l'anglès, i això requereix decisions de disseny:
- Els accents (À, È, É, Í, Ò, Ó, Ú) i la dièresi (Ï, Ü) no compten com a lletres pròpies: una È compta com a E, una Ï com a I, etc. Ho fem així per simplicitat al teclat i perquè la majoria de jugadors no escriuen amb accents al mòbil.
- La Ç, en canvi, sí que és una lletra pròpia. Ho tractem així perquè morfològicament i fonèticament és diferent de la C, i excloure-la empobriria el joc en català.
- La L·L (l geminada) compta com a dues L. Sabem que això tècnicament no és exacte —la geminada és un sol fonema— però seria massa complex de gestionar al teclat virtual.
3. La cua de paraules del dia
Una de les coses que més sorprèn la gent és saber que la paraula del dia no es tria al moment. Quan visites el Mooot a les 00:01, la paraula d'aquell dia ja està fixada des de fa setmanes —o mesos.
Funciona així:
- Cada vegada que comencem una nova "temporada" (cada 6-12 mesos, més o menys), seleccionem un subconjunt de paraules vàlides de la llista mestra. Aquesta selecció equilibra dificultat: hi ha paraules "populars" (alta freqüència, fàcils), "intermèdies" i "rares" (baixa freqüència, exigents).
- Aquest subconjunt s'ordena en una seqüència diària: la paraula 1, la 2, la 3... amb un cert ritme. Per exemple, no posarem dues paraules molt difícils consecutives. Distribuïm les paraules amb la Ç o amb 4 vocals al llarg de la temporada perquè surtin de tant en tant.
- Aquesta seqüència queda fixada. Cada dia, el sistema agafa la paraula que toca segons el calendari.
La conseqüència pràctica: la paraula del dia no depèn de qui l'ha jugat ni de l'hora del dia. Cap algoritme intel·ligent decideix res segons el teu comportament. Tots els jugadors del món tenen exactament la mateixa paraula a la mateixa data.
4. Per què a vegades la paraula sembla "rara"
És el feedback més habitual: "quina paraula més rara la d'avui". Quasi sempre, una de tres coses està passant:
- És una paraula que coneixes però no fas servir. Hi ha molts mots que reconeixem quan els llegim però que no fem servir activament. El cervell hi va, però amb resistència, i això genera la sensació de "rara".
- És una conjugació verbal. El català té tantes formes verbals que sovint la solució no és la paraula que s'estudia, sinó una desinència. Si la solució és PARAS (2a persona present de "parar"), pot semblar més estranya que PARAR.
- L'has identificat tard. Si arribes al sisè intent sense gairebé pistes verds, la paraula et semblarà "trampa", però sovint el problema és la teva obertura, no la paraula.
Tot i això, escoltem. Si una paraula concreta rep moltes queixes legítimes (per exemple, perquè és ambigua, dialectal o te diversos significats que confonen), la marquem per retirar-la de la llista de futures temporades. Tenim un fitxer públic de paraules excloses i el revisem cada trimestre.
5. Validació de paraules que escrius (no només la solució)
Una cosa diferent és la solució del dia, i una altra les paraules que pots escriure com a intent. La llista de paraules vàlides que pots escriure és molt més gran: qualsevol paraula del DISC. Així no et frustres perquè el joc no t'accepti una paraula que existeix.
Si trobes que una paraula que existeix no és acceptada, ens la pots reportar des del botó de Feedback dins el joc o per correu. La integrem a la llista en un parell de dies.
6. Errors que hem comès (i corregit)
No tot ha estat perfecte. En aquest projecte, durant els primers mesos, vam tenir alguns errors:
- Topònim camuflat. Una paraula del dia era el nom d'un poble petit que apareixia al DISC com a substantiu comú. La vam retirar després de rebre 17 missatges en una hora.
- Variant dialectal. Una paraula del dia era una forma valenciana que no es coneix fora del País Valencià. La vam mantenir però vam afegir un avís a la definició explicant l'àmbit geogràfic d'ús.
- Repetició. Per un error d'script, una paraula del setembre va tornar a sortir al desembre. Cap conseqüència real, però és el tipus d'errors que volem evitar.
7. La nostra promesa
Amb tot això, podem comprometre'ns a unes quantes coses:
- Mai no posarem com a paraula del dia un nom propi, una sigla o una abreviatura.
- Totes les solucions són paraules normatives validades pel DIEC2.
- La paraula del dia és igual per a tothom, no varia segons l'usuari.
- Si una paraula és problemàtica, la retirem.
- El feedback dels jugadors es llegeix tot. La majoria d'ajustos provenen d'aquí.
Conclusió
La transparència sobre com es tria la paraula del dia és part del nostre compromís amb la qualitat del joc. No hi ha algoritmes ocults, ni proves A/B, ni "el Mooot t'ha posat una paraula difícil perquè has guanyat dues partides seguides". El Mooot és un joc senzill amb regles senzilles, i com més clares les fem, més confiança hi tens. Si tens cap pregunta o troba't algun bug, escriu-nos a gesteve.12@gmail.com o per Telegram a @mooot_cat_bot.