20 de maig del 2008

Multicercadors lingüístics a la UB

Igual que la dels bolets, ha arribat la temporada dels multicercadors. Fa un temps ens referíem als dos OPTImots: l'oficial i l'alternatiu. Personalment, sóc usuari habitual del primer, tot i que alguna vegada també m'escapo al segon. Ara toca el torn als multicercadors del Servei Lingüístic de la Universitat de Barcelona: un de lingüístic i un de terminològic.
Multicercador lingüístic

Els dos es basen en la tecnologia del Google per a crear motors de cerca personalitzats. En el cas del multicercador lingüístic hem comptabilitzat fins a 76 fonts (llocs web) d'on treu els resultats. El multicercador terminològic té avui 220 fonts, entre elles molts dels lèxics, glossaris i vocabularis d'especialitat que es troben per Internet. És una gran quantitat d'informació i, a més, tenen l'encert de referenciar també els recursos no indexats pel motor de cerca. Feina ben feta, de ben segur.

L'home és animal de costums, així que hem fet amb aquests multicercadors la mateixa prova absolutament inútil de cerca de mots que vam fer fa amb els OPTImots. Òbviament aquesta prova no té cap valor, ni en ella mateixa, ni en res aliè a ella mateixa. Els mots són totalment arbitraris i els resultats, també. És un pur entreteniment mancat de qualsevol indici de metodologia científica. Agafo la meva llista personal de deu paraules i aquests són els resultats, amb els 4 motors de cerca i el Google en català, avui 20 de maig del 2008:

Llista de mots

OPTImot oficial

OPTImot alternatiu

Multicercador lingüístic UB

Multicercador terminològic UB

Google en català

Basarda

12

2

1

0

6.490

Xerinola

8

0

1

0

11.700

Lexicografia

11

10

10

6

10.700

Atzucac

11

5

5

7

27.300

Cartenir

4

0

1

0

63

Estupend

5

1

1

0

1.310

Serenitat

19

5

5

6

31.800

Deportiu

2

1

1

0

40.400

Iconòfor

0

0

0

0

320

Gàubia

0

0

0

0

5


L'OPTImot oficial ha mantingut exactament els mateixos resultats que fa quatre mesos. L'OPTImot alternatiu ha variat, amb una lleugera minva en la quantitat total de resultats. La meva llista de mots no inclou gairebé lèxic d'especialitat, o sigui que el resultat en el cas dels motors de cerca de la UB es podia esperar així.

Com ja hem dit en d'altres ocasions, la llàstima, per a un usuari normal, és no tenir una eina que agrupi tant el DIEC2 com el vocabulari de fotoquímica de la UAB, tant el DCVB com el TERMCAT. Això encara no existeix. Encara. Però algun dia, arribarà.

Agraeixo al meu àngel de la guarda que m'hagi informat de l'existència d'aquests motors de cerca. Em sembla que ell també en parlarà algun dia i segur que amb més rigor que un servidor. Però no amb la mateixa celeritat, aquest cop. ;)

4 comentaris:

  1. M'has xafat l'exclusiva! Com ets, eh! Però et perdono, perquè ets tu i perquè has fet un article molt ben travat. Jo no ho hagués fet millor :-)

    M'encanten els resultats que obtens amb la teva prova del 10: precisament, un multicercador especialitzat cerca eliminar al màxim el soroll i els resultats no pertinents: just el que han fet els multicercadors de la UB amb aquets bonitos palabros que has proposat.

    El cercador terminològic basa les seves fonts en la categoria de lèxics i vocabularis de l'Open Directory Project, una de les més completes i actualitzades que podeu trobar en aquests moments.

    Percert, allà hi ha uns quants recursos sobre vins i altres esperits. :-)

    ResponElimina
  2. Tu ho haguessis fet i ho faràs millor, sens dubte.

    A partir de mirar les fonts d'aquests multicercadors m'he adonat de quants lèxics encara no he incorporat al bloc... Feinada que tindré.

    ResponElimina
  3. Ho faré diferent. Ni millor ni pitjor. Cadascú el seu estil i que així segueixi. ;-)

    ResponElimina
  4. Encara no m'he acostumat a fer servir els cercadors aquests. L'únic que he fet servir és el del Parèmies. Ahir l'hi vaig ensenyar al meu quefe, que va flipar amb el Gran Demiürg.

    Gràcies per pensar en mi a l'hora de proposar els palabros.

    De carreroles ja n'estic fins als collons, hehe.

    ResponElimina

Quelcom a dir?