PostgreSQLLa base de données la plus sophistiquée au monde.

F.7. dict_xsyn

Le module dict_xsyn (Extended Synonym Dictionary, dictionnaire étendu de synonymes) est un exemple de modèle de dictionnaire pour la recherche plein texte. Ce type de dictionnaire remplace des mots avec un ensemble de synonymes, ce qui rend possible la recherche d'un mot en utilisant un de ses synonymes.

F.7.1. Configuration

Un dictionnaire dict_xsyn accepte les options suivantes :

  • keeporig indique si le mot original est inclus dans la recherche (si true, valeur par défaut), ou seulement ses synonymes (si false) ;

  • rules est le nom du fichier contenant la liste des synonymes. Ce fichier doit être stocké dans $SHAREDIR/tsearch_data/ (où $SHAREDIR est le répertoire des données partagées de la distribution PostgreSQL™). Son nom doit se terminer par .rules (cette extension n'est pas à inclure dans le paramètre rules).

Le fichier rules a le format suivant :

  • chaque ligne représente un groupe de synonymes pour un mot simple, donné en premier sur la ligne. Les synonymes sont séparés par une espace :

    mot syn1 syn2 syn3
        
    
  • le signe dièse (#) est un délimiteur de commentaires. Il peut apparaître dans la ligne. Le reste de la ligne est ignoré.

Un exemple est donné dans xsyn_sample.rules qui est installé dans $SHAREDIR/tsearch_data/.

F.7.2. Utilisation

L'exécution du script d'installation crée un modèle xsyn_template de recherche plein texte et un dictionnaire xsyn basé sur le modèle, avec des paramètres par défaut. Il est possible de modifier les paramètres, par exemple :

mydb# ALTER TEXT SEARCH DICTIONARY xsyn (RULES='my_rules', KEEPORIG=false);
ALTER TEXT SEARCH DICTIONARY

ou de créer de nouveaux dictionnaires basés sur le modèle.

Pour tester le dictionnaire :

mydb=# SELECT ts_lexize('xsyn', 'word');
      ts_lexize
-----------------------
 {word,syn1,syn2,syn3}

mais une utilisation réelle implique son ajout dans une configuration de recherche plein texte comme décrit dans Chapitre 12, Recherche plein texte. Cela pourrait ressembler à ceci :

ALTER TEXT SEARCH CONFIGURATION english
    ALTER MAPPING FOR word, asciiword WITH xsyn, english_stem;