PostgreSQLLa base de données la plus sophistiquée au monde.
Documentation PostgreSQL 16.6 » Annexes » Modules et extensions supplémentaires fournis » dict_xsyn -- dictionnaire d'exemple pour la recherche de synonyme avec la recherche plein texte

F.14. dict_xsyn -- dictionnaire d'exemple pour la recherche de synonyme avec la recherche plein texte #

Le module dict_xsyn (Extended Synonym Dictionary, dictionnaire étendu de synonymes) est un exemple de modèle de dictionnaire pour la recherche plein texte. Ce type de dictionnaire remplace des mots avec un ensemble de synonymes, ce qui rend possible la recherche d'un mot en utilisant un de ses synonymes.

F.14.1. Configuration #

Un dictionnaire dict_xsyn accepte les options suivantes :

  • matchorig contrôle si le mot original est accepté par le dictionnaire. Par défaut à true.

  • matchsynonyms contrôle si les synonymes sont acceptés par le dictionnaire. Par défaut à false.

  • keeporig contrôle si le mot original est inclus dans la sortie du dictionnaire. Par défaut à true.

  • keepsynonyms contrôle si les synonymes sont inclus dans la sortie du dictionnaire. Par défaut à true.

  • rules est le nom du fichier contenant la liste des synonymes. Ce fichier doit être stocké dans $SHAREDIR/tsearch_data/ (où $SHAREDIR est le répertoire des données partagées de la distribution PostgreSQL). Son nom doit se terminer par .rules (cette extension n'est pas à inclure dans le paramètre rules).

Le fichier rules a le format suivant :

  • chaque ligne représente un groupe de synonymes pour un mot simple, donné en premier sur la ligne. Les synonymes sont séparés par une espace :

    mot syn1 syn2 syn3
        
  • le signe dièse (#) est un délimiteur de commentaires. Il peut apparaître n'importe où dans la ligne. Le reste de la ligne sera ignoré.

Un exemple est donné dans xsyn_sample.rules qui est installé dans $SHAREDIR/tsearch_data/.

F.14.2. Utilisation #

Installer l'extension dict_xsyn crée un modèle xsyn_template de recherche plein texte et un dictionnaire xsyn basé sur le modèle, avec des paramètres par défaut. Il est possible de modifier les paramètres, par exemple :

ma_base# ALTER TEXT SEARCH DICTIONARY xsyn (RULES='my_rules', KEEPORIG=false);
ALTER TEXT SEARCH DICTIONARY
   

ou de créer de nouveaux dictionnaires basés sur le modèle.

Pour tester le dictionnaire :

ma_base=# SELECT ts_lexize('xsyn', 'word');
      ts_lexize
-----------------------
 {syn1,syn2,syn3}

ma_base# ALTER TEXT SEARCH DICTIONARY xsyn (RULES='my_rules', KEEPORIG=true);
ALTER TEXT SEARCH DICTIONARY

ma_base=# SELECT ts_lexize('xsyn', 'word');
      ts_lexize
-----------------------
 {word,syn1,syn2,syn3}

ma_base# ALTER TEXT SEARCH DICTIONARY xsyn (RULES='my_rules', KEEPORIG=false, MATCHSYNONYMS=true);
ALTER TEXT SEARCH DICTIONARY

ma_base=# SELECT ts_lexize('xsyn', 'syn1');
      ts_lexize
-----------------------
 {syn1,syn2,syn3}

ma_base# ALTER TEXT SEARCH DICTIONARY xsyn (RULES='my_rules', KEEPORIG=true, MATCHORIG=false, KEEPSYNONYMS=false);
ALTER TEXT SEARCH DICTIONARY

ma_base=# SELECT ts_lexize('xsyn', 'syn1');
      ts_lexize
-----------------------
 {word}
   

Une utilisation réelle implique son ajout dans une configuration de recherche plein texte comme décrit dans Chapitre 12. Cela pourrait ressembler à ceci :

ALTER TEXT SEARCH CONFIGURATION english
    ALTER MAPPING FOR word, asciiword WITH xsyn, english_stem;