PostgreSQLLa base de données la plus sophistiquée au monde.

E.24. Version 8.1

[Note]

Date de sortie

2005-11-08

E.24.1. Aperçu

Modifications principales apportées par cette version :

Amélioration des accès concurrents au cache de tampon partagé (Tom) ;

L'accès au cache de tampon partagé posait des problèmes d'extensibilité, en particulier sur les systèmes multi-CPU. Dans cette version, la pose de verrous dans le gestionnaire de tampons a été modifiée pour réduire les collisions de verrous et améliorer l'extensibilité. Le gestionnaire de tampon a été changé pour une politique de remplacement fonction d'un « balayage horaire ».

Les parcours d'index peuvent utiliser une carte en mémoire (Tom) ;

Dans les versions précédentes, un seul index pouvait être utilisé pour les recherches sur une table. Avec cette fonctionnalité, si une requête contient WHERE tab.col1 = 4 and tab.col2 = 9, et qu'il n'y a pas d'index multi-colonnes sur col1 et col2, mais qu'il y a un index sur col1 et un autre sur col2, il est possible de parcourir les deux index et de combiner leur résultat en mémoire. La récupération ne concerne alors que les lignes qui satisfont les restrictions sur col1 et col2 simultanément. C'est très utile dans les environnements à requêtes non-structurées nombreuses et pour lesquels il est impossible de construire les index pour toutes les conditions d'accès. Les parcours de cartes sont utiles même dans le cas d'index simple, puisqu'ils réduisent les accès aléatoires nécessaires. Un parcours de carte d'index est efficace pour la récupération de larges portions de table, contrairement aux parcours d'index pleins.

Ajout de la validation à deux-phases (two-phase commit) (Heikki Linnakangas, Alvaro, Tom) ;

La validation à deux phases permet la «  prépartion  » de transactions sur plusieurs ordinateurs, et lorque tous les ordinateurs ont correctement préparer leurs transactions (aucune n'a échoué), toutes les transactions sont validées. Si une machine tombe après la préparation, la transaction ainsi préparée peut être validée après le redémarrage de la machine. La nouvelle syntaxe inclut PREPARE TRANSACTION et COMMIT/ROLLBACK PREPARED. Une nouvelle vue système pg_prepared_xacts a également été ajoutée.

Création d'un nouveau système de rôle en remplacement des utilisateurs et groupes (Stephen Frost)

Les rôles sont une combinaison des utilisateurs et groupes. Comme des utilisateurs, ils peuvent avoir des possibilités de connexion, et comme des groupes, un rôle peut avoir d'autres rôles comme membres. Les rôles enlèvent fondamentalement la distinction entre les utilisateurs et les groupes. Par exemple, un rôle peu:

  • Avoir les possibilités de connexions (optionnel)

  • Posséder des objets

  • Détenir les autorisations d'accès pour des objets de base de données

  • Hériter des permissions des autres rôles en tant que membre de

Une fois qu'un rôle se connecte en tant qu'un autre rôle, il obtient les droits du rôle de connexion et ceux des rôles hérités, et peut utiliser SET ROLE pour basculer sur d'autres rôles dont il est membre. Cette fonctionnalité est une généralisation du concept des rôles dans le standard SQL. Cette modification remplacer aussi pg_shadow et pg_group par les catalogues spécifiques aux rôles, pg_authid et pg_auth_members. Les anciennes tables sont redéfinies comme des vues en lecture seule qui se basent sur les nouvelles tables des rôles.

Utiliser automatiquement les index pour MIN() et MAX() (Tom)

Dans les versions précédentes, la seule manière d'utiliser un index pour MIN() ou MAX() était d'écrire la requête SELECT col FROM tab ORDER BY col LIMIT 1. L'utilisation d'index se produit maintenant automatiquement.

Déplacement de /contrib/pg_autovacuum dans le serveur principal (Alvaro)

L'intégration d'autovacuum dans le serveur lui permet d'être automatiquement lancé et arrêté lors de la synchro avec le serveur de base de données, et permet à l'autovacuum d'être configuré dans postgresql.conf.

Ajout de verrous partagés au niveau ligne en utilisant SELECT ... FOR SHARE (Alvaro)

Bien que le système de verrous du MVCC de PostgreSQL™ permet aux SELECT de ne jamais bloquer les écritures et, du coup, n'a pas besoin de verrous ligne partagés pour des opérations typiques, les verrous partagés sont utiles pour les applications qui réclament un verrouillage partagé des lignes. En particulier, cela réduit les prérequis de verrouillage imposés par les vérifications d'intégrité référentielle.

Ajout de dépendances sur les objets partagés, et plus particulièrement les rôles (Alvaro)

Cette extension du mécanisme de dépendances empêche la suppression de rôles quand il existe dans la base des objets qui leur appartiennent. Auparavant, il était possible de rendre « orphelins » des objets en supprimant leur propriétaire. Bien qu'il était possible de contourner le problème, c'était sale et déplaisant.

Amélioration des performances sur les tables partitionnées (Simon)

Le nouveau paramètre de configuration, constraint_exclusion, évite la recherche de tables enfants où les contraintes indiquent qu'aucune ligne n'existe dans la table enfant.

Ceci permet un type basique de partitionnement de tables. Si les tables enfants stockent des étendues séparées de clés et qu'elles sont forcées par des contraintes CHECK appropriées, l'optimiseur ne s'occupera pas des tables enfants où la contrainte ganratie qu'aucune ligne correspondante n'existe dans la table enfant.

E.24.2. Migration vers la version 8.1

Une sauvegarde/restauration utilisant pg_dump est requise pour ceux qui souhaitent migrer leurs données des versions précédentes.

Les notes de la version 8.0 annonçaient la suppression de la fonction to_char() pour les intervalles en 8.1. Néanmoins, comme aucune API meilleure n'a été suggérée, to_char(interval) a été améliorée en 8.1 et restera dans le serveur.

Il existe quelques incompatibilités :

  • add_missing_from est maintenant faux par défaut (Neil)

    Par défaut, nous générons une erreur si une table est utilisé dans une requête sans une référence FROM. L'ancien comportement est toujours disponible mais le paramètre doit être positionné à 'true' pour l'obtenir.

    Il pourrait être nécessaire de configurer add_missing_from à true pour charger une sauvegarde existante si la sauvegarde contient des vues ou des règles créées en utilisant la syntaxe du FROM implicite. Ceci n'arrivera qu'une fois car PostgreSQL™ 8.1 convertira ces vues et ces règles à la syntaxe standard du FROM explicite. Les sauvegardes suivantes n'auront donc plus le problème.

  • Une chaîne de longueur nulle ('') pour une champ de type float4/float8/oid causera l'envoi d'une erreur. Elle ne sera plus traitée comme un zéro (Neil)

    Cette modification est cohérente avec la gestion actuelle des chaînes de longueur nulle pour les entiers. Ce changement avait été annoncé en 8.0.

  • default_with_oids est maintenant faux par défaut (Neil)

    Avec cette option configurée à faux, les tables créées par l'utilisateur n'ont plus de colonne OID sauf si WITH OIDS est indiqué en option de CREATE TABLE. Bien que les OID ont existé sur toutes les versions de PostgreSQL™, leut utilisation est limitée car elles sont uniquement sur quatre octets et le compteur est partagé sur toutes les bases installées dans le cluster. La façon préférée d'identifier les lignes de façon unique est via des séquences et le type SERIAL qui sont supportés depuis PostgreSQL™ 6.4.

  • Ajout de la syntaxe E'' pour que les chaînes ordinaires puissent éventuellement traiter les antislash littéralement (Bruce)

    Actuellement, PostgreSQL™ traite l'antislash dans une constante de type chaîne comme l'introduction d'une séquence d'échappement spéciale, par exemple \n ou \010. Bien que cela facilite la saisie de ces valeurs, c'est un comportement non standard qui rend difficile le portage des applications vers d'autres SGBD. Pour cette raison, le projet PostgreSQL™ planifie la suppression de la signification spéciale des antislashs dans les chaînes. Pour une compatibilité ascendante, une nouvelle syntaxe de chaîne a été créée. Cette nouvelle syntaxe correspond à un E immédiatement suivi d'un guillemet simple qui commence la chaîne, par exemple E'hi\n'. Bien que cette version ne modifie pas la gestion des antislashs dans les chaînes, elle ajoute de nouveaux paramètres de configuration pour aider les utilisateurs à migrer leurs applications vers les prochaines versions :

    • standard_conforming_strings -- cette version traite-t'elle les antislashs de façon littérale dans les chaînes ?

    • escape_string_warning -- avertit sur l'utilisation d'antislasgs dans des chaînes ordinaires (donc sans E).

    La valeur de standard_conforming_strings est seulement disponible en lecture. Les applications peuvent récupérer la valeur pour savoir de quelle façon elles doivent traiter les antislashs. (La présence du paramètre est en soi une indication que la syntaxe de chaîne E'' est supportée.) Dans une prochaine version, standard_conforming_strings vaudra vrai, signifiant que les antislashs devront être traités littéralement dans les chaînes non E. Pour vous préparer à ce changement, utilisez des chaînes E'' pour celles qui nécessitent un traitement spécial des antislashs et activer escape_string_warning pour trouver les chaînes supplémentaires qui ont besoin d'être converties pour utiliser E''. De plus, utilisez deux guillemets simples ('') pour intégrer un guillemet simple littéral dans une chaîne plutôt que la syntaxe supportée par PostgreSQL™ de l'antislash suivi du guillemet (\'). Cette syntaxe est conforme au standard et ne nécessite pas l'utilisation de la syntaxe de chaîne E''. Vous pouvez aussi utiliser la syntaxe de chaîne $$ qui ne traitent pas spécifiquement les antislashs.

  • Fait que REINDEX DATABASE ré-indexe tous les index de la base (Tom)

    Auparavant, REINDEX DATABASE ré-indexait seulement les tables systèmes. Ce nouveau comportement semble plus intuitif. Une nouvelle commande REINDEX SYSTEM fournit l'ancienne fonctionnalité de réindexage des seules tables systèmes.

  • Les descripteurs des objets larges en lecture seule respectent maintenant les images MVCC.

    Quand un objet large est ouvert avec INV_READ (et non pas INV_WRITE), la donnée lue du descripteur correspondra maintenant à une « image » de l'état de l'objet large au début de l'image de la transaction utilisée par la requête qui a fait appel à lo_open(). Pour obtenir l'ancien comportement renvoyant en permanence la dernière donnée validée, ajoutez INV_WRITE dans les options de lo_open().

  • Ajout des bonnes dépendances pour les arguments des fonctions sur les séquences (Tom)

    Dans les anciennes versions, les noms de séquence passés à nextval(), currval() et setval() étaient stockés sous la forme de simples chaînes de texte, signifiant que le renommage ou la suppression d'une séquence utilisée dans une clause DEFAULT rendait la clause invalide. Cette version stocke tous les arguments d'une fonction d'une séquence nouvellement créée en tant qu'OID interne, leur permettant de tracer le renommage des séquences et d'ajouter des informations de dépendances qui empêchent une suppression erronées d'une séquence. Cela assure aussi une certaine immunité des clauses DEFAULT au renommage de schéma et aux modifications du chemin de recherche des schémas.

    Certaines applications pourraient se fier à l'ancien comportement de recherche à l'exécution des noms de séquence. C'est toujours possible en convertissant explicitement l'argument en text, par exemple nextval('myseq'::text).

    Les sauvegardes de bases antérieures à la 8.1 chargées en 8.1 utiliseront l'ancienne représentation textuelle et, du coup, ne bénéficieront pas des fonctionnalités des arguments stockés d'après leur OID. Néanmoins, il est possible de mettre à jour une base contenant des clauses DEFAULT en texte. Tout d'abord, sauvegardez cette requête dans un fichier, comme fixseq.sql :

    SELECT  'ALTER TABLE ' ||
        pg_catalog.quote_ident(n.nspname) || '.' ||
        pg_catalog.quote_ident(c.relname) ||
        ' ALTER COLUMN ' || pg_catalog.quote_ident(a.attname) ||
        ' SET DEFAULT ' ||
        regexp_replace(d.adsrc,
                       $$val\(\(('[^']*')::text\)::regclass$$,
                       $$val\(\1$$,
                       'g') ||
        ';'
    FROM    pg_namespace n, pg_class c, pg_attribute a, pg_attrdef d
    WHERE   n.oid = c.relnamespace AND
        c.oid = a.attrelid AND
        a.attrelid = d.adrelid AND
        a.attnum = d.adnum AND
        d.adsrc ~ $$val\(\('[^']*'::text\)::regclass$$;
    

    Ensuite, exécutez la requête sur une base pour découvrir les ajustements nécessaires, comme pour cette base db1 :

    psql -t -f fixseq.sql db1
    

    Ceci affichera les commandes ALTER TABLE nécessaires pour convertir la base à la représentation OID la plus récente. Si les commandes semblent raisonnables, exécutez ceci pour mettre à jour la base de données :

    psql -t -f fixseq.sql db1 | psql -e db1
    

    Ce processus doit être répétée pour chaque base à mettre à jour.

  • Dans psql, les séquences \{chiffre}+ sans guillemets sont traités comme des nombres codés en octal (Bruce)

    Dans les versions précédentes, les séquences \{chiffre}+ étaient traitées comme des nombres codés en décimal et les séquences \0{digit}+ l'étaient comme des nombres codés en octal. Cette modification a pour but la cohérence de traitement.

  • Suppression des grammaires utilisant les opérateurs % et ^ en préfixe et en suffixe. (Tom)

    Ils n'ont jamais été documentés et compliquaient l'utilisation de l'opérateur modulo (%) avec les nombres négatifs.

  • Rend &< et &> cohérent pour les polygones abec les opérateurs "over" du type box (Tom)

  • CREATE LANGUAGE peut ignorer les arguments fournis pour utiliser l'information provenant de pg_pltemplate (Tom)

    Un nouveau catalogue système nommé pg_pltemplate a été défini pour stocker des informations sur les définitions préférées des langages de procédure (comme par exemple si elles ont des fonctions de validation). Quand une telle entrée existe dans le catalogue pour le langage en cours de création, CREATE LANGUAGE ignorera tous ces paramètres sauf le nom du langage et utilisera à la place les informations du catalogue. Cette mesure a été prise à cause des problèmes de plus en plus fréquents de définition de langage obsolète chargée à partir d'anciennes sauvegardes. À partir de la 8.1, pg_dump sauvegardera les définitions de langage de procédures avec un simple CREATE LANGUAGE nom, se reposant sur l'entrée modèle existant au moment du chargement. Nous nous attendons à ce que cela soit une représentation plus pérenne.

  • Fait que pg_cancel_backend(int) renvoit une valeur de type boolean plutôt qu'un integer (Neil)

  • Certains utilisateurs ont des problèmes en chargeant des données UTF-8 en 8.1.X. Ceci est dû aux précédentes versions qui permettaient l'ajout de séquences d'octets UTF-8 invalides dans la base. Cette version accepte seulement les séquences UTF-8 valides. Vous pouvez corriger une sauvegarde en exécutant la commande iconv -c -f UTF-8 -t UTF-8 -o bonnesauvegarde.sql sauvegarde.sql. L'option -c supprime les séquences de caractères invalides. Un diff des deux fichiers affichera les séquences invalides. iconv lit le fichier en entrée en mémoire, donc il pourrait se révéler nécessaire de diviser la sauvegarde en plusieurs petits fichiers pour le traitement.

E.24.3. Modifications supplémentaires

Vous trouverez ci-dessous une liste détaillée des modifications supplémentaires réalisées pour PostgreSQL™ 8.1.

E.24.3.1. Améliorations des performances

  • Amélioration des performances des index GiST et R-tree (Neil)

  • Amélioration de l'optimiseur, ceci incluant le redimensionnement automatique des jointures hash (Tom)

  • Révision de l'API interne sur plusieurs domaines

  • Changement des CRC, passés de 64 à 32 bits, pour l'enregistrement des WAL (Tom)

    Nous avons déterminé que le coût supplémentaire du calcul des CRC en 64 bits était important et que le gain en fiabilité était trop marginal pour le justifier.

  • Empêche la création de gros trous vides dans les pages WAL (Tom)

  • Amélioration du comportement du spinlock sur les machines SMP, particulièrement pour les Opterons (Tom)

  • Autorise l'utilisation de colonnes non consécutives d'un index dans un index multicolonnes (Tom)

    Par exemple, cela permet l'utilisation d'un index sur les colonnes a, b, c dans une requête dont le filtre est WHERE a = 4 and c = 10.

  • Passe la journalisation WAL pour CREATE TABLE AS / SELECT INTO (Simon)

    Comme l'arrêt brutal durant un CREATE TABLE AS occasionnera la suppression de la table lors de l'opération de récupération, il n'y a aucune raison de conserver le chargement de la table dans les WAL. (Néanmoins, la journalisation se fait quand même si l'archivage des WAL est activé.)

  • Autorise l'accès en parallèle d'index GiST (Teodor, Oleg)

  • Ajout d'un paramètre de configuration full_page_writes pour contrôler l'écriture de pages complètes dans les WAL (Bruce)

    Pour empêcher que des écritures disques partielles corrompent la base de données, PostgreSQL™ écrit une copie complète de chaque page disque de la base dans les WAL la première fois que la page est modifiée après un point de vérification. Cette option désactive cette fonctionnalité pour gagner en rapidité. Ceci ne doit pas poser de problème avec des caches disques sur batterie où des écritures partielles de page ne peuvent pas arriver.

  • Utilisation de O_DIRECT si disponible lors de l'utilisation de O_SYNC pour wal_sync_method (Itagaki Takahiro)

    O_DIRECT fait que les écritures disques contournent le cache du noyau et cela améliore les performances pour les écritures des WAL.

  • Amélioration des performances du COPY FROM (Alon Goldshuv)

    Ceci se fait en lisant l'entrée de COPY par de plus gros morceaux, plutôt que caractère par caractère.

  • Amélioration des performances de COUNT(), SUM, AVG(), STDDEV() et VARIANCE() (Neil, Tom)

E.24.3.2. Modifications du serveur

  • Empêche les problèmes dûs à la réinitialisation de l'ID de transaction (XID) (Tom)

    Maintenant, le serveur avertira quand le compteur de transaction approche du point de réinitialisation. Si le compteur s'en approche trop, le serveur refusera les requêtes. Ceci permet de s'assurer que des données ne seront pas perdues avant que le VACUUM nécessaire ne soit réalisé.

  • Correction de problèmes avec des conflits entre des identifiants d'objets (OID) et des objets systèmes existants une fois que le compteur d'OID s'est réinitialisé (Tom)

  • Ajout d'un avertissement sur le besoin d'augmenter max_fsm_relations et max_fsm_pages lors des VACUUM (Ron Mayer)

  • Ajout du paramètre de configuration temp_buffers autorisant les utilisateurs à déterminer la taille du tampon local pour les accès aux tables temporaires (Tom)

  • Ajout de l'heure de début de la session et de l'adresse IP du client dans pg_stat_activity (Magnus)

  • Ajustement des vues pg_stat pour les parcours de bitmap (Tom)

    La signification de certains champs a changé légèrement.

  • Amélioration de la vue pg_locks (Tom)

  • Trace des requêtes côté client, PREPARE et EXECUTE (Simon)

  • Autorise l'indication de la sensibilité à la casse pour le nom Kerberos et le nom utilisateur dans postgresql.conf (Magnus)

  • Ajout du paramètre de configuration krb_server_hostname pour que le nom de l'hôte puisse être indiqué comme faisant parti du service principal (Todd Kover)

    S'il n'est pas configuré, aucun service principal correspondant à une entrée dans la table des clés ne peut être utilisé. Ceci est le nouveau comportement de Kerberos pour cette version.

  • Ajout d'options pour log_line_prefix (datage à la milliseconde avec %m et hôte distant avec %h) (Ed L.)

  • Ajout des journaux WAL pour les index GiST (Teodor, Oleg)

    Les index GiST sont maintenant fiables en ce qui concernent les arrêts brutaux et la récupération à un instant donné.

  • Suppression des anciens fichiers *.backup lors du pg_stop_backup() (Bruce)

    Ceci empêche qu'un grand nombre de fichiers *.backup restent dans pg_xlog/.

  • Ajout des paramètres de configuration contrôlant certaines constantes keep-alive de TCP/IP (idle, interval et count) (Oliver Jowett)

    Ces valeurs sont modifiables pour permettre une détection plus rapide de la perte de connexions clientes.

  • Ajout de limites de connexion par utilisateur et par base de données (Petr Jelinek)

    En utilisant ALTER USER et ALTER DATABASE, des limites peuvent être enregistrées sur le nombre maximum de sessions connectées en même temps pour un utilisateur spécifique ou une base spécifique. Configurer la limite à zéro empêche l'utilisateur de se connecter ou empêche toute connexion sur cette base.

  • Autorise plus de 2 Go de mémoire partagé et de work_memory par processus serveur sur les machines 64 bits (Koichi Suzuki)

  • Le nouveau catalogue système pg_pltemplate permet la surcharge des définitions obsolètes de langages de procédures dans les sauvegardes (Tom)

E.24.3.3. Modifications des requêtes

  • Ajout des vues temporaires (Koju Iijima, Neil)

  • Correction de HAVING sans fonctions d'agrégat ou GROUP BY pour que la requête ne renvoit qu'un seul groupe (Tom)

    Auparavant, la clause HAVING aurait été traitée comme une clause WHERE. Ce n'était pas conforme au standard.

  • Ajout de la clause USING pour indiquer des tables supplémentaires dans une commande DELETE (Euler Taveira de Oliveira, Neil)

    Dans les versions précédentes, il n'existait pas de méthode claire pour utiliser des tables supplémentaires dans des jointures sur une instruction DELETE. UPDATE a déjà une clause FROM pour remplir ce but.

  • Ajout du support de \x pour les échappements de nombres en hexadécimal dans les chaînes du moteur et dans celles d'ecpg (Bruce)

    Cela fonctionne comme la syntaxe d'échappement \x en C. Les échappements de nombres en octal sont déjà supportés.

  • Ajout de la syntaxe de requête BETWEEN SYMMETRIC (Pavel Stehule)

    Cette fonctionnalité autorise l'utilisation de comparaisons BETWEEN sans nécessiter que la première valeur soit inférieure à la seconde. Par exemple, 2 BETWEEN [ASYMMETRIC] 3 AND 1 renvoie faux alors que 2 BETWEEN SYMMETRIC 3 AND 1 renvoie vrai. BETWEEN ASYMMETRIC était déjà supporté.

  • Ajout de l'option NOWAIT pour SELECT ... FOR UPDATE/SHARE (Hans-Juergen Schoenig)

    Bien que le paramètre de configuration statement_timeout autorise l'annulation d'une requête prenant plus d'un certain temps à s'exécuter, l'option NOWAIT permet l'annulation d'une requête à partir du moment où la commande SELECT ... FOR UPDATE/SHARE n'acquiert pas immédiatement un verrou de ligne.

E.24.3.4. Changement des manipulations d'objets

  • Trace les dépendances des objets partagés (Alvaro)

    PostgreSQL™ allows global tables (users, databases, tablespaces) to reference information in multiple databases. This addition adds dependency information for global tables, so, for example, user ownership can be tracked across databases, so a user who owns something in any database can no longer be removed. Dependency tracking already existed for database-local objects.

  • Allow limited ALTER OWNER commands to be performed by the object owner (Stephen Frost)

    Prior releases allowed only superusers to change object owners. Now, ownership can be transferred if the user executing the command owns the object and would be able to create it as the new owner (that is, the user is a member of the new owning role and that role has the CREATE permission that would be needed to create the object afresh).

  • Add ALTER object SET SCHEMA capability for some object types (tables, functions, types) (Bernd Helmle)

    This allows objects to be moved to different schemas.

  • Ajout de ALTER TABLE ENABLE/DISABLE TRIGGER pour désactiver les déclencheurs (Satoshi Nagayasu)

E.24.3.5. Utility Command Changes

  • Allow TRUNCATE to truncate multiple tables in a single command (Alvaro)

    Because of referential integrity checks, it is not allowed to truncate a table that is part of a referential integrity constraint. Using this new functionality, TRUNCATE can be used to truncate such tables, if both tables involved in a referential integrity constraint are truncated in a single TRUNCATE command.

  • Properly process carriage returns and line feeds in COPY CSV mode (Andrew)

    In release 8.0, carriage returns and line feeds in CSV COPY TO were processed in an inconsistent manner. (This was documented on the TODO list.)

  • Add COPY WITH CSV HEADER to allow a header line as the first line in COPY (Andrew)

    This allows handling of the common CSV usage of placing the column names on the first line of the data file. For COPY TO, the first line contains the column names, and for COPY FROM, the first line is ignored.

  • On Windows, display better sub-second precision in EXPLAIN ANALYZE (Magnus)

  • Add trigger duration display to EXPLAIN ANALYZE (Tom)

    Prior releases included trigger execution time as part of the total execution time, but did not show it separately. It is now possible to see how much time is spent in each trigger.

  • Add support for \x hex escapes in COPY (Sergey Ten)

    Previous releases only supported octal escapes.

  • Make SHOW ALL include variable descriptions (Matthias Schmidt)

    SHOW varname still only displays the variable's value and does not include the description.

  • Make initdb create a new standard database called postgres, and convert utilities to use postgres rather than template1 for standard lookups (Dave)

    In prior releases, template1 was used both as a default connection for utilities like createuser, and as a template for new databases. This caused CREATE DATABASE to sometimes fail, because a new database cannot be created if anyone else is in the template database. With this change, the default connection database is now postgres, meaning it is much less likely someone will be using template1 during CREATE DATABASE.

  • Create new reindexdb command-line utility by moving /contrib/reindexdb into the server (Euler Taveira de Oliveira)

E.24.3.6. Data Type and Function Changes

  • Add MAX() and MIN() aggregates for array types (Koju Iijima)

  • Fix to_date() and to_timestamp() to behave reasonably when CC and YY fields are both used (Karel Zak)

    If the format specification contains CC and a year specification is YYY or longer, ignore the CC. If the year specification is YY or shorter, interpret CC as the previous century.

  • Add md5(bytea) (Abhijit Menon-Sen)

    md5(text) already existed.

  • Add support for numeric ^ numeric based on power(numeric, numeric)

    The function already existed, but there was no operator assigned to it.

  • Fix NUMERIC modulus by properly truncating the quotient during computation (Bruce)

    In previous releases, modulus for large values sometimes returned negative results due to rounding of the quotient.

  • Add a function lastval()(Dennis Björklund)

    lastval() is a simplified version of currval(). It automatically determines the proper sequence name based on the most recent nextval() or setval() call performed by the current session.

  • Add to_timestamp(DOUBLE PRECISION) (Michael Glaesemann)

    Converts Unix seconds since 1970 to a TIMESTAMP WITH TIMEZONE.

  • Add pg_postmaster_start_time() function (Euler Taveira de Oliveira, Matthias Schmidt)

  • Allow the full use of time zone names in AT TIME ZONE, not just the short list previously available (Magnus)

    Previously, only a predefined list of time zone names were supported by AT TIME ZONE. Now any supported time zone name can be used, e.g.:

             SELECT CURRENT_TIMESTAMP AT TIME ZONE 'Europe/London';
            
    

    In the above query, the time zone used is adjusted based on the daylight saving time rules that were in effect on the supplied date.

  • Add GREATEST() and LEAST() variadic functions (Pavel Stehule)

    These functions take a variable number of arguments and return the greatest or least value among the arguments.

  • Add pg_column_size() (Mark Kirkwood)

    This returns storage size of a column, which might be compressed.

  • Add regexp_replace() (Atsushi Ogawa)

    This allows regular expression replacement, like sed. An optional flag argument allows selection of global (replace all) and case-insensitive modes.

  • Fix interval division and multiplication (Bruce)

    Previous versions sometimes returned unjustified results, like '4 months'::interval / 5 returning '1 mon -6 days'.

  • Fix roundoff behavior in timestamp, time, and interval output (Tom)

    This fixes some cases in which the seconds field would be shown as 60 instead of incrementing the higher-order fields.

  • Add a separate day field to type interval so a one day interval can be distinguished from a 24 hour interval (Michael Glaesemann)

    Days that contain a daylight saving time adjustment are not 24 hours long, but typically 23 or 25 hours. This change creates a conceptual distinction between intervals of « so many days » and intervals of « so many hours ». Adding 1 day to a timestamp now gives the same local time on the next day even if a daylight saving time adjustment occurs between, whereas adding 24 hours will give a different local time when this happens. For example, under US DST rules:

             '2005-04-03 00:00:00-05' + '1 day' = '2005-04-04 00:00:00-04'
             '2005-04-03 00:00:00-05' + '24 hours' = '2005-04-04 01:00:00-04'
            
    
  • Add justify_days() and justify_hours() (Michael Glaesemann)

    These functions, respectively, adjust days to an appropriate number of full months and days, and adjust hours to an appropriate number of full days and hours.

  • Move /contrib/dbsize into the backend, and rename some of the functions (Dave Page, Andreas Pflug)

    • pg_tablespace_size()

    • pg_database_size()

    • pg_relation_size()

    • pg_total_relation_size()

    • pg_size_pretty()

    pg_total_relation_size() includes indexes and TOAST tables.

  • Add functions for read-only file access to the cluster directory (Dave Page, Andreas Pflug)

    • pg_stat_file()

    • pg_read_file()

    • pg_ls_dir()

  • Add pg_reload_conf() to force reloading of the configuration files (Dave Page, Andreas Pflug)

  • Add pg_rotate_logfile() to force rotation of the server log file (Dave Page, Andreas Pflug)

  • Change pg_stat_* views to include TOAST tables (Tom)

E.24.3.7. Encoding and Locale Changes

  • Rename some encodings to be more consistent and to follow international standards (Bruce)

    • UNICODE is now UTF8

    • ALT is now WIN866

    • WIN is now WIN1251

    • TCVN is now WIN1258

    The original names still work.

  • Add support for WIN1252 encoding (Roland Volkmann)

  • Add support for four-byte UTF8 characters (John Hansen)

    Previously only one, two, and three-byte UTF8 characters were supported. This is particularly important for support for some Chinese character sets.

  • Allow direct conversion between EUC_JP and SJIS to improve performance (Atsushi Ogawa)

  • Allow the UTF8 encoding to work on Windows (Magnus)

    This is done by mapping UTF8 to the Windows-native UTF16 implementation.

E.24.3.8. General Server-Side Language Changes

  • Fix ALTER LANGUAGE RENAME (Sergey Yatskevich)

  • Allow function characteristics, like strictness and volatility, to be modified via ALTER FUNCTION (Neil)

  • Increase the maximum number of function arguments to 100 (Tom)

  • Allow SQL and PL/PgSQL functions to use OUT and INOUT parameters (Tom)

    OUT is an alternate way for a function to return values. Instead of using RETURN, values can be returned by assigning to parameters declared as OUT or INOUT. This is notationally simpler in some cases, particularly so when multiple values need to be returned. While returning multiple values from a function was possible in previous releases, this greatly simplifies the process. (The feature will be extended to other server-side languages in future releases.)

  • Move language handler functions into the pg_catalog schema

    This makes it easier to drop the public schema if desired.

  • Add SPI_getnspname() to SPI (Neil)

E.24.3.9. PL/PgSQL Server-Side Language Changes

  • Overhaul the memory management of PL/PgSQL functions (Neil)

    The parsetree of each function is now stored in a separate memory context. This allows this memory to be easily reclaimed when it is no longer needed.

  • Check function syntax at CREATE FUNCTION time, rather than at runtime (Neil)

    Previously, most syntax errors were reported only when the function was executed.

  • Allow OPEN to open non-SELECT queries like EXPLAIN and SHOW (Tom)

  • No longer require functions to issue a RETURN statement (Tom)

    This is a byproduct of the newly added OUT and INOUT functionality. RETURN can be omitted when it is not needed to provide the function's return value.

  • Add support for an optional INTO clause to PL/PgSQL's EXECUTE statement (Pavel Stehule, Neil)

  • Make CREATE TABLE AS set ROW_COUNT (Tom)

  • Define SQLSTATE and SQLERRM to return the SQLSTATE and error message of the current exception (Pavel Stehule, Neil)

    These variables are only defined inside exception blocks.

  • Allow the parameters to the RAISE statement to be expressions (Pavel Stehule, Neil)

  • Add a loop CONTINUE statement (Pavel Stehule, Neil)

  • Allow block and loop labels (Pavel Stehule)

E.24.3.10. PL/Perl Server-Side Language Changes

  • Allow large result sets to be returned efficiently (Abhijit Menon-Sen)

    This allows functions to use return_next() to avoid building the entire result set in memory.

  • Allow one-row-at-a-time retrieval of query results (Abhijit Menon-Sen)

    This allows functions to use spi_query() and spi_fetchrow() to avoid accumulating the entire result set in memory.

  • Force PL/Perl to handle strings as UTF8 if the server encoding is UTF8 (David Kamholz)

  • Add a validator function for PL/Perl (Andrew)

    This allows syntax errors to be reported at definition time, rather than execution time.

  • Allow PL/Perl to return a Perl array when the function returns an array type (Andrew)

    This basically maps PostgreSQL™ arrays to Perl arrays.

  • Allow Perl nonfatal warnings to generate NOTICE messages (Andrew)

  • Allow Perl's strict mode to be enabled (Andrew)

E.24.3.11. psql Changes

  • Add \set ON_ERROR_ROLLBACK to allow statements in a transaction to error without affecting the rest of the transaction (Greg Sabino Mullane)

    This is basically implemented by wrapping every statement in a sub-transaction.

  • Add support for \x hex strings in psql variables (Bruce)

    Octal escapes were already supported.

  • Add support for troff -ms output format (Roger Leigh)

  • Allow the history file location to be controlled by HISTFILE (Andreas Seltenreich)

    This allows configuration of per-database history storage.

  • Prevent \x (expanded mode) from affecting the output of \d tablename (Neil)

  • Add -L option to psql to log sessions (Lorne Sunley)

    This option was added because some operating systems do not have simple command-line activity logging functionality.

  • Make \d show the tablespaces of indexes (Qingqing Zhou)

  • Allow psql help (\h) to make a best guess on the proper help information (Greg Sabino Mullane)

    This allows the user to just add \h to the front of the syntax error query and get help on the supported syntax. Previously any additional query text beyond the command name had to be removed to use \h.

  • Add \pset numericlocale to allow numbers to be output in a locale-aware format (Eugen Nedelcu)

    For example, using C locale 100000 would be output as 100,000.0 while a European locale might output this value as 100.000,0.

  • Make startup banner show both server version number and psql's version number, when they are different (Bruce)

    Also, a warning will be shown if the server and psql are from different major releases.

E.24.3.12. pg_dump Changes

  • Add -n / --schema switch to pg_restore (Richard van den Berg)

    This allows just the objects in a specified schema to be restored.

  • Allow pg_dump to dump large objects even in text mode (Tom)

    With this change, large objects are now always dumped; the former -b switch is a no-op.

  • Allow pg_dump to dump a consistent snapshot of large objects (Tom)

  • Dump comments for large objects (Tom)

  • Add --encoding to pg_dump (Magnus Hagander)

    This allows a database to be dumped in an encoding that is different from the server's encoding. This is valuable when transferring the dump to a machine with a different encoding.

  • Rely on pg_pltemplate for procedural languages (Tom)

    If the call handler for a procedural language is in the pg_catalog schema, pg_dump does not dump the handler. Instead, it dumps the language using just CREATE LANGUAGE name, relying on the pg_pltemplate catalog to provide the language's creation parameters at load time.

E.24.3.13. libpq Changes

  • Add a PGPASSFILE environment variable to specify the password file's filename (Andrew)

  • Add lo_create(), that is similar to lo_creat() but allows the OID of the large object to be specified (Tom)

  • Make libpq consistently return an error to the client application on malloc() failure (Neil)

E.24.3.14. Source Code Changes

  • Fix pgxs to support building against a relocated installation

  • Add spinlock support for the Itanium processor using Intel compiler (Vikram Kalsi)

  • Add Kerberos 5 support for Windows (Magnus)

  • Add Chinese FAQ (laser@pgsqldb.com)

  • Rename Rendezvous to Bonjour to match OS/X feature renaming (Bruce)

  • Add support for fsync_writethrough on Darwin (Chris Campbell)

  • Streamline the passing of information within the server, the optimizer, and the lock system (Tom)

  • Allow pg_config to be compiled using MSVC (Andrew)

    This is required to build DBD::Pg using MSVC.

  • Remove support for Kerberos V4 (Magnus)

    Kerberos 4 had security vulnerabilities and is no longer maintained.

  • Code cleanups (Coverity static analysis performed by EnterpriseDB)

  • Modify postgresql.conf to use documentation defaults on/off rather than true/false (Bruce)

  • Enhance pg_config to be able to report more build-time values (Tom)

  • Allow libpq to be built thread-safe on Windows (Dave Page)

  • Allow IPv6 connections to be used on Windows (Andrew)

  • Add Server Administration documentation about I/O subsystem reliability (Bruce)

  • Move private declarations from gist.h to gist_private.h (Neil)

    In previous releases, gist.h contained both the public GiST API (intended for use by authors of GiST index implementations) as well as some private declarations used by the implementation of GiST itself. The latter have been moved to a separate file, gist_private.h. Most GiST index implementations should be unaffected.

  • Overhaul GiST memory management (Neil)

    GiST methods are now always invoked in a short-lived memory context. Therefore, memory allocated via palloc() will be reclaimed automatically, so GiST index implementations do not need to manually release allocated memory via pfree().

E.24.3.15. Modifications des modules contrib

  • Ajout du module contrib /contrib/pg_buffercache (Mark Kirkwood)

    Ceci affiche le contenu du cache tampon pour le débogage et pour des tests de performance.

  • Suppression de /contrib/array car il est devenu obsolète (Tom)

  • Nettoyage du module /contrib/lo (Tom)

  • Déplacement de /contrib/findoidjoins dans /src/tools (Tom)

  • Renommage des opérateurs <<, >>, &< et &> dans /contrib/cube

    Ces opérateurs n'étaient plus utiles.

  • Amélioration de /contrib/btree_gist (Janko Richter)

  • Amélioration de /contrib/pgbench (Tomoaki Sato, Tatsuo)

    Il existe maintenant une fonctionnalité pour tester avec des scripts SQL fournis par l'utilisateur, plutôt que par des séquences de commandes codées en dur.

  • Amélioration de /contrib/pgcrypto (Marko Kreen)

    • Implémentation du chiffrement des clés OpenPGP symétriques et public

      Les algorithmes à clé publique RSA et Elgamal sont supportés.

    • Construction autonome : inclut les hashs SHA256/384/512, et Fortuna PRNG

    • Construction OpenSSL : support de 3DES, utilisation d'un AES interne avec OpenSSL < 0.9.7

    • Prend les paramètres de constructions (OpenSSL, zlib) à partir du résultat de configure

      Il n'est plus nécessaire de modifier le fichier Makefile.

    • Suppression du support pour libmhash et libmcrypt