PostgreSQL 12 kommer med en ny funktion kaldet genererede kolonner . Andre populære RDBMS'er understøtter allerede genererede kolonner som "beregnede kolonner" eller "virtuelle kolonner." Med Postgres 12 kan du nu også bruge det i PostgreSQL. Læs videre for at lære mere.
Hvad er en genereret kolonne?
En genereret kolonne ligner en visning, men for kolonner. Her er et grundlæggende eksempel:
db=# CREATE TABLE t (w real, h real, area real GENERATED ALWAYS AS (w*h) STORED);
CREATE TABLE
db=# INSERT INTO t (w, h) VALUES (10, 20);
INSERT 0 1
db=# SELECT * FROM t;
w | h | area
----+----+------
10 | 20 | 200
(1 row)
db=#
Vi oprettede en tabel t med to regulære kolonner kaldet w og h ,og en genereret kolonne kaldet område . Værdien af areal er beregnet til oprettelsestidspunkt for rækken, og bevares på disken.
Værdien af genererede kolonner beregnes igen, når rækken opdateres:
db=# UPDATE t SET w=40;
UPDATE 1
db=# SELECT * FROM t;
w | h | area
----+----+------
40 | 20 | 800
(1 row)
db=#
Sådan funktionalitet blev tidligere normalt opnået med triggere, men med genererede kolonner bliver dette meget mere elegant og renere.
Et par punkter, du bør vide om genererede kolonner:
- Vedholdenhed :I øjeblikket skal værdien af genererede kolonner vedblive og kan ikke beregnes direkte på forespørgselstidspunktet. "LAGET"-søgeordet skal være til stede i kolonnedefinitionen.
- Udtrykket :Udtrykket, der bruges til at beregne værdien, skal væreuforanderligt , det vil sige, det skal være deterministisk. Det kan afhænge af andre kolonner, men ikke andre genererede kolonner, i tabellen.
- Indekser :Genererede kolonner kan bruges i indekser, men kan ikke bruges som en partitionsnøgle til partitionerede tabeller.
- Kopiér og pg_dump :Værdierne af genererede kolonner udelades i outputtet af “pg_dump” og “COPY table” kommandoer, da det er unødvendigt. Du kan udtrykkeligt inkludere dem i COPY ved at bruge
COPY (SELECT * FROM t) TO STDOUT
i stedet forCOPY t TO STDOUT
.
Et praktisk eksempel
Lad os tilføje fuldtekstsøgningsstøtte til en tabel ved hjælp af genererede kolonner. Her er en tabel, der gemmer hele teksten i alle Shakespeares skuespil:
CREATE TABLE scenes (
workid text, -- denotes the name of the play (like "macbeth")
act integer, -- the act (like 1)
scene integer, -- the scene within the act (like 7)
description text, -- short desc of the scene (like "Macbeth's castle.")
body text -- full text of the scene
);
Sådan ser dataene ud:
shakespeare=# SELECT workid, act, scene, description, left(body, 200) AS body_start
shakespeare-# FROM scenes WHERE workid='macbeth' AND act=1 AND scene=1;
workid | act | scene | description | body_start
---------+-----+-------+-----------------+----------------------------------------------
macbeth | 1 | 1 | A desert place. | [Thunder and lightning. Enter three Witches]+
| | | | +
| | | | First Witch: When shall we three meet again +
| | | | In thunder, lightning, or in rain? +
| | | | +
| | | | Second Witch: When the hurlyburly's done, +
| | | | When the battle's lost and won. +
| | | |
(1 row)
Vi tilføjer en kolonne, der vil indeholde leksemerne i værdien "body". Funktionen to_tsvector returnerer de leksemer, vi har brug for:
shakespeare=# SELECT to_tsvector('english', 'move moving moved movable mover movability');
to_tsvector
-------------------------------------
'movabl':4,6 'move':1,2,3 'mover':5
(1 row)
Typen af værdien returneret af to_tsvector
er tsvector.
Lad os ændre tabellen for at tilføje en genereret kolonne:
ALTER TABLE scenes
ADD tsv tsvector
GENERATED ALWAYS AS (to_tsvector('english', body)) STORED;
Du kan se ændringen med \d
:
shakespeare=# \d scenes
Table "public.scenes"
Column | Type | Collation | Nullable | Default
-------------+----------+-----------+----------+----------------------------------------------------------------------
workid | text | | not null |
act | integer | | not null |
scene | integer | | not null |
description | text | | |
body | text | | |
tsv | tsvector | | | generated always as (to_tsvector('english'::regconfig, body)) stored
Indexes:
"scenes_pkey" PRIMARY KEY, btree (workid, act, scene)
Og bare sådan kan du nu lave fuldtekstsøgninger:
shakespeare=# SELECT
workid, act, scene, ts_headline(body, q)
FROM (
SELECT
workid, act, scene, body, ts_rank(tsv, q) as rank, q
FROM
scenes, plainto_tsquery('uneasy head') q
WHERE
tsv @@ q
ORDER BY
rank DESC
LIMIT
5
) p
ORDER BY
rank DESC;
workid | act | scene | ts_headline
----------+-----+-------+-----------------------------------------------------------
henry4p2 | 3 | 1 | <b>Uneasy</b> lies the <b>head</b> that wears a crown. +
| | | +
| | | Enter WARWICK and Surrey +
| | | +
| | | Earl of Warwick
henry5 | 2 | 2 | <b>head</b> assembled them? +
| | | +
| | | Lord Scroop: No doubt, my liege, if each man do his best.+
| | | +
| | | Henry V: I doubt not that; since we are well persuaded +
| | | We carry not a heart with us from hence
(2 rows)
shakespeare=#
Læs mere
Hvis du har et behov for forudberegnet / "cachelagret" data, især med en arbejdsbyrde på få skrivninger og masser af læsninger, burde genererede kolonner hjælpe med at forenkle din applikation / server-side kode meget.
Du kan læse v12-dokumentationen af CREATE TABLE og ALTER TABLE for at se den opdaterede syntaks.