Show values of SET statements as constants in pg_stat_statements
authorMichael Paquier <michael@paquier.xyz>
Mon, 30 Sep 2024 05:02:00 +0000 (14:02 +0900)
committerMichael Paquier <michael@paquier.xyz>
Mon, 30 Sep 2024 05:02:00 +0000 (14:02 +0900)
This is a continuation of work like 11c34b342bd7, done to reduce the
bloat of pg_stat_statements by applying more normalization to query
entries.  This commit is able to detect and normalize values in
VariableSetStmt, resulting in:
SET conf_param = $1

Compared to other parse nodes, VariableSetStmt is embedded in much more
places in the parser, impacting many query patterns in
pg_stat_statements.  A custom jumble function is used, with an extra
field in the node to decide if arguments should be included in the
jumbling or not, a location field being not enough for this purpose.
This approach allows for a finer tuning.

Clauses relying on one or more keywords are not normalized, for example:
* DEFAULT
* FROM CURRENT
* List of keywords.  SET SESSION CHARACTERISTICS AS TRANSACTION,
where it is critical to differentiate different sets of options, is a
good example of why normalization should not happen.

Some queries use VariableSetStmt for some subclauses with SET, that also
have their values normalized:
- ALTER DATABASE
- ALTER ROLE
- ALTER SYSTEM
- CREATE/ALTER FUNCTION

ba90eac7a995 has added test coverage for most of the existing SET
patterns.  The expected output of these tests shows the difference this
commit creates.  Normalization could be perhaps applied to more portions
of the grammar but what is done here is conservative, and good enough as
a starting point.

Author: Greg Sabino Mullane, Michael Paquier
Discussion: https://postgr.es/m/36e5bffe-e989-194f-85c8-06e7bc88e6f7@amazon.com
Discussion: https://postgr.es/m/B44FA29D-EBD0-4DD9-ABC2-16F1CB087074@amazon.com
Discussion: https://postgr.es/m/CAKAnmmJtJY2jzQN91=2QAD2eAJAA-Per61eyO48-TyxEg-q0Rg@mail.gmail.com

contrib/pg_stat_statements/expected/dml.out
contrib/pg_stat_statements/expected/level_tracking.out
contrib/pg_stat_statements/expected/utility.out
contrib/pg_stat_statements/expected/wal.out
src/backend/nodes/queryjumblefuncs.c
src/backend/parser/gram.y
src/include/nodes/parsenodes.h

index f6ac8da5ca2214404281ca91af4f04f229896be5..acc2c5e5241c8704d665c955b08baaf72aca1dbb 100644 (file)
@@ -82,7 +82,7 @@ SELECT calls, rows, query FROM pg_stat_statements ORDER BY query COLLATE "C";
      2 |    4 | SELECT * FROM pgss_dml_tab WHERE a > $1 ORDER BY a
      1 |    8 | SELECT * FROM pgss_dml_tab WHERE a IN ($1, $2, $3, $4, $5)
      1 |    1 | SELECT pg_stat_statements_reset() IS NOT NULL AS t
-     1 |    0 | SET pg_stat_statements.track_utility = FALSE
+     1 |    0 | SET pg_stat_statements.track_utility = $1
      6 |    6 | UPDATE pgss_dml_tab SET b = $1 WHERE a = $2
      1 |    3 | UPDATE pgss_dml_tab SET b = $1 WHERE a > $2
 (10 rows)
index d8dd8a2deea0829e07d41b5d2ac3e204750b6bcd..bb65e98ce094cad0181332fdaa4028ddfddcda75 100644 (file)
@@ -64,7 +64,7 @@ SELECT toplevel, calls, query FROM pg_stat_statements
           |       | END; $$
  f        |     1 | SELECT $1::TEXT
  t        |     1 | SELECT pg_stat_statements_reset() IS NOT NULL AS t
- t        |     1 | SET pg_stat_statements.track = 'all'
+ t        |     1 | SET pg_stat_statements.track = $1
 (7 rows)
 
 -- Procedure with multiple utility statements.
index 8d3fd77201f83bfdb47dab9597eaeea88e55eb0c..060d4416dd749a8c6c4dda77de52d5e6c6c779df 100644 (file)
@@ -108,7 +108,7 @@ SELECT calls, rows, query FROM pg_stat_statements ORDER BY query COLLATE "C";
      1 |    0 | CREATE FOREIGN TABLE foreign_stats (a int) SERVER server_stats
      1 |    0 | CREATE FUNCTION func_stats(a text DEFAULT 'a_data', b text DEFAULT lower('b_data'))+
        |      |   RETURNS text AS $$ SELECT $1::text || '_' || $2::text; $$ LANGUAGE SQL           +
-       |      |   SET work_mem = '256kB'
+       |      |   SET work_mem = $1
      1 |    0 | CREATE FUNCTION trigger_func_stats () RETURNS trigger LANGUAGE plpgsql             +
        |      |   AS $$ BEGIN return OLD; end; $$
      1 |    0 | CREATE INDEX pt_stats2_index ON ONLY pt_stats2 (a)
@@ -620,8 +620,7 @@ SELECT calls, rows, query FROM pg_stat_statements ORDER BY query COLLATE "C";
      1 |    0 | SET LOCAL SESSION AUTHORIZATION 'regress_stat_set_1'
      1 |    0 | SET LOCAL SESSION AUTHORIZATION 'regress_stat_set_2'
      1 |    0 | SET LOCAL SESSION AUTHORIZATION DEFAULT
-     1 |    0 | SET LOCAL work_mem = '128kB'
-     1 |    0 | SET LOCAL work_mem = '256kB'
+     2 |    0 | SET LOCAL work_mem = $1
      2 |    0 | SET LOCAL work_mem = DEFAULT
      1 |    0 | SET LOCAL work_mem FROM CURRENT
      1 |    0 | SET SESSION AUTHORIZATION 'regress_stat_set_1'
@@ -630,8 +629,6 @@ SELECT calls, rows, query FROM pg_stat_statements ORDER BY query COLLATE "C";
      1 |    0 | SET SESSION CHARACTERISTICS AS TRANSACTION READ ONLY, READ ONLY
      1 |    0 | SET SESSION CHARACTERISTICS AS TRANSACTION READ ONLY, READ WRITE
      1 |    0 | SET SESSION SESSION AUTHORIZATION DEFAULT
-     1 |    0 | SET SESSION work_mem = '300kB'
-     1 |    0 | SET SESSION work_mem = '400kB'
      1 |    0 | SET TIME ZONE 'America/New_York'
      1 |    0 | SET TIME ZONE 'Asia/Tokyo'
      1 |    0 | SET TIME ZONE 'CST7CDT,M4.1.0,M10.5.0'
@@ -641,13 +638,11 @@ SELECT calls, rows, query FROM pg_stat_statements ORDER BY query COLLATE "C";
      1 |    0 | SET TRANSACTION ISOLATION LEVEL SERIALIZABLE
      1 |    0 | SET XML OPTION CONTENT
      1 |    0 | SET XML OPTION DOCUMENT
-     1 |    0 | SET enable_seqscan = off
-     1 |    0 | SET enable_seqscan = on
-     2 |    0 | SET work_mem = '1MB'
-     1 |    0 | SET work_mem = '2MB'
+     2 |    0 | SET enable_seqscan = $1
+     5 |    0 | SET work_mem = $1
      2 |    0 | SET work_mem = DEFAULT
      1 |    0 | SET work_mem FROM CURRENT
-(39 rows)
+(34 rows)
 
 DROP ROLE regress_stat_set_1;
 DROP ROLE regress_stat_set_2;
@@ -733,9 +728,8 @@ SELECT calls, rows, query FROM pg_stat_statements ORDER BY query COLLATE "C";
 -------+------+----------------------------------------------------
      1 |    0 | RESET ALL
      1 |    1 | SELECT pg_stat_statements_reset() IS NOT NULL AS t
-     1 |    0 | SET SCHEMA 'foo'
-     1 |    0 | SET SCHEMA 'public'
-(4 rows)
+     2 |    0 | SET SCHEMA $1
+(3 rows)
 
 SELECT pg_stat_statements_reset() IS NOT NULL AS t;
  t 
index 34a2bf5b033c17f938b605387a1a750a256f77f1..977e382d84894ee5cde1744e2c43bf3e9d327e4a 100644 (file)
@@ -18,7 +18,7 @@ FROM pg_stat_statements ORDER BY query COLLATE "C";
  DELETE FROM pgss_wal_tab WHERE a > $1                        |     1 |    1 | t                   | t                     | t
  INSERT INTO pgss_wal_tab VALUES(generate_series($1, $2), $3) |     1 |   10 | t                   | t                     | t
  SELECT pg_stat_statements_reset() IS NOT NULL AS t           |     1 |    1 | f                   | f                     | f
- SET pg_stat_statements.track_utility = FALSE                 |     1 |    0 | f                   | f                     | t
+ SET pg_stat_statements.track_utility = $1                    |     1 |    0 | f                   | f                     | t
  UPDATE pgss_wal_tab SET b = $1 WHERE a > $2                  |     1 |    3 | t                   | t                     | t
 (5 rows)
 
index 129fb447099fef13a5a5224be14e78968607c161..5e43fd922948ba6f27821190418fccf287e41f8a 100644 (file)
@@ -57,6 +57,7 @@ static void RecordConstLocation(JumbleState *jstate, int location);
 static void _jumbleNode(JumbleState *jstate, Node *node);
 static void _jumbleA_Const(JumbleState *jstate, Node *node);
 static void _jumbleList(JumbleState *jstate, Node *node);
+static void _jumbleVariableSetStmt(JumbleState *jstate, Node *node);
 
 /*
  * Given a possibly multi-statement source string, confine our attention to the
@@ -352,3 +353,21 @@ _jumbleA_Const(JumbleState *jstate, Node *node)
        }
    }
 }
+
+static void
+_jumbleVariableSetStmt(JumbleState *jstate, Node *node)
+{
+   VariableSetStmt *expr = (VariableSetStmt *) node;
+
+   JUMBLE_FIELD(kind);
+   JUMBLE_STRING(name);
+
+   /*
+    * Account for the list of arguments in query jumbling only if told by the
+    * parser.
+    */
+   if (expr->jumble_args)
+       JUMBLE_NODE(args);
+   JUMBLE_FIELD(is_local);
+   JUMBLE_LOCATION(location);
+}
index b1d4642c59b21af9856ae5551c69a93f836a27f7..4aa8646af7bbbec2c902f070b19069b44c52d109 100644 (file)
@@ -1647,6 +1647,8 @@ set_rest:
                    n->kind = VAR_SET_MULTI;
                    n->name = "TRANSACTION";
                    n->args = $2;
+                   n->jumble_args = true;
+                   n->location = -1;
                    $$ = n;
                }
            | SESSION CHARACTERISTICS AS TRANSACTION transaction_mode_list
@@ -1656,6 +1658,8 @@ set_rest:
                    n->kind = VAR_SET_MULTI;
                    n->name = "SESSION CHARACTERISTICS";
                    n->args = $5;
+                   n->jumble_args = true;
+                   n->location = -1;
                    $$ = n;
                }
            | set_rest_more
@@ -1669,6 +1673,7 @@ generic_set:
                    n->kind = VAR_SET_VALUE;
                    n->name = $1;
                    n->args = $3;
+                   n->location = @3;
                    $$ = n;
                }
            | var_name '=' var_list
@@ -1678,6 +1683,7 @@ generic_set:
                    n->kind = VAR_SET_VALUE;
                    n->name = $1;
                    n->args = $3;
+                   n->location = @3;
                    $$ = n;
                }
            | var_name TO DEFAULT
@@ -1686,6 +1692,7 @@ generic_set:
 
                    n->kind = VAR_SET_DEFAULT;
                    n->name = $1;
+                   n->location = -1;
                    $$ = n;
                }
            | var_name '=' DEFAULT
@@ -1694,6 +1701,7 @@ generic_set:
 
                    n->kind = VAR_SET_DEFAULT;
                    n->name = $1;
+                   n->location = -1;
                    $$ = n;
                }
        ;
@@ -1706,6 +1714,7 @@ set_rest_more:    /* Generic SET syntaxes: */
 
                    n->kind = VAR_SET_CURRENT;
                    n->name = $1;
+                   n->location = -1;
                    $$ = n;
                }
            /* Special syntaxes mandated by SQL standard: */
@@ -1715,6 +1724,8 @@ set_rest_more:    /* Generic SET syntaxes: */
 
                    n->kind = VAR_SET_VALUE;
                    n->name = "timezone";
+                   n->location = -1;
+                   n->jumble_args = true;
                    if ($3 != NULL)
                        n->args = list_make1($3);
                    else
@@ -1736,6 +1747,7 @@ set_rest_more:    /* Generic SET syntaxes: */
                    n->kind = VAR_SET_VALUE;
                    n->name = "search_path";
                    n->args = list_make1(makeStringConst($2, @2));
+                   n->location = @2;
                    $$ = n;
                }
            | NAMES opt_encoding
@@ -1744,6 +1756,7 @@ set_rest_more:    /* Generic SET syntaxes: */
 
                    n->kind = VAR_SET_VALUE;
                    n->name = "client_encoding";
+                   n->location = @2;
                    if ($2 != NULL)
                        n->args = list_make1(makeStringConst($2, @2));
                    else
@@ -1757,6 +1770,7 @@ set_rest_more:    /* Generic SET syntaxes: */
                    n->kind = VAR_SET_VALUE;
                    n->name = "role";
                    n->args = list_make1(makeStringConst($2, @2));
+                   n->location = @2;
                    $$ = n;
                }
            | SESSION AUTHORIZATION NonReservedWord_or_Sconst
@@ -1766,6 +1780,7 @@ set_rest_more:    /* Generic SET syntaxes: */
                    n->kind = VAR_SET_VALUE;
                    n->name = "session_authorization";
                    n->args = list_make1(makeStringConst($3, @3));
+                   n->location = @3;
                    $$ = n;
                }
            | SESSION AUTHORIZATION DEFAULT
@@ -1774,6 +1789,7 @@ set_rest_more:    /* Generic SET syntaxes: */
 
                    n->kind = VAR_SET_DEFAULT;
                    n->name = "session_authorization";
+                   n->location = -1;
                    $$ = n;
                }
            | XML_P OPTION document_or_content
@@ -1783,6 +1799,8 @@ set_rest_more:    /* Generic SET syntaxes: */
                    n->kind = VAR_SET_VALUE;
                    n->name = "xmloption";
                    n->args = list_make1(makeStringConst($3 == XMLOPTION_DOCUMENT ? "DOCUMENT" : "CONTENT", @3));
+                   n->jumble_args = true;
+                   n->location = -1;
                    $$ = n;
                }
            /* Special syntaxes invented by PostgreSQL: */
@@ -1793,6 +1811,7 @@ set_rest_more:    /* Generic SET syntaxes: */
                    n->kind = VAR_SET_MULTI;
                    n->name = "TRANSACTION SNAPSHOT";
                    n->args = list_make1(makeStringConst($3, @3));
+                   n->location = @3;
                    $$ = n;
                }
        ;
@@ -1900,6 +1919,7 @@ reset_rest:
 
                    n->kind = VAR_RESET;
                    n->name = "timezone";
+                   n->location = -1;
                    $$ = n;
                }
            | TRANSACTION ISOLATION LEVEL
@@ -1908,6 +1928,7 @@ reset_rest:
 
                    n->kind = VAR_RESET;
                    n->name = "transaction_isolation";
+                   n->location = -1;
                    $$ = n;
                }
            | SESSION AUTHORIZATION
@@ -1916,6 +1937,7 @@ reset_rest:
 
                    n->kind = VAR_RESET;
                    n->name = "session_authorization";
+                   n->location = -1;
                    $$ = n;
                }
        ;
@@ -1927,6 +1949,7 @@ generic_reset:
 
                    n->kind = VAR_RESET;
                    n->name = $1;
+                   n->location = -1;
                    $$ = n;
                }
            | ALL
@@ -1934,6 +1957,7 @@ generic_reset:
                    VariableSetStmt *n = makeNode(VariableSetStmt);
 
                    n->kind = VAR_RESET_ALL;
+                   n->location = -1;
                    $$ = n;
                }
        ;
index e62ce1b7536e48f7ecf0ea053b6d63fedf80d26a..1c314cd9074d0e4dfcd4ba5305f1fd1582e48737 100644 (file)
@@ -2616,11 +2616,26 @@ typedef enum VariableSetKind
 
 typedef struct VariableSetStmt
 {
+   pg_node_attr(custom_query_jumble)
+
    NodeTag     type;
    VariableSetKind kind;
-   char       *name;           /* variable to be set */
-   List       *args;           /* List of A_Const nodes */
-   bool        is_local;       /* SET LOCAL? */
+   /* variable to be set */
+   char       *name;
+   /* List of A_Const nodes */
+   List       *args;
+
+   /*
+    * True if arguments should be accounted for in query jumbling.  We use a
+    * separate flag rather than query_jumble_ignore on "args" as several
+    * grammar flavors of SET rely on a list of values that are parsed
+    * directly from the grammar's keywords.
+    */
+   bool        jumble_args;
+   /* SET LOCAL? */
+   bool        is_local;
+   /* token location, or -1 if unknown */
+   ParseLoc    location pg_node_attr(query_jumble_location);
 } VariableSetStmt;
 
 /* ----------------------