F.18. hstore — hstore 键/值数据类型#
- F.18.1.
hstore
外部表示 - F.18.2.
hstore
运算符和函数 - F.18.3. 索引
- F.18.4. 示例
- F.18.5. 统计信息
- F.18.6. 兼容性
- F.18.7. 转换
- F.18.8. 作者
此模块为hstore
数据类型实现,用于在单个PostgreSQL值中存储键/值对集。这在各种场景中都很有用,例如很少检查的具有许多属性的行或半结构化数据。键和值只是文本字符串。
此模块被认为是“受信任的”,也就是说,它可以由在当前数据库上具有CREATE
权限的非超级用户安装。
F.18.1.hstore
外部表示#
用于输入和输出的hstore
的文本表示包括零个或多个用逗号分隔的*key
=>
value
*对。一些示例
k => v
foo => bar, baz => whatever
"1-a" => "anything at all"
对的顺序并不重要(并且可能不会在输出中重现)。忽略对之间的空格或=>
符号周围的空格。双引号键和值包括空格、逗号、=
或>
。要将双引号或反斜杠包含在键或值中,请使用反斜杠对其进行转义。
hstore
中的每个键都是唯一的。如果您声明了一个具有重复键的hstore
,则只会在hstore
中存储一个键,并且无法保证会保留哪个键
SELECT 'a=>1,a=>2'::hstore;
hstore
----------
"a"=>"1"
值(但不是键)可以是 SQLNULL
。例如
key => NULL
NULL
关键字不区分大小写。双引号NULL
将其视为普通字符串“NULL”。
注意
请记住,在用于输入时,hstore
文本格式在任何必需的引用或转义之前应用。如果您通过参数传递hstore
文字,则不需要额外的处理。但是,如果您将其作为带引号的文字常量传递,则任何单引号字符和(取决于standard_conforming_strings
配置参数的设置)反斜杠字符都需要正确转义。有关处理字符串常量的更多信息,请参见第 4.1.2.1 节。
在输出时,即使不是严格必需的,双引号始终包围键和值。
F.18.2.hstore
运算符和函数#
由hstore
模块提供的运算符显示在表 F.7中,函数显示在表 F.8中。
表 F.7.hstore
运算符
运算符 说明 示例 |
---|
返回与给定键关联的值,如果不存在,则返回
|
返回与给定键关联的值,如果不存在,则返回
|
连接两个
|
|
|
|
左操作数是否包含右操作数?
|
左操作数是否包含在右操作数中?
|
从左操作数中删除键。
|
从左操作数中删除键。
|
从左操作数中删除与右操作数中对匹配的对。
|
使用
|
将
|
将
|
表 F.8.hstore
函数
除了这些运算符和函数外,hstore
类型的还可以作为下标,允许它们像关联数组一样工作。只能指定一个类型为text
的下标;它被解释为一个键,并且获取或存储相应的值。例如,
CREATE TABLE mytable (h hstore);
INSERT INTO mytable VALUES ('a=>b, c=>d');
SELECT h['a'] FROM mytable;
h
---
b
(1 row)
UPDATE mytable SET h['c'] = 'new';
SELECT h FROM mytable;
h
----------------------
"a"=>"b", "c"=>"new"
(1 row)
如果下标为NULL
或该键在hstore
中不存在,则带下标的提取将返回NULL
。(因此,带下标的提取与->
运算符没有太大区别。)如果下标为NULL
,则带下标的更新将失败;否则,它将替换该键的值,如果该键不存在,则向hstore
中添加一个条目。
F.18.3. 索引#
hstore
具有对@>
、?
、?&
和?|
运算符的 GiST 和 GIN 索引支持。例如
CREATE INDEX hidx ON testhstore USING GIST (h);
CREATE INDEX hidx ON testhstore USING GIN (h);
gist_hstore_ops
GiST opclass 将一组键/值对近似为位图签名。其可选整数参数siglen
确定签名长度(以字节为单位)。默认长度为 16 个字节。签名长度的有效值在 1 到 2024 字节之间。较长的签名会导致更精确的搜索(扫描更少部分的索引和更少的堆页),但代价是索引更大。
创建一个具有 32 字节签名长度的此类索引的示例
CREATE INDEX hidx ON testhstore USING GIST (h gist_hstore_ops(siglen=32));
hstore
还支持对=
运算符的btree
或hash
索引。这允许将hstore
列声明为UNIQUE
,或在GROUP BY
、ORDER BY
或DISTINCT
表达式中使用。对hstore
值进行排序的顺序并不是特别有用,但这些索引可能对等效查找很有用。按如下方式为=
比较创建索引
CREATE INDEX hidx ON testhstore USING BTREE (h);
CREATE INDEX hidx ON testhstore USING HASH (h);
F.18.4. 示例#
添加键或使用新值更新现有键
UPDATE tab SET h['c'] = '3';
执行相同操作的另一种方法是
UPDATE tab SET h = h || hstore('c', '3');
如果要在一次操作中添加或更改多个键,则连接方法比下标更有效
UPDATE tab SET h = h || hstore(array['q', 'w'], array['11', '12']);
删除键
UPDATE tab SET h = delete(h, 'k1');
将record
转换为hstore
CREATE TABLE test (col1 integer, col2 text, col3 text);
INSERT INTO test VALUES (123, 'foo', 'bar');
SELECT hstore(t) FROM test AS t;
hstore
---------------------------------------------
"col1"=>"123", "col2"=>"foo", "col3"=>"bar"
(1 row)
将hstore
转换为预定义的record
类型
CREATE TABLE test (col1 integer, col2 text, col3 text);
SELECT * FROM populate_record(null::test,
'"col1"=>"456", "col2"=>"zzz"');
col1 | col2 | col3
------+------+------
456 | zzz |
(1 row)
使用hstore
中的值修改现有记录
CREATE TABLE test (col1 integer, col2 text, col3 text);
INSERT INTO test VALUES (123, 'foo', 'bar');
SELECT (r).* FROM (SELECT t #= '"col3"=>"baz"' AS r FROM test t) s;
col1 | col2 | col3
------+------+------
123 | foo | baz
(1 row)
F.18.5. 统计信息#
由于其内在的宽容性,hstore
类型可能包含许多不同的键。检查有效键是应用程序的任务。以下示例演示了几种用于检查键和获取统计信息的技巧。
简单示例
SELECT * FROM each('aaa=>bq, b=>NULL, ""=>1');
使用表
CREATE TABLE stat AS SELECT (each(h)).key, (each(h)).value FROM testhstore;
在线统计信息
SELECT key, count(*) FROM
(SELECT (each(h)).key FROM testhstore) AS stat
GROUP BY key
ORDER BY count DESC, key;
key | count
-----------+-------
line | 883
query | 207
pos | 203
node | 202
space | 197
status | 195
public | 194
title | 190
org | 189
...................
F.18.6. 兼容性#
从 PostgreSQL 9.0 开始,hstore
使用与以前版本不同的内部表示形式。这不会对转储/恢复升级构成障碍,因为文本表示形式(在转储中使用)保持不变。
在二进制升级的情况下,通过让新代码识别旧格式数据来保持向上的兼容性。在处理尚未被新代码修改的数据时,这将导致轻微的性能损失。可以通过执行以下UPDATE
语句来强制升级表列中的所有值
UPDATE tablename SET hstorecol = hstorecol || '';
另一种方法是
ALTER TABLE tablename ALTER hstorecol TYPE hstore USING hstorecol || '';
ALTER TABLE
方法需要对表进行ACCESS EXCLUSIVE
锁定,但不会导致表因旧行版本而膨胀。
F.18.7. 转换#
有其他扩展可用于为 PL/Perl 和 PL/Python 语言实现hstore
类型的转换。PL/Perl 的扩展名为hstore_plperl
和hstore_plperlu
,分别用于受信任和不受信任的 PL/Perl。如果您安装这些转换并在创建函数时指定它们,hstore
值将映射到 Perl 哈希。PL/Python 的扩展名为hstore_plpython3u
。如果您使用它,hstore
值将映射到 Python 字典。
注意
强烈建议将转换扩展安装在与hstore
相同的架构中。否则,如果转换扩展的架构包含恶意用户定义的对象,则在安装时存在安全隐患。
F.18.8. 作者#
Oleg Bartunov<[[email protected]](/cdn-cgi/l/email-protection#b7d8dbd2d0f7c4d6de99dac4c299c4c2)>
,莫斯科,莫斯科大学,俄罗斯
Teodor Sigaev<[[email protected]](/cdn-cgi/l/email-protection#ccb8a9a3a8a3be8cbfa5abada9bae2beb9)>
,莫斯科,Delta-Soft Ltd.,俄罗斯
英国安德鲁·吉尔特<[[email protected]](/cdn-cgi/l/email-protection#7b1a151f091e0c3b0f1a144a4a5509121f1f171e085514091c550e10)>
的其他增强