Postgresql去重函数distinct的用法说明

 更新时间:2021年01月16日 09:18:30   作者:Tastill  
这篇文章主要介绍了Postgresql去重函数distinct的用法说明,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

在项目中我们常会对数据进行去重处理,有时候会用in或者EXISTS函数。或者通过group by也是可以实现查重

不过Postgresql还有自带去重函数:distinct

下面是distinct 的实例:

1、创建表:user

CREATE TABLE `user` (
 `name` varchar(30) DEFAULT NULL,
 `age` int(11) DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8;
INSERT INTO `user` VALUES ('张三', 20);
INSERT INTO `user` VALUES ('李四', 22);
INSERT INTO `user` VALUES ('李四', 20);
INSERT INTO `user` VALUES ('张三', 22);
INSERT INTO `user` VALUES ('张三', 20);

查询结果:

SELECT * FROM user
张三 20
李四 22
李四 20
张三 22
张三 20

2、根据 name 查询去重后的数据:

SELECT distinct name FROM user
张三
李四

3、根据name 和 age 查询去重后的数据:

SELECT distinct name,age FROM user
张三 20
李四 22
李四 20
张三 22

4、根据name,age查询重复数据数:

SELECT distinct name,age,count(*) 数据条数 FROM user GROUP BY name,age
张三 20 2
张三 22 1
李四 20 1
李四 22 1

二、查出重复数据后,我们需要删除重复数据

删除重复数据一般几种方式,一般采用 临时表 或者根据 某个字段,例如id等,通过max或者min函数去重。

补充:基于postgresql ctid实现数据的差异同步

项目背景:

最近在做异构数据同步方面(非实时)的工作,从oracle,gbase,postgresql向mysql数据库中同步,对于没有自增字段(自增ID或时间字段)的业务表,做差异同步是一件非常麻烦的事情,主要体现在记录的新增、更新与删除上

备注:源库只提供一个只读权限的用户

ctid在pg中的作用

ctid是用来指向自身或新元组的元组标识符,怎么理解呢?下面能过几个实验来测试一下

satdb=# create table test_ctid(id int,name varchar(100));
satdb=# insert into test_ctid values(1,‘a'),(1,‘a');
satdb=# insert into test_ctid values(2,‘a'),(3,‘a');

查看记录的ctid值

satdb=# select id,name,ctid from test_ctid;
id | name | ctid
----±-----±------
1 | a | (0,1)
1 | a | (0,2)
2 | a | (0,3)
3 | a | (0,4)
(4 rows)

对id为2的记录进行更新

satdb=# update test_ctid set name=‘b' where id=2;
UPDATE 1

这里可以看到id=2的记录指向了新的元组标识符 (0,5)

satdb=# select id,name,ctid from test_ctid;
id | name | ctid
----±-----±------
1 | a | (0,1)
1 | a | (0,2)
3 | a | (0,4)
2 | b | (0,5)
(4 rows)
satdb=# select * from test_ctid where ctid='(0,1)';
id | name
----±-----
1 | a
(1 row)

删除 id=3的记录后,对应的ctid(0,4)不存在了

satdb=# delete from test_ctid where id=3;
DELETE 1
satdb=# select *,ctid from test_ctid;
id | name | ctid
----±-----±------
1 | a | (0,1)
1 | a | (0,2)
2 | b | (0,5)
(3 rows)

再插入一条记录时,看看会不会使用(0,4)这个标识符

satdb=# insert into test_ctid values(3,‘d');
INSERT 0 1
satdb=# select *,ctid from test_ctid;
id | name | ctid
----±-----±------
1 | a | (0,1)
1 | a | (0,2)
2 | b | (0,5)
3 | d | (0,6)

这里新插入的记录不会使用(0,4),而是直接分配新的标识符(0,6)

总结:

1、ctid的作用与oracle rowid类似,可以唯一标识一条记录

2、记录的更新后,后生产新的ctid

3、记录删除后,新插入的记录不会使用已经删除记录的ctid

4、基于ctid可以实现记录的去重操作

5、基于ctid可以实现差异增量同步(新增、删除、更新)

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。如有错误或未考虑完全的地方,望不吝赐教。

相关文章

  • PostgreSQL使用SQL实现俄罗斯方块的示例

    PostgreSQL使用SQL实现俄罗斯方块的示例

    基于PostgreSQL实现的俄罗斯方块游戏项目Tetris-SQL,通过纯SQL代码和数据库操作重构了经典游戏逻辑,展现了SQL语言的图灵完备性和技术潜力,本文介绍PostgreSQL使用SQL实现俄罗斯方块的示例,感兴趣的朋友一起看看吧
    2022-04-04
  • PostgreSQL怎么创建分区表详解

    PostgreSQL怎么创建分区表详解

    数据库表分区把一个大的物理表分成若干个小的物理表,并使得这些小物理表在逻辑上可以被当成一张表来使用,下面这篇文章主要给大家介绍了关于PostgreSQL怎么创建分区表的相关资料,需要的朋友可以参考下
    2022-06-06
  • 解决postgresql无法远程访问的情况

    解决postgresql无法远程访问的情况

    这篇文章主要介绍了解决postgresql无法远程访问的情况,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-01-01
  • 详解PostgreSQL 实现定时任务的 4 种方法

    详解PostgreSQL 实现定时任务的 4 种方法

    这篇文章主要介绍了PostgreSQL 实现定时任务的 4 种方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-02-02
  • PostgreSQL 添加各种约束语法的操作

    PostgreSQL 添加各种约束语法的操作

    这篇文章主要介绍了PostgreSQL 添加各种约束语法的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-02-02
  • 如何将excel表格数据导入postgresql数据库

    如何将excel表格数据导入postgresql数据库

    这篇文章主要介绍了如何将excel表格数据导入postgresql数据库,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-03-03
  • PostgreSQL设置主键自增的方法详解

    PostgreSQL设置主键自增的方法详解

    在使用Mysql时,创建表结构时可以通过关键字auto_increment来指定主键是否自增,但在Postgresql数据库中,虽然可以实现字段的自增,但从本质上来说却并不支持Mysql那样的自增,所以本文给大家介绍了PostgreSQL如何设置主键自增,需要的朋友可以参考下
    2024-08-08
  • PostgreSql JDBC事务操作方法详解

    PostgreSql JDBC事务操作方法详解

    这篇文章主要为大家介绍了PostgreSql JDBC事务操作方法详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-11-11
  • PostgreSQL实时查看数据库实例正在执行的SQL语句实例详解

    PostgreSQL实时查看数据库实例正在执行的SQL语句实例详解

    在任何数据库中,分析和优化SQL的执行,最重要的工作就是执行计划的解读,而说到执行计划得先了解postgresql的查询执行过程,下面这篇文章主要给大家介绍了关于PostgreSQL实时查看数据库实例正在执行的SQL语句的相关资料,需要的朋友可以参考下
    2023-01-01
  • PostgreSQL解析URL的方法

    PostgreSQL解析URL的方法

    尽管PostgreSQL中支持大量的数据类型,但是对于URL似乎并没有一个相应的类型能够去存储。那么对于URL的数据我们在数据库中要怎么去处理呢?今天通过本文给大家介绍下,需要的朋友参考下吧
    2021-07-07

最新评论