题目描述

(通过次数10,764 | 提交次数18,062,通过率59.59%)

表 Submissions 结构如下:
+---------------+----------+
| 列名           | 类型     |
+---------------+----------+
| sub_id        | int      |
| parent_id     | int      |
+---------------+----------+
上表没有主键, 所以可能会出现重复的行。
每行可以是一个帖子或对该帖子的评论。
如果是帖子的话,parent_id 就是 null。
对于评论来说,parent_id 就是表中对应帖子的 sub_id。

编写 SQL 语句以查找每个帖子的评论数。
结果表应包含帖子的 post_id 和对应的评论数 number_of_comments 并且按 post_id 升序排列。
Submissions 可能包含重复的评论。您应该计算每个帖子的唯一评论数。
Submissions 可能包含重复的帖子。您应该将它们视为一个帖子。
结果表应该按 post_id 升序排序。

查询结果格式如下例所示。
示例 1:
输入:
Submissions table:
+---------+------------+
| sub_id  | parent_id  |
+---------+------------+
| 1       | Null       |
| 2       | Null       |
| 1       | Null       |
| 12      | Null       |
| 3       | 1          |
| 5       | 2          |
| 3       | 1          |
| 4       | 1          |
| 9       | 1          |
| 10      | 2          |
| 6       | 7          |
+---------+------------+
输出:
+---------+--------------------+
| post_id | number_of_comments |
+---------+--------------------+
| 1       | 3                  |
| 2       | 2                  |
| 12      | 0                  |
+---------+--------------------+
解释:
表中 ID 为 1 的帖子有 ID 为 3、4 和 9 的三个评论。表中 ID 为 3 的评论重复出现了,所以我们只对它进行了一次计数。
表中 ID 为 2 的帖子有 ID 为 5 和 10 的两个评论。
ID 为 12 的帖子在表中没有评论。
表中 ID 为 6 的评论是对 ID 为 7 的已删除帖子的评论,因此我们将其忽略。

来源:力扣(LeetCode)
链接:https://leetcode.cn/problems/number-of-comments-per-post
//测试数据
Create table If Not Exists Submissions (sub_id int, parent_id int);

insert into Submissions (sub_id, parent_id) values ('1', 'None');
insert into Submissions (sub_id, parent_id) values ('2', 'None');
insert into Submissions (sub_id, parent_id) values ('1', 'None');
insert into Submissions (sub_id, parent_id) values ('12', 'None');
insert into Submissions (sub_id, parent_id) values ('3', '1');
insert into Submissions (sub_id, parent_id) values ('5', '2');
insert into Submissions (sub_id, parent_id) values ('3', '1');
insert into Submissions (sub_id, parent_id) values ('4', '1');
insert into Submissions (sub_id, parent_id) values ('9', '1');
insert into Submissions (sub_id, parent_id) values ('10', '2');
insert into Submissions (sub_id, parent_id) values ('6', '7');

解题思路

Submissions表保存了所有的帖子,以及帖子下的评论。

题目要求:计算每个帖子的评论数。如果某个帖子没有评论,则评论数为0。

根据题目描述,parent_id为NULL时,该行记录为贴子。

所以,可以先使用parent_id is null为条件,筛选出所有的帖子。

然后再跟Submissions表进行关联,获取帖子下的所有评论。

最后,因为帖子和评论都有可能会重复,所以,使用GROUP BY分组并使用DISTINCT关键字进行去重,从而统计出每个帖子下的评论数。

参考SQL

未特别说明的情况下,参考SQL为基于MySQL8.0实现。
select
    a.sub_id post_id,
    coalesce(count(distinct b.sub_id),0) number_of_comments
from Submissions a
left join Submissions b
on a.sub_id = b.parent_id
where a.parent_id is null
group by a.sub_id
order by a.sub_id;
picture loss