题目描述

(通过次数9,238 | 提交次数20,838,通过率44.33%)

表: Views
+---------------+---------+
| Column Name   | Type    |
+---------------+---------+
| article_id    | int     |
| author_id     | int     |
| viewer_id     | int     |
| view_date     | date    |
+---------------+---------+
此表无主键,因此可能会存在重复行。
此表的每一行都表示某人在某天浏览了某位作者的某篇文章。
请注意,同一人的 author_id 和 viewer_id 是相同的。

编写一条 SQL 查询来找出在同一天阅读至少两篇文章的人。
结果按照 id 升序排序。
查询结果的格式如下。

示例 1:
输入:
Views 表:
+------------+-----------+-----------+------------+
| article_id | author_id | viewer_id | view_date  |
+------------+-----------+-----------+------------+
| 1          | 3         | 5         | 2019-08-01 |
| 3          | 4         | 5         | 2019-08-01 |
| 1          | 3         | 6         | 2019-08-02 |
| 2          | 7         | 7         | 2019-08-01 |
| 2          | 7         | 6         | 2019-08-02 |
| 4          | 7         | 1         | 2019-07-22 |
| 3          | 4         | 4         | 2019-07-21 |
| 3          | 4         | 4         | 2019-07-21 |
+------------+-----------+-----------+------------+
输出:
+------+
| id   |
+------+
| 5    |
| 6    |
+------+

来源:力扣(LeetCode)
链接:https://leetcode.cn/problems/article-views-ii
//测试数据
Create table If Not Exists Views (article_id int, author_id int, viewer_id int, view_date date);

insert into Views (article_id, author_id, viewer_id, view_date) values ('1', '3', '5', '2019-08-01');
insert into Views (article_id, author_id, viewer_id, view_date) values ('3', '4', '5', '2019-08-01');
insert into Views (article_id, author_id, viewer_id, view_date) values ('1', '3', '6', '2019-08-02');
insert into Views (article_id, author_id, viewer_id, view_date) values ('2', '7', '7', '2019-08-01');
insert into Views (article_id, author_id, viewer_id, view_date) values ('2', '7', '6', '2019-08-02');
insert into Views (article_id, author_id, viewer_id, view_date) values ('4', '7', '1', '2019-07-22');
insert into Views (article_id, author_id, viewer_id, view_date) values ('3', '4', '4', '2019-07-21');
insert into Views (article_id, author_id, viewer_id, view_date) values ('3', '4', '4', '2019-07-21');

解题思路

源表Views中保存了某天某个人访问了某个作者的某篇文章,并且可以重复访问。也就是说,表本身没有主键。
题目要求:查询在任意一天访问超过2篇文章的访问者ID。
那么,我们首先可以计算出,每天每个访问者访问的文章数量。可以使用GROUP BY+COUNT(DISTINCT)实现;
然后,过滤出文章数量>=2的记录。可以使用HAVING条件实现;
最后,对访问者ID进行去重和排序即可。可以使用DISTINCT+ORDER BY或GROUP BY+ORDER BY实现。

参考SQL

未特别说明的情况下,参考SQL为基于MySQL8.0实现。
select
    distinct viewer_id id
from (
    select
        view_date,
        viewer_id
    from Views
    group by view_date,viewer_id
    having count(distinct article_id) >= 2
)a
order by viewer_id;

picture loss