프로그래밍 언어/Database

SQL은 열에 최대 값이있는 행만 선택합니다

Rateye 2021. 6. 28. 10:17
728x90
반응형

 

질문 : SQL은 열에 최대 값이있는 행만 선택합니다 [중복]

문서 용 테이블이 있습니다 (여기에 단순화 된 버전).

+------+-------+--------------------------------------+
| id   | rev   | content                              |
+------+-------+--------------------------------------+
| 1    | 1     | ...                                  |
| 2    | 1     | ...                                  |
| 1    | 2     | ...                                  |
| 1    | 3     | ...                                  |
+------+-------+--------------------------------------+

ID 당 하나의 행과 가장 큰 수익 만 선택하려면 어떻게해야합니까?
위의 데이터를 사용하면 결과에 [1, 3, ...][2, 1, ..] 두 행이 포함되어야합니다. MySQL을 사용하고 있습니다.

while 루프에서 검사를 사용하여 결과 집합에서 이전 rev를 감지하고 덮어 씁니다. 그러나 이것이 결과를 얻는 유일한 방법입니까? SQL 솔루션이 없습니까?

최신 정보
답변을 제안하는 SQL 솔루션, 그리고이 여기에 sqlfiddle 데모 .

업데이트 2
위의 sqlfiddle 을 추가 한 후 질문이 찬성되는 비율이 답변의 찬성 비율을 능가하는 것으로 나타났습니다. 그것은 의도가 아닙니다! 바이올린은 답변, 특히 받아 들여지는 답변을 기반으로합니다.

답변

MAX 집계 함수가있는 GROUP BY 절만 있으면됩니다.

SELECT id, MAX(rev)
FROM YourTable
GROUP BY id

content 열도 필요하다는 것을 방금 깨달았습니다.

이것은 SQL에서 매우 일반적인 질문입니다. 특정 그룹 식별자 당 열에서 최대 값이있는 행의 전체 데이터를 찾습니다. 제 커리어 동안 많이 들었습니다. 사실, 현재 직장의 기술 인터뷰에서 제가 대답 한 질문 중 하나였습니다.

실제로 StackOverflow 커뮤니티가 다음과 같은 질문을 처리하기 위해 하나의 태그를 생성하는 것은 매우 일반적입니다 : .

기본적으로이 문제를 해결하기위한 두 가지 접근 방식이 있습니다.

이 접근 방식에서는 먼저 group-identifier, max-value-in-group (이미 위에서 해결됨)을 찾습니다. group-identifiermax-value-in-group 모두에서 동일하게 하위 쿼리에 테이블을 조인합니다.

SELECT a.id, a.rev, a.contents
FROM YourTable a
INNER JOIN (
    SELECT id, MAX(rev) rev
        FROM YourTable
            GROUP BY id
            ) b ON a.id = b.id AND a.rev = b.rev
            

이 접근 방식에서는 테이블을 자신과 조인했습니다. 동일성은 group-identifier 에서갑니다. 그런 다음 두 가지 스마트 이동 :

따라서 다음과 같이 끝납니다.

SELECT a.*
            FROM YourTable a
            LEFT OUTER JOIN YourTable b
                ON a.id = b.id AND a.rev < b.rev
                WHERE b.id IS NULL;
                

두 방법 모두 똑같은 결과를 가져옵니다.

group-identifier 대해 max-value-in-group 이있는 두 행이있는 경우 두 행 모두 두 접근 방식 모두에서 결과가됩니다.

두 접근 방식 모두 SQL ANSI와 호환되므로 "기종"에 관계없이 좋아하는 RDBMS에서 작동합니다.

두 방법 모두 성능에 친숙하지만 마일리지는 다를 수 있습니다 (RDBMS, DB 구조, 인덱스 등). 따라서 하나의 접근 방식을 다른 것보다 선택하면 벤치 마크 . 그리고 당신에게 가장 의미있는 것을 선택하십시오.

출처 : https://stackoverflow.com/questions/7745609/sql-select-only-rows-with-max-value-on-a-column
728x90
반응형