정렬 알고리즘 (2) [퀵 정렬, 계수 정렬]

728x90
반응형
 

3. 퀵 정렬

· 기준 데이터를 설정하고 그 기준보다 큰 데이터와 작은 데이터의 위치를 바꾸는 방법이다.

· 일반적인 상황에서 가장 많이 사용되는 정렬 알고리즘 중 하나이다.

· 병합 정렬과 더불어 대부분의 프로그래밍 언어의 정렬 라이브러리의 근간이 되는 알고리즘이다.

· 가장 기본적인 퀵 정렬은 첫 번째 데이터를 기준 데이터(Pivot)로 설정한다.

맨 처음 피벗의 값은 '5'다. 왼쪽에서부터 '5'보다 큰 데이터를 선택하므로 '7'이 선택되고, 오른쪽에서부터 '5'보다 작은 데이터를 선택하므로 '4'가 선택된다. 그 뒤, 이 두 데이터의 위치를 서로 변경한다.

현재 피벗의 값은 '5'이다. 왼쪽에서부터 '5'보다 큰 데이터를 선택하므로 '9'가 선택되고, 오른쪽에서부터 '5'보다 작은 데이터를 선택하므로 '2'가 선택된다. 그 뒤, 이 두 데이터의 위치를 서로 변경한다.

현재 피벗의 값은 '5'이다. 왼쪽에서부터 '5'보다 큰 데이터를 선택하므로 '6'이 선택되고, 오른쪽에서부터 '5'보다 작은 데이터를 선택하므로 '1'이 선택된다. 단, 이처럼 위치가 엇갈리는 경우 '피벗'과 '작은 데이터'의 위치를 서로 변경한다.

[분할 완료] 이제 '5'의 왼쪽에 있는 데이터는 모두 5보다 작고, 오른쪽에 있는 데이터는 모두 '5'보다 크다는 특징이 있다. 이렇게 피벗을 기준으로 데이터 묶음을 나누는 작업을 분할(Divide) 혹은 파이션(Partition)이라고 한다. 그 뒤, '5'를 기준으로 왼쪽에 있는 데이터들과 오른쪽에 있는 데이터들을 각각을 하나의 배열로 판단을 해서 정렬을 수행한다.

[왼쪽 데이터 묶음 정렬] 왼쪽에 있는 데이터에 대해서 마찬가지로 정렬을 수행한다. 첫 번째 원소 '1'이 피벗으로 설정이 되고, 왼쪽에서부터 피벗보다 큰 '4'를 선택하고, 오른쪽에서부터 피벗보다 작은 '0'이 선택되어 위치를 서로 변경한다.

[오른쪽 데이터 묶음 정렬] 오른쪽에 있는 데이터에 대해서 마찬가지로 정렬을 수행한다.

이러한 과정을 반복하면 전체 데이터에 대해서 정렬이 수행된다.

이처럼 퀵 정렬이 수행되는 과정은 재귀적으로 수행이 된다. 수행될 때마다 정렬의 범위가 점점 좁아진다.

퀵 정렬이 빠른 이유: 직관적인 이해

· 이상적인 경우 분할이 절반씩 일어난다면 전체 연산 횟수로 O(NlogN)을 기대할 수 있다.

퀵 정렬의 시간 복잡도

· 퀵 정렬은 평균의 경우 O(NlogN) 의 시간 복잡도를 가진다.

· 하지만 최악의 경우 O(N2) 의 시간 복잡도를 가진다.

(첫 번째 피벗값을 어떻게 설정하는가에 따라서 분할이 절반에 가깝게 이루어지지 않고 한 쪽에 편향된 분할이 발생할 수 있다.)

ex) 첫 번째 원소를 피벗으로 삼을 때, 이미 정렬된 배열에 대해서 퀵 정렬을 수행

맨 처음 피벗을 '0'으로 설정하면 1~9까지가 새로운 배열로 분할된다. 다음도 마찬가지로 '1'을 피벗으로 설정하고 2~9까지가 새로운 배열로 분할된다. 이렇게 탐색하는데 N, 분할이 이루어질 때마다 N의 시간 복잡도를 가지게 된다.

퀵 정렬 코드

array = list(map(int, input().split()))

def quick_sort(array, start, end):
    # 원소가 1개인 경우 종료
    if start >= end:
        return
    # 첫 번째 원소가 피벗
    pivot = start
    left = start + 1
    right = end

    while left <= right:
        # 왼쪽에서부터 피벗보다 큰 데이터를 찾을 때까지 오른쪽으로 이동
        while left <= end and array[left] <= array[pivot]:
            left += 1
        # 오른쪽에서부터 피벗보다 작은 값을 찾을 때까지 왼쪽으로 이동
        while right > start and array[right] >= array[pivot]:
            right -= 1
        # 엇갈렸으면 피벗값과 작은 값을 교체
        if left > right:
            array[right], array[pivot] = array[pivot], array[right]
        # 엇갈리지 않았다면 작은 데이터와 큰 데이터의 위치를 교체
        else:
            array[left], array[right] = array[right], array[left]
        print(array)
    # 분할 이후 왼쪽 부분과 오른쪽 부분을 각각 정렬 수행
    quick_sort(array, start, right-1)
    quick_sort(array, right+1, end)

quick_sort(array, 0, len(array)-1)
print("result : ", array)

4. 계수 정렬

· 특정한 조건이 부합할 때만 사용할 수 있지만 매우 빠르게 동작하는 정렬 알고리즘

· 계수 정렬은 데이터의 크기 범위가 제한되어 정수 형태로 표현할 수 있을 때 사용가능

· 데이터의 개수가 N, 데이터(양수) 중 최댓값이 K일 때 최악의 경우에도 수행 시간 O(N + K)를 보장한다.

가장 작은 데이터는 '0' 가장 큰 데이터는 '9'인 것을 확인할 수 있다.

이런 상황에서 가장 작은 데이터부터 가장 큰 데이터까지 모두 담길 수 있는 크기로 리스트를 초기화한다. 여기서 인덱스가 각각의 값에 해당하는 것이다.

그리고 데이터에서 각 인덱스가 몇번이 나왔는지 갯수를 센다.

데이터를 하나씩 확인하며 데이터의 값과 동일한 인덱스의 데이터를 1씩 증가시킨다. 먼저 제일 앞에 있는 데이터 '7'을 확인하면 인덱스 '7'의 개수값을 1 증가시킨다.

마찬가지로 2번째 데이터는 '5'를 확인하여 인덱스 '5'의 개수값을 1 증가시킨다.

모든 데이터에 대해서 위 과정을 반복했을 때 최종적으로 위 사진과 같은 카운트 테이블이 갱신된다.

카운트를 모두 구한 뒤에는 실제로 정렬 수행 결과를 확인할 수 있다.

정렬 수행 결과를 확인할 때는 리스트의 첫 번째 인덱스부터 개수값만큼 반복하여 출력한다.

계수 정렬 코드

# 모든 원소의 값이 0보다 크거나 같다고 가정
array = list(map(int, input().split()))
# 모든 범위를 포함하는 리스트 선언 (모든 값은 0으로 초기화)
count = [0] * (max(array) + 1)

# 각 데이터에 해당하는 인덱스의 값 증가
for i in range(len(array)):
    count[array[i]] += 1
    print("count : ", count)
# 리스트에 기록된 정렬 정보 확인
for i in range(len(count)):
    for j in range(count[i]):
        print(i, end=" ")

첫 번째 반복문의 경우 데이터의 개수만큼 데이터를 확인하면서 카운트 값을 체크한다. 그러므로 O(N) 만큼의 시간 복잡도를 가진다.

그 다음 2번째 반복문의 경우 인덱스의 가장 큰 값을 의미하는 K만큼의 복잡도와 안쪽의 반복문(j)의 경우 전체 수행 횟수 N만큼의 복잡도를 가지므로 O(N+K)의 시간복잡도를 가진다.

계수 정렬의 복잡도 분석

· 계수 정렬의 시간 복잡도와 공간 복잡도는 모두 O(N+K)이다.

· 계수 정렬은 때에 따라서 심각한 비효율성을 초래할 수 있다.

ex) 데이터가 0과 999,999로 단 2개만 존재하는 경우

· 계수 정렬은 동일한 값을 가지는 데이터가 여러 개 등장할 때 효과적으로 동작한다.

ex) 성적의 경우 100점을 맞은 학생이 여러 명일 수 있기 때문에 계수 정렬이 효과적이다.

정렬 알고리즘 비교하기

728x90
반응형