[ 이코테 강의 ] 기타 그래프 이론

🏄‍♀️ 코딩테스트/🐍 Python

[ 이코테 강의 ] 기타 그래프 이론

Po_tta_tt0 2022. 6. 3. 16:08

✍ 서로소 집합

공통 원소가 없는 두 집합
(1,2) (3,4) => 서로소 관계

📌 서로소 집합 자료구조

서로소 부분 집합들로 나누어진 원소들의 데이터를 처리하기 위한 자료구조
두 종류의 연산 지원
- 합집합(Union) : 두 개의 원소가 포함된 집합을 하나로 합치기
- 찾기(Find) : 특정한 원소가 속한 집합이 어떤 집합인지 알려주는 연산
서로소 집합 자료구조 == 합치기 찾기(Union Find) 자료구조라고도 불림

합치기 연산 시 자료구조의 동작 과정

합집합 연산을 확인하여 서로 연결된 두 노드 A,B를 확인
1. A와 B의 루트 노드 a' b'을 각각 찾는다
2. a'를 b'의 부모 노드로 설정
모든 합집합 연산을 처리할 때까지 1번 과정 반복

기본적인 형태의 서로소 집합 자료구조에서는 루트 노드에 즉시 접근할 수 없다
=> 부모 테이블을 계속 확인하며 거슬러 올라가야 한다

# 특정 원소가 속한 집합을 찾기
def find_parent(parent,x):
    #루트 노드를 찾을 때까지 재귀 호출
    if parent[x] !=[x]:
        return find_parent(parent,parent[x])
    return x

# 두 원소가 속한 집합을 합치기
def union_parent(parent,a,b):
    a = find_parent(parent, a)
    b = find_parent(parent, b)
    if a<b:
        parent[b] = a
    else:
        parent[a] = b

📌 기본적인 구현 방법의 문제점

합집합(Union)연산이 편향되게 이루어지는 경우 찾기 함수가 비효율적으로 동작
최악의 경우에는 함수가 모든 노드를 다 확인해야 해서 시간 복잡도가 O(V)

📌 찾기 함수 최적화 : 경로 압축

찾기 합수를 최적화하기 위한 방법으로 경로 압축(Path Copression)을 이용할 수 있다
찾기 함수를 재귀적으로 호출한 뒤에 부모 테이블 값을 바로 갱신한다

# 특정 원소가 속한 집합을 찾기
def find_parent(parent,x):
    # 루트 노드가 아니라면 루트 노드를 찾을 때까지 재귀적으로 호출
    if parent[x] !=[x]:
        parent[x] = find_parent(parent,parent[x])
    return parent[x]

경로 압축 기법을 적용하면 각 노드에 대해 찾기 함수를 호출한 이후에 해당 노드의 루트 노드가 바로 부모 노드가 된다
모든 합집합 함수를 처리한 후 각 원소에 대해서 찾기함수를 수행하면 부모 테이블이 갱신
기본적인 방법에 비해 시간복잡도 개선

📌 서로소 집합을 활용한 사이클 판별

서로소 집합은 무방향 그래프 내에서의 사이클을 판별할 때 사용할 수 있다

방향 그래프에서의 사이클 여부는 DFS를 이용하여 판별할 수 있다

사이클 판별 알고리즘

각 간선을 하나씩 확인하며 두 노드의 루트 노드 확인
1) 루트 노드가 서로 다르다면 두 노드에 대하여 합집합 연산을 수행
2) 루트 노드가 서로 같다면 Cycle이 발생한 것
그래프에 포함되어 있는 모든 간선에 대해 1번 과정 반복

✍ 신장 트리

그래프에서 모든 노드를 포함하면서 사이클이 존재하지 않는 부분 그래프를 의미

모든 노드가 포함되어 서로 연결되면서 사이클이 존재하지 않는다는 조건은 트리의 조건이기도 하다

📌 최소 신장 트리

최소한의 비용으로 구성되는 신장 트리 찾기
문제 예시 : N개의 도시 중 두 도시 사이에 도로를 놓아 전체 도시가 서로 연결될 수 있게 도로를 설치하는 경우
=> 모든 노드가 연결되어 최소한의 비용으로 연결이 가능하게
지금껏 나를 스쳤던 많은 문제들이 떠오르는구만..

📌 크루스칼 알고리즘 | 최소 신장 트리 알고리즘

그리디 알고리즘으로 분류된다

동작 과정

간선 데이터를 비용에 따라 오름차순 정렬
간선을 하나씩 확인, 현재의 간선이 사이클을 발생시키는지 확인
1) 사이클이 없는 경우 : 최소 신장 트리에 포함 ⭕
2) 사이클이 있는 경우 : 최소 신장 트리에 포함 ❌
모든 간선에 대하여 2번 과정 반복

수행 결과
최소 신장 트리에 포함되어 있는 간선의 비용만 모두 더하면 그 값이 최종 비용에 해당됨

📌 성능 분석

간선의 개수가 E개일 때 O(ElogE)
가장 많은 시간을 요구하는 것은 간선 정렬을 수행하는 부분
(표준 라이브러리를 이용해 E개의 데이터를 정렬하기 위한 시간 복잡도는 O(ElogE)

✍ 위상 정렬

사이클이 없는 방향 그래프의 모든 노드를 방향성에 거스르지 않도록 순서대로 나열하는 것

진입차수와 진출차수
진입차수(Indegree) : 특정한 노드로 들어오는 간선의 개수
진출차수(Outdegree) : 특정한 노드에서 나가는 간선의 개수

📌 위상 정렬 알고리즘

사이클이 없는 방향 그래프 일 때 수행 가능

큐를 이용한다.(DFS도 가능)

진입차수가 0인 모든 노드를 큐에 넣는다
큐가 빌 때까지 과정 반복
1) 큐에서 원소를 꺼내 해당 노드에서 나가는 간선을 그래프에서 제거한다
2) 새롭게 진입차수가 0이 된 노드를 큐에 넣는다
=> 결과적으로 각 노드가 큐에 들어온 순서가 위상 정렬을 수행한 결과와 같다

📌 위상 정렬의 특징

DAG에서만 수행 가능 : Direct Acyclic Graph | 순환하지 않는 방향 그래프
위상 정렬에서는 여러 가지 답이 존재할 수 있음

한 단계에서 큐에 새롭게 들어가는 원소가 2개 이상인 경우가 있다면 여러 가지 답이 존재
모든 원소를 방문하기 전에 큐가 빈다면 사이클이 존재한다고 판단할 수 있다
사이클에 포함된 원소 중에서 어떠한 원소도 큐에 들어가지 못한다
스택을 활용한 DFS를 이용해서도 수행 가능

📌 성능 분석

위상 정렬을 위해 차례대로 모든 노드를 확인하여 각 노드에서 나가는 간선을 차례대로 제거해야 한다
시간복잡도는 O(V+E)

👀
(이코테 2021 강의 몰아보기) 8. 기타 그래프 이론