✍ 서로소 집합
공통 원소가 없는 두 집합
(1,2) (3,4) => 서로소 관계
📌 서로소 집합 자료구조
- 서로소 부분 집합들로 나누어진 원소들의 데이터를 처리하기 위한 자료구조
- 두 종류의 연산 지원
- 합집합(Union) : 두 개의 원소가 포함된 집합을 하나로 합치기
- 찾기(Find) : 특정한 원소가 속한 집합이 어떤 집합인지 알려주는 연산
- 서로소 집합 자료구조 == 합치기 찾기(Union Find) 자료구조라고도 불림
합치기 연산 시 자료구조의 동작 과정
- 합집합 연산을 확인하여 서로 연결된 두 노드 A,B를 확인
- A와 B의 루트 노드 a' b'을 각각 찾는다
- a'를 b'의 부모 노드로 설정
- 모든 합집합 연산을 처리할 때까지 1번 과정 반복
기본적인 형태의 서로소 집합 자료구조에서는 루트 노드에 즉시 접근할 수 없다
=> 부모 테이블을 계속 확인하며 거슬러 올라가야 한다
# 특정 원소가 속한 집합을 찾기
def find_parent(parent,x):
#루트 노드를 찾을 때까지 재귀 호출
if parent[x] !=[x]:
return find_parent(parent,parent[x])
return x
# 두 원소가 속한 집합을 합치기
def union_parent(parent,a,b):
a = find_parent(parent, a)
b = find_parent(parent, b)
if a<b:
parent[b] = a
else:
parent[a] = b
📌 기본적인 구현 방법의 문제점
합집합(Union)연산이 편향되게 이루어지는 경우 찾기 함수가 비효율적으로 동작
최악의 경우에는 함수가 모든 노드를 다 확인해야 해서 시간 복잡도가 O(V)
📌 찾기 함수 최적화 : 경로 압축
찾기 합수를 최적화하기 위한 방법으로 경로 압축(Path Copression)을 이용할 수 있다
찾기 함수를 재귀적으로 호출한 뒤에 부모 테이블 값을 바로 갱신한다
# 특정 원소가 속한 집합을 찾기
def find_parent(parent,x):
# 루트 노드가 아니라면 루트 노드를 찾을 때까지 재귀적으로 호출
if parent[x] !=[x]:
parent[x] = find_parent(parent,parent[x])
return parent[x]
- 경로 압축 기법을 적용하면 각 노드에 대해 찾기 함수를 호출한 이후에 해당 노드의 루트 노드가 바로 부모 노드가 된다
- 모든 합집합 함수를 처리한 후 각 원소에 대해서 찾기함수를 수행하면 부모 테이블이 갱신
- 기본적인 방법에 비해 시간복잡도 개선
📌 서로소 집합을 활용한 사이클 판별
서로소 집합은 무방향 그래프 내에서의 사이클을 판별할 때 사용할 수 있다
- 방향 그래프에서의 사이클 여부는 DFS를 이용하여 판별할 수 있다
사이클 판별 알고리즘
- 각 간선을 하나씩 확인하며 두 노드의 루트 노드 확인
1) 루트 노드가 서로 다르다면 두 노드에 대하여 합집합 연산을 수행
2) 루트 노드가 서로 같다면 Cycle이 발생한 것 - 그래프에 포함되어 있는 모든 간선에 대해 1번 과정 반복
✍ 신장 트리
그래프에서 모든 노드를 포함하면서 사이클이 존재하지 않는 부분 그래프를 의미
- 모든 노드가 포함되어 서로 연결되면서 사이클이 존재하지 않는다는 조건은 트리의 조건이기도 하다
📌 최소 신장 트리
최소한의 비용으로 구성되는 신장 트리 찾기
문제 예시 : N개의 도시 중 두 도시 사이에 도로를 놓아 전체 도시가 서로 연결될 수 있게 도로를 설치하는 경우
=> 모든 노드가 연결되어 최소한의 비용으로 연결이 가능하게
지금껏 나를 스쳤던 많은 문제들이 떠오르는구만..
📌 크루스칼 알고리즘 | 최소 신장 트리 알고리즘
그리디 알고리즘으로 분류된다
동작 과정
- 간선 데이터를 비용에 따라 오름차순 정렬
- 간선을 하나씩 확인, 현재의 간선이 사이클을 발생시키는지 확인
1) 사이클이 없는 경우 : 최소 신장 트리에 포함 ⭕
2) 사이클이 있는 경우 : 최소 신장 트리에 포함 ❌ - 모든 간선에 대하여 2번 과정 반복
수행 결과
최소 신장 트리에 포함되어 있는 간선의 비용만 모두 더하면 그 값이 최종 비용에 해당됨
📌 성능 분석
간선의 개수가 E개일 때 O(ElogE)
가장 많은 시간을 요구하는 것은 간선 정렬을 수행하는 부분
(표준 라이브러리를 이용해 E개의 데이터를 정렬하기 위한 시간 복잡도는 O(ElogE)
✍ 위상 정렬
사이클이 없는 방향 그래프의 모든 노드를 방향성에 거스르지 않도록 순서대로 나열하는 것
진입차수와 진출차수
진입차수(Indegree) : 특정한 노드로 들어오는 간선의 개수
진출차수(Outdegree) : 특정한 노드에서 나가는 간선의 개수
📌 위상 정렬 알고리즘
사이클이 없는 방향 그래프 일 때 수행 가능
큐를 이용한다.(DFS도 가능)
- 진입차수가 0인 모든 노드를 큐에 넣는다
- 큐가 빌 때까지 과정 반복
1) 큐에서 원소를 꺼내 해당 노드에서 나가는 간선을 그래프에서 제거한다
2) 새롭게 진입차수가 0이 된 노드를 큐에 넣는다
=> 결과적으로 각 노드가 큐에 들어온 순서가 위상 정렬을 수행한 결과와 같다
📌 위상 정렬의 특징
DAG에서만 수행 가능 : Direct Acyclic Graph | 순환하지 않는 방향 그래프
위상 정렬에서는 여러 가지 답이 존재할 수 있음
- 한 단계에서 큐에 새롭게 들어가는 원소가 2개 이상인 경우가 있다면 여러 가지 답이 존재
모든 원소를 방문하기 전에 큐가 빈다면 사이클이 존재한다고 판단할 수 있다 - 사이클에 포함된 원소 중에서 어떠한 원소도 큐에 들어가지 못한다
스택을 활용한 DFS를 이용해서도 수행 가능
📌 성능 분석
위상 정렬을 위해 차례대로 모든 노드를 확인하여 각 노드에서 나가는 간선을 차례대로 제거해야 한다
시간복잡도는 O(V+E)
👀
(이코테 2021 강의 몰아보기) 8. 기타 그래프 이론
'🏄♀️ 코딩테스트 > 🐍 Python' 카테고리의 다른 글
[ 백준 1912 ] ( python ) 연속합 (0) | 2022.06.10 |
---|---|
[ 백준 1932 ] ( python ) 정수 삼각형 (0) | 2022.06.09 |
[ 백준 9095 ] ( python ) 1, 2, 3 더하기 (0) | 2022.06.03 |
[ 백준 1003 ] ( python ) 피보나치 함수 (0) | 2022.06.02 |
[ 백준 1463] ( python ) 1로 만들기 (0) | 2022.06.01 |