Coding Test/Python

[알고리즘] 다이나믹 프로그래밍 (Dynamic Programming)

수수킴 2021. 8. 22.

본 정리내용은 '이것이 취업을 위한 코딩 테스트다 with 파이썬' 교재를 참고 했습니다.

독학하는 용도로 글을 작성하는 것이고, 혹여나 잘못된 부분이 있다면 댓글 써주시면 감사하겠습니다.

다이나믹 프로그래밍

다이나믹 프로그래밍은 메모리를 적절히 사용하여 수행 시간 효율성을 비약적으로 향상시키는 방법이다.
이미 계산된 결과(작은 문제)는 별도의 메모리 영역에 저장하여 다시 계산하지 않도록 한다.
다이나믹 프로그래밍의 구현은 일반적으로 두 가지 방식(탐다운과 보텀업)으로 구성된다.
다이나믹 프로그래밍은 동적 계획법이라고도 부른다.
일반적인 프로그래밍 분야에서의 동적(Dynamic)이란?
- 자료구조에서 동적 할당 (Dynamic Allocation)은 '프로그램이 실행되는 도중에 실행에 필요한 메모리를 할당하는 기법'을 의미한다.
- 반면에 다이나믹 프로그래밍에서 '다이나믹'은 별다른 의미 없이 사용된 단어이다.
다이나믹 프로그래밍은 문제가 다음의 조건을 만족할 때 사용할 수 있다.
1. 최적 부분 구조 (Optimal Substructure)
  - 큰 문제를 작은 문제로 나눌 수 있으며 작은 문제의 답을 모아서 큰 문제를 해결할 수 있다.
2. 중복되는 부분 문제 (Overlapping Subproblem)
  - 동일한 작은 문제를 반복적으로 해결한다.

피보나치 (Fibonacci) 수열

피보나치 수열 : 다음과 같은 형태의 수열이며, 다이나믹 프로그래밍으로 효과적으로 계산할 수 있다.
점화식이란 인접한 항들 사이의 관계식을 의미한다.
피보나치 수열을 점화식으로 표현하면 다음과 같다.
- n번째 피보나치 수 = (n-1)번째 피보나치 수 + (n-2)번째 피보나치 수
- 단, 1번째 피보나치 수 = 1, 2번째 피보나치 수 = 1
피보나치 수열이 계산되는 과정은 다음과 같이 표현할 수 있다.
- 프로그래밍에서는 이러한 수열을 배열이나 리스트를 이용해 표현한다.
- 파이썬에서는 리스트 자료형이 이를 처리한다.
피보나치 수열이 계산되는 과정은 다음과 같이 표현할 수 있다.
- n번째 피보나치 수를 $f(n)$라고 할 때, 4번째 피보나치 수 $f(4)$를 구하는 과정은 다음과 같다.

# 피보나치 함수(Fibonacci Function)을 재귀함수로 구현
def fibo(x):
    if x == 1 or x == 2:
        return 1
    return fibo(x - 1) + fibo(x - 2)

print(fibo(4))

[실행 결과]

단순 재귀 함수로 피보나치 수열을 해결하면 지수 시간 복잡도를 가지게 된다.
다음과 같이 $f(2)$가 여러 번 호출되는 것을 확인할 수 있다. (중복되는 부분 문제)
피보나치 수열의 시간 복잡도는 다음과 같다.
- 세타 표기법 : $θ(1.618...^N)$
- 빅오 표기법 : $O(2^N)$
$f(n)$ 함수에서 n이 커지면 커질수록 수행 시간이 기하급수적으로 늘어난다.
빅오 표기법을 기준으로 $f(30)$을 계산하기 위해 약 10억가량의 연산을 수행해야 한다.
그렇다면 $f(100)$을 계산하기 위해 얼마나 많은 연산을 수행해야 할까?
- $2^10$을 약 1,000이라고 했을 때, 연산 횟수는 약 1,000,000,000,000,000,000,000,000,000,000번이다.

피보나치 수열의 효율적인 해법 : 다이나믹 프로그래밍

다이나믹 프로그램의 사용 조건을 만족하는지 확인한다.
1. 최적 부분 구조 : 큰 문제를 작은 문제로 나눌 수 있다.
2. 중복되는 부분 문제 : 동일한 작은 문제를 반복적으로 해결한다.
피보나치 수열은 다이나믹 프로그래밍의 사용 조건을 만족한다.

메모이제이션 (Memoization)

탑다운 방식
메모이제이션은 다이나믹 프로그래밍을 구현하는 방법 중 하나다.
한 번 계산한 결과를 메모리 공간에 메모하는 기법이다.
- 같은 문제를 다시 호출하면 메모했던 결과를 그대로 가져온다.
- 값을 기록해 놓는다는 점에서 캐싱 (Caching)이라고 한다.
메모제이션은 때에 따라서 다른 자료형, 예를 들어 사전 (dict) 자료형을 이용할 수도 있다.
- 사전 자료형은 수열처럼 연속적이지 않은 경우에 유용한데, 예를 들어 $a_n$을 계산하고자 할 때 $a_0$ ~ $a_{n-1}$ 모두가 아닌 일부의 작은 문제에 대한 해답만 필요한 경우가 존재할 수 있는데, 이 경우 사전 자료형을 사용하는 게 더 효과적이다.

탑다운 vs 보텀업

탑다운 (메모이제이션) 방식 : 하향식; 구현과정에서 재귀함수 이용
- 큰 문제를 해결하기 위해 작은 문제들을 재귀적으로 호출하여 작은 문제가 모두 해결되었을 때, 큰 문제에 대한 답을 얻을 수 있음
- 시스템상 재귀 함수의 스택 크기가 한정되어 있을 수 있기 때문에 재귀적인 피보나치 수열의 소스코드에서 5,000번째 이상의 큰 피보나치 수를 구하도록 하면 'recursion depth (재귀 함수 깊이)'와 관련된 오류가 발생할 수 있다.
  - 이 경우 sys 라이브러리에 포함되어 있는 setrecursionlimit() 함수를 호출하여 재귀 제한을 완화할 수 있다.
보텀업 방식 : 상향식; 구현과정에서 반복문 이용
- 아래쪽에서부터 작은 문제를 하나씩 해결해나가면서 먼저 계산했던 문제들의 값을 활용해서 그 다음 문제를 해결
- 일반적으로 반복문을 이용한 다이나믹 프로그래밍이 더 성능이 좋다.
다이나믹 프로그래밍의 전형적인 형태는 보텀업 방식이다.
- 결과 저장용 리스트는 DP 테이블이라고 부른다.
엄밀히 말하면 메모이제이션은 이전에 계산된 결과를 일시적으로 기록해 놓는 넓은 개념을 의미한다.
- 따라서 메모제이션은 다이나믹 프로그래밍에 국한된 개념은 아니다.
- 한 번 계산된 결과를 담아 놓기만 하고 다이나믹 프로그래밍을 위해 활용하지 않을 수도 있다.

1. 피보나치 수열 : 탑다운 다이나믹 프로그래밍 소스코드

# 한 번 계산된 결과를 메모이제이션 (Memoization)하기 위한 리스트 초기화
d = [0] * 100

# 피보나치 함수 (Fibonacci Function)를 재귀함수로 구현 (탑다운 다이나믹 프로그래밍)
def fibo(x):
    # 종료 조건 (1 혹은 2일 때 1을 반환)
    if x == 1 or x == 2:
        return 1
    # 이미 계산한 적 있는 문제라면 그대로 반환
    if d[x] != 0:
        return d[x]
    # 아직 계산하지 않은 문제라면 점화식에 따라서 피보나치 결과 반환
    d[x] = fibo(x - 1) + fibo(x - 2)
    return d[x]

print(fibo(99))

[실행 결과]

2. 피보나치 수열 : 보텀업 다이나믹 프로그래밍 소스코드

# 앞서 계산된 결과를 저장하기 위한 DP 테이블 초기화
d = [0] * 100

# 첫 번째 피보나치 수와 두 번째 피보나치 수는 1
d[1] = 1
d[2] = 1
n = 99

# 피보나치 함수 (Fibonacci Function) 반복문으로 구현 (보텀업 다이나믹 프로그래밍)
for i in range(3, n + 1):
    d[i] = d[i - 1] + d[i - 2]
    
print(d[n])

[실행 결과]

피보나치 수열 : 메모이제이션 동작 분석

이미 계산된 결과를 메모리에 저장하면 다음과 같이 색칠된 노드만 처리할 것을 기대할 수 있다.
- 처음 방식으로 호출했던 부분은 실선으로 표현했는데 사실상 호출되지 않는다. 왜냐하면 호출하더라도 따로 계산하지 않고 리스트에서 값을 가져오가나 바로 1을 반환하기 때문이다.
실제로 호출되는 함수에 대해서만 확인해 보면 다음과 같이 방문한다.
메모이제이션을 이용하는 경우 피보나치 수열 함수의 시간 복잡도는 $O(N)$이다.

d = [0] * 100

def fibo(x):
    print('f(' + str(x) + ')', end = ' ')
    if x == 1 or x == 2:
        return 1
    if d[x] != 0:
        return d[x]
    d[x] = fibo(x - 1) + fibo(x - 2)
    return d[x]

fibo(6)

[실행 결과]

다이나믹 프로그래밍 vs 분할 정복

다이나믹 프로그래밍과 분할 정복은 모두 최적 부분 구조를 가질 때 사용할 수 있다.
- 큰 문제를 작은 문제로 나눌 수 있으며 작은 문제의 답을 모아서 큰 문제를 해결할 수 있는 상황
다이나믹 프로그래밍과 분할 정복의 차이점은 부분 문제의 중복이다.
- 다이나믹 프로그래밍 문제에서는 각 부분 문제들이 서로 영향을 미치며 부분 문제가 중복된다.
- 분할 정복 문제에서는 동일한 부분 문제가 반복적으로 계산되지 않는다.
분할 정복의 대표적인 예시인 퀵 정렬을 살펴보자.
- 한 번 기준 원소(Pivot)가 자리를 변경해서 자리를 잡으면 그 기준 원소의 위치는 바뀌지 않는다.
- 분할 이후에 해당 피벗을 다시 처리하는 부분 문제는 호출되지 않는다.

다이나믹 프로그래밍 문제에 접근하는 방법

주어진 문제가 다이나믹 프로그래밍 유형임을 파악하는 것이 중요하다.
가장 먼저 그리디, 구현, 완전 탐색 등의 아이디어로 문제를 해결할 수 있는지 검토할 수 있다.
- 다른 알고리즘으로 풀이 방법이 떠오르지 않으면 다이나믹 프로그래밍을 고려해 보자.
일단 재귀 함수로 비효율적인 완전 탐색 프로그램을 작성한 뒤에 (탑다운) 작은 문제에서 구한 답이 큰 문제에서 그대로 사용될 수 있으면, 코드를 개선하는 방법을 사용할 수 있다.
일반적인 코딩 테스트 수준에서는 기본 유형의 다이나믹 프로그래밍 문제가 출제되는 경우가 많다.

Example 2) 1로 만들기

정수 X가 주어질 때 정수 X에 사용할 수 있는 연산은 다음과 같이 4가지이다.

a. X가 5로 나누어떨어지면, 5로 나눈다.
b. X가 3으로 나누어떨어지면, 3으로 나눈다.
c. X가 2로 나누어떨어지면, 2로 나눈다.
d. X에서 1을 뺀다.

정수 X가 주어졌을 때, 연산 4개를 적절히 사용해서 1을 만들려고 한다. 연산을 사용하는 횟수의 최솟값을 출력하시오.

입력 조건

첫째 줄에 정수 X가 주어진다. (1 ≤ X ≤ 30,000)

출력 조건

첫째 줄에 연산을 하는 횟수의 최솟값을 출력한다.

[Solution]

피보나치 수열 문제를 도식화한 것처럼 함수가 호출되는 과정을 그림으로 그려보면 다음과 같다.
- 최적 부분 구조와 중복되는 부분 문제를 만족한다.
점화식 : $a_i = min(a_{i-1}, a_{i/2}, a_{i/3}, a_{i/5}) + 1
- $a_i = i$를 1로 만들기 위한 최소 연산 횟수
단, 1을 빼는 연산을 제외하고는 해당 수로 나누어떨어질 때에 한해 점화식을 적용할 수 있다.
점화식 끝에 1을 더해주는 이유 : 함수의 호출 횟수를 구해야 하기 때문
실제 코드를 구현할 때는 1을 빼는 연산을 제외하고는 해당 수로 나누어떨어질 때에 한해서만 점화식을 적용

# 정수 X를 입력받기
x = int(input())

# 앞서 계산된 결과를 저장하기 위한 DP 테이블 초기화
d = [0] * 30001

# 다이나믹 프로그래밍 (Dynamic Programming) 진행 (보텀업)
for i in range(2, x + 1):
    # 현재의 수에서 1을 빼는 경우
    d[i] = d[i - 1] + 1
    # 현재의 수가 2로 나누어 떨어지는 경우
    if i % 2 == 0:
        d[i] = min(d[i], d[i // 2] + 1)
    # 현재의 수가 3으로 나누어 떨어지는 경우
    if i % 3 == 0:
        d[i] = min(d[i], d[i // 3] + 1)
    # 현재의 수가 5로 나누어 떨어지는 경우
    if i % 5 == 0:
        d[i] = min(d[i], d[i // 5] + 1)

print(d[x])

[실행 결과]

Example 3) 개미 전사

개미 전사는 부족한 식량을 충당하고자 메뚜기 마을의 식량창고를 몰래 공격하려고 한다. 메뚜기 마을에는 여러 개의 식량창고가 있는데 식량창고는 일직선으로 이어져 있다. 각 식량창고에는 정해진 수의 식량을 저장하고 있으며 개미 전사는 식량창고를 선택적으로 약탈하여 식량을 뺴앗을 예정이다. 이때 메뚜기 정찰병들은 일직선상에 존재하는 식량창고 중에서 서로 인접한 식량창고가 공격받으면 바로 알아챌 수 있다. 따라서 개미 전사가 정찰병에게 들키지 않고 식량창고를 약탈하기 위해서는 최소한 한 칸 이상 떨어진 식량창고를 약탈해야 한다. 예를 들어 식량창고 4개가 다음과 같이 존재한다고 가정하자.

{1, 3, 1, 5}

이때 개미 전사는 두 번째 식량창고와 네 번째 식량창고를 선택했을 때 최댓값인 총 8개의 식량을 빼앗을 수 있다. 개미 전사는 식량창고가 이렇게 일직선상일 때 최대한 많은 식량을 얻기를 원한다. 개미 전사를 위해 식량창고 N개에 대한 정보가 주어졌을 때 얻을 수 있는 식량의 최댓값을 구하는 프로그램을 작성하시오.

입력 조건

첫째 줄에 식량창고의 개수 N이 주어진다. (3 ≤ N ≤ 100)
둘째 줄에 공백으로 구분되어 각 식량창고에 저장된 식량의 개수 K가 주어진다. (0 ≤ K ≤ 1,000)

출력 조건

첫째 줄에 개미 전사가 얻을 수 있는 식량의 최댓값을 출력하시오.

[Solution]

N = 4일 때, 다음과 같은 경우들이 존재할 수 있다.
- 식량을 선택할 수 있는 경우의 수는 다음과 같이 8가지이다.
- 7번째 경우에서 8만큼의 식량을 얻을 수 있으므로 최적의 해는 8이다.
$a_i = i$번째 식량창고까지의 최적의 해 (얻을 수 있는 식량의 최댓값)
- 이렇게 정의한다면 다이나믹 프로그래밍을 적용할 수 있다.
왼쪽부터 차례대로 식량창고를 턴다고 했을 때, 특정한 i번째 식량창고에 대해서 털지 안 털지의 여부를 결정하면, 아래 2가지 경우 중에서 더 많은 식량을 털 수 있는 경우를 선택하면 된다.
점화식 : $a_i = max(a_{i-1}, a_{i-2}+k_i)$
- $a_i = i$번째 식량창고까지의 최적의 해 (얻을 수 있는 식량의 최댓값)
- $k_i = i$번째 식량창고에 있는 식량의 양
한 칸 이상 떨어진 식량창고는 항상 털 수 있으므로 (i - 3)번째 이하는 고려할 필요가 없다.

# 정수 X를 입력받기
n = int(input())
# 모든 식량 정보 입력받기
array = list(map(int, input().split()))

# 앞서 계산된 결과를 저장하기 위한 DP 테이블 초기화
d = [0] * 100

# 다이나믹 프로그래밍 (Dynamic Programming) 진행 (보텀업)
d[0] = array[0]
d[1] = max(array[0], array[1])
for i in range(2, n):
    d[i] = max(d[i - 1], d[i - 2] + array[i])

# 계산된 결과 출력
print(d[n - 1])

[실행 결과]

Example 4) 바닥 공사

가로의 길이가 N, 세로의 길이가 2인 직사각형 형태의 얇은 바닥이 있다. 태일이는 이 얇은 바닥을 1 X 2의 덮개, 2 X 1의 덮개, 2 X 2의 덮개를 이용해 채우고자 한다. 이때 바닥을 채우는 모든 경우의 수를 구하는 프로그램을 작성하시오. 예를 들어 2 X 3 크기의 바닥을 채우는 경우는 5가지이다.

입력 조건

첫째 줄에 N이 주어진다. (1 ≤ N ≤ 1,000)

출력 조건

첫째 줄에 2 X N 크기의 바닥을 채우는 방법의 수를 796,796으로 나눈 나머지를 출력한다.

[Solution]

왼쪽부터 i - 1까지 길이가 덮개로 이미 채워져 있으면 2 X 1의 덮개를 채우는 하나의 경우밖에 존재하지 않음.
왼쪽부터 i - 2까지 길이가 덮개로 이미 채워져 있으면 1 X 2 덮개 2개를 넣는 경우, 혹은 2 X 2의 덮개 하나를 넣는 경우로 2가지 경우가 존재함.
점화식 : $a_i = a_{i-1} + a_{i-2} \times 2$

# 정수 X를 입력받기
n = int(input())

# 앞서 계산된 결과를 저장하기 위한 DP 테이블 초기화
d = [0] * 1001

# 다이나믹 프로그래밍 (Dynamic Programming) 진행 (보텀업)
d[1] = 1
d[2] = 3
for i in range(3, n + 1):
    d[i] = (d[i - 1] + 2 * d[i - 2]) % 796796

# 계산된 결과 출력
print(d[n])

[실행 결과]

Example 5) 효율적인 화폐 구성

N가지 종류의 화폐가 있다. 이 화폐들의 개수를 최소한으로 이용해서 그 가치의 합이 M원이 되도록 하려고 한다. 이때 각 화폐는 몇 개라도 사용할 수 있으며, 사용한 화폐의 구성은 같지만 순서만 다른 것은 같은 경우로 구분한다. 예를 들어 2원, 3원 단위의 화폐가 있을 때는 15원을 만들기 위해 3원을 5개 사용하는 것이 가장 최소한의 화폐 개수이다.

입력 조건

첫째 줄에 N, M이 주어진다. (1 ≤ N ≤ 100, 1 ≤ M ≤ 10,000)
이후 N개의 줄에는 각 화폐의 가치가 주어진다. 화폐 가치는 10,000보다 작거나 같은 자연수이다.

출력 조건

첫째 줄에 M원을 만들기 위한 최소한의 화폐 개수를 출력한다.
불가능할 때는 -1을 출력한다.

[Solution]

$a_i$ = 금액 $i$를 만들 수 있는 최소한의 화폐 개수
$k$ = 각 화폐의 단위
점화식 : 각 화폐 단위인 k를 하나씩 확인하며
- $a_{i-k}$를 만드는 방법이 존재하는 경우, $a_i = min(a_i, a_{i-k} + 1)$
- $a_{i-k}$를 만드는 방법이 존재하지 않는 경우, $a_i = INF$
N = 3, M = 7이고, 각 화폐의 단위가 2, 3, 5인 경우
Step 0 (초기화)
- 먼저 각 인덱스에 해당하는 값으로 INF (무한)의 값을 설정한다.
- INF은 특정 금액을 만들 수 있는 화폐 구성이 가능하지 않다는 의미를 가진다.
- 본 문제에서는 10,001을 사용할 수 있다.
Step 1
- 첫 번째 화폐 단위인 2를 확인한다.
- 점화식에 따라서 다음과 같이 리스트가 갱신된다.
- 두 번째 화폐 단위인 3을 확인한다.
- 점화식에 따라서 다음과 같이 리스트가 갱신된다.
- 세 번쨰 화폐 단위인 5를 확인한다.
- 점화식에 따라서 다음과 같이 최종적으로 리스트가 갱신된다.

# 정수 N, M을 입력받기
n, m = map(int, input().split())
# N개의 화폐 단위 정보를 입력받기
array = []
for i in range(n):
    array.append(int(input()))

# 한 번 계산된 결과를 저장하기 위한 DP 테이블 초기화
d = [10001] * (m + 1)

# 다이나믹 프로그래밍 (Dynamic Programming) 진행 (보텀업)
d[0] = 0
for i in range(n): # i는 각각의 화폐 단위
    for j in range(array[i], m + 1): # j는 각각의 금액
        if d[j - array[i]] != 10001: # (i - k)원을 만드는 방법이 존재하는 경우
            d[j] = min(d[j], d[j-array[i]] + 1)

# 계산된 결과 출력
if d[m] == 10001: # 최종적으로 M원을 만드는 방법이 없는 경우
    print(-1)
else:
    print(d[m])

[실행 결과]

'Coding Test > Python' 카테고리의 다른 글

[알고리즘] 그래프 이론 : 서로소 집합, 신장 트리, 크루스칼, 위상 정렬 (0)	2021.10.12
[알고리즘] 최단 경로 (Shortest Path) : Dijkstra (다익스트라), Floyd-Warshall (플로이드 워셜) (0)	2021.10.11
[알고리즘] 이진 탐색 (Binary Search), 트리 자료구조 (0)	2021.08.15
[알고리즘] 정렬 (선택 정렬, 삽입 정렬, 퀵 정렬, 계수 정렬, 정렬 라이브러리) (0)	2021.08.13
[알고리즘] 탐색 알고리즘 DFS/BFS (0)	2021.08.12

[알고리즘] 다이나믹 프로그래밍 (Dynamic Programming)

다이나믹 프로그래밍

피보나치 (Fibonacci) 수열

피보나치 수열의 효율적인 해법 : 다이나믹 프로그래밍

메모이제이션 (Memoization)

탑다운 vs 보텀업

피보나치 수열 : 메모이제이션 동작 분석

다이나믹 프로그래밍 vs 분할 정복

다이나믹 프로그래밍 문제에 접근하는 방법

Example 2) 1로 만들기

Example 3) 개미 전사

Example 4) 바닥 공사

Example 5) 효율적인 화폐 구성

'Coding Test > Python' 카테고리의 다른 글

댓글

티스토리툴바