알고리즘의 성능분석 방법
Programming/Data Structure 2012. 12. 20. 00:06 |성능분석 방법 중 최소한으로 필요한 수학 함수
지수식
로그식
log 함수 (지수함수 적 정의)
a ≠ 1 이고, x>0, y>0 일때, x, y 사이에 라는 관계가 있으면 "x는 a를 밑으로 하는 y의 로그" 라 하고,
로 표기한다.
ex) 이므로, 이다.
이 때, a ≠ 1 이어야 하는 이유는 1의 거듭제곱은 모두 1이기 때문에 어떠한 값이 오더라도 1이 되어 의미가 없어지기 때문이다.
시간 복잡도(Time Complexity) 와 공간 복잡도(Space Complexity)
그저 잘 동작하는 자료구조와 알고리즘을 찾는 것이 목적이라면 기능별로 자료구조와 알고리즘을 하나씩만 알아도 된다.
하지만 잘 동작하는 것은 물론이거니와 좋은 성능까지 보장받기를 원한다면, 자료구조와 알고리즘을 분석하고 평가할 수 있어야 한다.
모든 경우에 있어서 항상 우월한 성능을 보이는 만능 키와 같은 자료구조와 알고리즘은 존재하지 않기 때문이다.
알고리즘을 평가하는 두 가지 요소
1. 어떤 알고리즘이 어떠한 상황에서 더 빠르고 또 느릴까?
2. 어떤 알고리즘이 어떠한 상황에서 메모리를 적게 쓰고 또 많이 쓸까?
이렇듯 하나는 '속도'에 관한 것이고 다른 하나는 '메모리의 사용량'에 관한 것인데, 속도에 해당하는 알고리즘의 수행시간 분석결과를 가리켜 '시간 복잡도(Time Cimplexity)' 라 하고, 메모리 사용량에 대한 분석결과를 가리켜 '공간 복잡도(Space Complexity)' 라 한다.
메모리를 적게 쓰고 속도도 빨라야 최적의 알고리즘이라 할 수 있다. 그런데 일반적으로 알고리즘을 평가할 때는 메모리의 사용량보다 실행속도에 초점을 준다.
대게는 속도에 관심이 더 많고, 또 중요한 요소로 판단되기 때문이다.
물론 특정 알고리즘에 대해서 상대적인 우월성을 입증해야 하는 경우에는 메모리의 사용량도 함께 고려가 되지만, 이미 검증이 끝난 알고리즘의 적용을 고려하는 경우에는 속도에 초점을 두어 적합성 여부를 판단하게 된다.
속도를 측정하는 방법
시계를 가져다 놓고 수행시간을 재고 있을 수는 없다. 혹 시간을 잴 수 있어도 큰 의미를 부여하기 어렵다.
처리해야 할 데이터양의 변화에 따른 속도의 증가 및 감소의 정도도 알아야 하는데, 이를 위해서 조건을 달리하여 수백 번, 수천 번 실행해가면서 시간을 잴 수 는 없는 일이기 때문이다. 그래서 알고리즘의 수행속도를 평가할 때는 다음과 같은 방식을 취한다.
1. 연산의 횟수를 센다.
2. 처리해야 할 데이터의 수 n에 대한 연산횟수의 함수 T(n) 을 구성한다.
※ 식을 구성하면 데이터 수의 증가에 따른 연산횟수의 변화 정도를 판단할 수 있다.
즉, 알고리즘 별 연산횟루를 함수 T(n)의 형태로 구성하면 그래프를 통해서 데이터 수의 변화에 따른 연산횟수의 변화 정도를 한눈에 파악할 수 있으며, 이로 인해서 둘 이상의 알고리즘을 비교하기가 용이해진다.
보라색의 알고리즘보다는 빨간색의 알고리즘이 좋다.
그러나 빨간색의 알고리즘과 같이 안정적인 성능을 보장하는 알고리즘은 보라색의 알고리즘에 비해서 구현의 난이도가 높은 편이다. 따라서 데이터의 수가 많지 않고 성능에 덜 민감한 경우라면 구현의 편의를 이유로 보라색의 알고리즘을 선택하기도 한다.
※ 알고리즘의 정답은 없는 것이 아니라 상황에 맞게 답을 내려야 한다. 구현보다 중요한 것은 종합적으로 사고하고 판단하는 능력이다.
'Programming > Data Structure' 카테고리의 다른 글
빅-오 표기법 (Big-Oh Notation) (5) | 2012.12.22 |
---|---|
이진 탐색(Binary Search) 알고리즘 (0) | 2012.12.20 |
순차 탐색(Linear Search) 알고리즘과 시간 복잡도 분석의 핵심요소 (0) | 2012.12.20 |
자료구조와 알고리즘 (0) | 2012.12.19 |
자료구조(Data Structure)에 대한 기본적인 이해 (0) | 2012.11.15 |