배열 기반 리스트의 단점

- 배열의 길이가 초기에 결정되어야 한다. 변경이 불가능하다.

- 삭제의 과정에서 데이터의 이동(복사)가 매우 빈번히 일어난다.


배열 기반 리스트의 장점

- 데이터의 참조가 쉽다. 인덱스 값을 기준으로 어디든 한 번에 참조가 가능하다.


위의 장점 및 단점은 '연결 기반 리스트' 를 대상으로 비교한 결과이다.


보통 '리스트'라고 하면 '연결 기반 리스트' 를 떠올리고 혹자는 '배열 기반 리스트' 는 불필요하다고까지 말하는 경우가 있다. 하지만 이는 잘못된 것이다.

배열 기반 리스트도 나름의 장점이 있다. 그리고 그 장점은 연결 기반 리스트에는 없는 장점이다.


"배열 기반 리스트도 각종 자료구조의 구현에 중요한 도구이고, 그 자체로도 훌륭한 자료구조이다."





배열 기반 리스트의 활용(주소 값을 저장)


ArrayList.c

ArrayList.h


리스트를 활용하는 것이라 ArrayList.h, ArrayList.c 를 포함시켜야 한다.

이 중에서 헤더파일인 ArrayList.h의 typedef 선언은 다음과 같이 변경해야 한다.

typedef int LData;        (typedef 선언 변경)     →        typedef NameCard * LData;


그리고 NameCard라는 이름의 인식을 위해서 ArrayList.h에 다음 문장도 포함시켜야 한다.

#include "NameCard.h"





Posted by scii
:

헤더파일의 정의


어떠한 자료구조이건 간에 '자료구조의 구현''구현된 자료구조의 활용' 은 완전히 구분되도록 ADT를 정의해야 함을 기억해야 한다.


배열을 이용하는 방법.


리스트에 다양한 종류의 데이터를 저장할 수 있게 하기 위한 typedef 선언이 존재한다.


typedef int LData;                    // 리스트에 int형 데이터의 저장을 위한 선언


typedef ArrayList List;            // List는 배열 기반 리스트이다.

이렇듯 ArrayList에 List라는 이름을 별도로 부여한 것이 당장에는 큰 의미가 없어 보인다. 하지만 ArrayList라는 이름에도 typedef 선언을 해 놓으면, 다음과 같이 List에 다른 이름을 부여하는 것만으로도 사용하는 리스트의 종류를 바꿀 수 있다.


typedef LinkedList List;    // List는 연결 기반 리스트이다.

그래서 main 함수에서도 ArrayList가 아닌 List라는 이름을 이용하여 예제를 작성한 것이다.




함수의 정의


curPosition 변수는 저장된 값을 통해서 LFirst 함수와 LNext 함수가 참조해야 할 배열의 위치를 알려주는 변수이다. 그래서 curPosition은 0이 아닌 -1로 초기화한 것이며, 여기에는 아직 데이터의 차모가 진행되지 않았다는 의미가 담겨있다.


"어떠한 라이브러리를 사용하건 저장된 데이터의 조회를 위한, LFirst 함수의 호출과 같은 별도의 과정은 거치기 마련이다."



Posted by scii
:

리스트라는 자료구조는 구현방법에 따라서 다음과 같이 크게 두 가지로 나뉜다.

- 순차 리스트                        배열을 기반으로 구현된 리스트

- 연결 리스트                        메모리의 동적할당을 기반으로 구현된 리스트


하지만 이는 리스트의 구현방법의 차이에서 비롯된 것이기 때문에 이 둘의 ADT가 동일하다고 해서 문제 될 것은 없다. 물론 각각의 특성적 차이 때문에 ADT에 차이를 두기도 한다. 



리스트의 ADT 정의를 위해서 리스트 자료구조의 가장 기본적이고도 중요한 특성

1. 리스트 자료구조는 데이터를 나란히 저장한다.

2. 리스트 자료구조는 중복된 데이터의 저장을 막지 않는다.


자료구조 중에서는 중복된 데이터의 저장을 허용하지 않는 경우도 있다. 하지만 리스트는 이를 허용한다. 

즉, 리스트는 수학적으로 중복을 허용하지 않는 '집합' 과는 다르다. 그리고 이것이 리스트 ADT를 정의하는데 있어서 고려해야 할 유일한 요소이다. 



리스트 자료구조의 ADT

void ListInit(List * plist);        //C++의 생성자 역할

- 초기화할 리스트의 주소 값을 인자로 전달.

- 리스트 생성 후 제일 먼저 호루되어야 하는 함수.


void LInsert(List * plist, LData data);

- 리스트에 데이터를 저장한다. 매개변수 data에 전달된 값을 저장한다.


int LFirst(List * plist, LData * pdata);

- 첫 번째 데이터가 pdata가 가리키는 메모리에 저장된다. 

- 데이터의 참조를 위한 초기화가 진행된다.

- 참조 성공 시 TRUE(1), 실패 시 FALSE(0) 반환.


int LNext(List * plist, LData * pdata);

- 참조된 데이터의 다음 데이터가 pdata가 가리키는 메모리에 저장된다.

- 순차적인 참조를 위해서 반복 호출이 가능하다.

- 참조를 새로 시작하려면 먼저 LFirst 함수를 호출해야 한다.

- 참조 성공 시 TRUE(1), 실패 시 FALSE(0) 반환.


LData LRemove(List * plist);

- LFirst 또는 LNext 함수의 마지막 반환 데이터를 삭제한다. 

- 삭제된 데이터는 반환된다.

- 마지막 반환 데이터를 삭제하므로 연이은 반복 호출을 허용하지 않는다.


int LCount(List * plist);

- 리스트에 저장되어 있는 데이터의 수를 반환한다.


사실 위의 정보만 가지고는 리스트의 활용방법을 정확히 이해하기는 힘들다 이를 위해서는 헤더파일과 위의 함수들을 호출하는 main함수를 보아야 한다. 

그러나 위의 정보만 가지고도 리스트 자료구조가 제공하는 기능을 어느 정도 예측할 수 있어야 한다.      



모든 자료구조는 내부적으로 다양한 정보를 담게 된다. 그저 데이터만 담는 게 아니라 그 데이터를 효율적으로 저장 및 참조하기 위한 정보들도 담기기 마련이다. 따라서 이와 관련된 변수들의 초기화가 서너행되어야 하며 이를 담담하는 함수가 ListInit이다.


LFirst 함수를 호출하도록 ADT를 디자인한 이유는 무엇일까?

- 이에 대한 해답은 "LNext 함수를 호출할 때마다 다음에 저장된 데이터를 얻을 수 있다." 라는 사살에서 찾을 수 있다. 

이것이 가능한 이유는  리스트 내에서 '데이터의 참조위치' 를 기록하기 때문이다. 따라서 처음부터 참조를 새롭게 시작하기 위해서는 바로 이 정보를 초기화해야 한다. 그리고 이를 목적으로 LFirst 함수의 호출을 요구하는 것이다.






※ 자료구조를 공부하다보니 파이썬의 자료형들을 더욱 깊이 알게 되는구나!!

파이썬의 자료형 중 리스트를 다룰때마다 대충 이런식으로 되어있구나 하고 생각했었는데,

C 자료구조를 공부하니 이런식의 ADT가 되어있다는 것을 확실히 알았다.


Posted by scii
:

python 자료형의 분류


 자료형

저장 모델 

변경 가능성 

접근 방법 

수치 형 

리터럴(scalar) 

불가 

직접 

문자열 

리터럴 

불가 

시퀀스 

튜플 

저장 

불가

시퀀스 

리스트 

저장 

가능 

시퀀스 

사전 

저장 

가능 

매핑(mapping) 






















자료형들을 구분하는 또 다른 중요한 구분 기준.

- 자료 값을 변경할 수 있는가? 이다.


변경할 수 있는 자료형을 '변경 가능하다(Mutable)' 고 하고, 그렇지 않은 자료형을 '변경 가능하지 않다(Immutable)' 고 한다. 


변경 가능한 자료형 - 리스트, 사전

변경 가능하지 않은 자료형 - 숫자, 문자열, 튜플




ex) >>> a = 1

>>> a = 2

이렇게 있다고 생각한다면...

결론부터 말해서 a는 숫자 2로 변경된 것이 아니다. 

1은 변경되지 않고 다만 a가 다른 객체(2)를 참조할 뿐이다.

※ python 에서는 객체와 이름은 별도로 관리된다. 이름에 직접 값이 저장되는 것이 아니고, 이름은 언제나 객체를 참조(Referencing) 하게 되어 있다.


a    --->    1    # a=1 한 후

a    --->    2    # a=2 한 후 ( 객체 1은 참조되지 않으므로 버려진다.)


결국, 숫자 객체 1은 값이 변경되지 않았다. 이름 a가 다른 객체를 참조한다. 이때 객체 1은 참조되지 않으므로 메모리에서 제거된다. 

즉, 이름에 의해 참조만 바뀌는 것.


ex) >>> L1 = [1,2]

>>> L2 = [3,4]

이것도 마찬가지로 이름에 의해 참조만 바뀌는 것이다. 

그러나 객체 내부의 값을 변경할 때에, 리스트는 값을 변경할 수 있다.


즉, 어떠한 이름으로 객체 전체를 바꾸는 것은 객체 전체를 변경하는 것이 아니며, 새로운 객체를 할당하는 것이다.


객체 변경의 의미는? 객체 내부의 값을 변경할 수 있는가이다.





python의 이름이라는 것이 c/c++의 포인터와 참조자의 개념과 정말 똑같다. 이름(변수)를 포인터 혹은 참조자라고 인식하면 될 것 같다.

Posted by scii
:

리스트

[]를 사용하는 리스트는 임의의 객체를 저장하는 집합적 자료형이다. 각 자료는 순서를 가지고있고 순서에 따라 접근 가능하다.


리스트는 메쏘드(객체 함수)를 가진다.




튜플

()를 사용하는 튜플도 문자열과 리스트와 유사한 특정을 가진다.


튜플과 리스트의 차이라면, 튜플은 값의 변경이 안 되고, 리스트는 가능하다는 것이다.


또한, 리스트는 다양한 메쏘드를 가지지만, 튜플은 그렇지 않다.




사전

사전은 옵셋이 아닌 키를 사용하여 값을 얻는 자료 구조이다. 이것은 사상 함수와 같은 역할을 한다. 

함수 f는 f:x -> y와 같이 x를 y로 사상시킨다. 사전의 역할이 이와 동잃다. 사전에 x라는 키(key)를 주면 값 y를 돌려준다.

또한 키에 대응하는 값(value)을 저장할 수도 있다.

사전은 초기화할 때 {}를 사용한다. 초기 값은 '키:값' 의 형태로 준다.



Posted by scii
: