To love
데이터 모델 본문
빅데이터 처리를 위해서는 일단 많은 양의 데이터를 저장해야 합니다.
어떻게 저장을 해야 분석을 하기 편리할까요?
하드디스크(HDD) 또는 SSD라 불리는 하드웨어가 있습니다. 하드웨어란 컴퓨터를 구성하는 기기이며, 컴퓨터에서 각종 정보의 전송 통로를 제공하고, 정보에 대한 처리가 실제 일어나게 해주는 물리적인 실체입니다.
HDD와 SSD는 둘 다 데이터를 저장하는 장소입니다.
HDD는 원반형태 디스크 여러개가 들어있고 헤더가 움직이면서 데이터를 읽습니다.
자세한 스토리는 아래 영상을 참조하시면 좋습니다.
SSD는 플로시메모리기반으로 만들어진 장치입니다. HDD는 기계적 동작을 하는 반면, SSD는 전기적 방식으로 동작하기 떄문에, SSD가 HDD보다는 동작속도가 훨씬 빠릅니다.
SSD의 탄생과정이나 구매시 참고할 점은 아래 영상을 참고하시면 좋습니다.
HDD나 SSD에 어떻게 0,1,0,1의 형태로 데이터가 저장되어 있는지 사람이 이해하기는 어렵겠죠?
그래서 데이터를 분석하는 사람 입장에서는 데이터의 저장을 이해할 수 있는 개념적인 모델이 필요합니다. 이것을 데이터 모델이라고 부릅니다.
예를 들어, 엑셀을 생각해보죠. 엑셀은 데이터를 표 형태로 저장합니다.
다른 데이터의 형태도 있겠죠?
c:/student/database/storage와 같이 표현되는 파일형태도 있고,
텍스트와 같이 형태가 너무 복잡해서 txt파일 등으로 저장된 것일 수도 있습니다.
0,1,0,1로 이루어진 복잡한 데이터의 저장과정은 OS(운영체제)와 DBMS라는 소프트웨어가 관리합니다. 소프트웨어란 하드웨어를 작동시키기 위한 모듈(함수/명령들의 집합)을 말합니다.
따라서 사용자는 데이터의 모델만 신경쓰면 됩니다.