[2018/07/11] 데이터전처리 1. 데이터전처리 개요

데이터분석에서 가장 많이 쓰는 툴 – R, 파이썬, SQL 데이터전처리가 필요한 이유: 실무에서는 input data의 모양이 예쁘게 존재하지 않는다. input data를 만들기까지 많은 노력이 필요하다. 실무 데이터는 또한 오류가 많고 비어있는 값들이 많다. 정제된 값이 많지 않다. Garbage in Garbage […]

[2018/07/04] DB 1. 관계형 데이터베이스

데이터: 의미를 갖는 사실 데이터베이스: 연관된 데이터의 모임 정형 데이터 –> 관계형 데이터베이스 mini-world: 각 데이터베이스만의 형식과 내용을 갖고있다 비정형 데이터 -책의 한 페이지 -연관된 데이턴데 형식이 없다 반정형 데이터 데이터와 데이터베이스 – 데이터 데이터 == 물 DBMS: 데이터베이스를 운용하는 […]

[2018/07/02] Python 2. 계산기

5 정수 5.0 실수 연사자의 속성으로 인해 이렇게 됨 /로 하면 결과를 실수로 반환한다 int float 컴퓨터에는 무한대가 없다 예를 들어 32bit라면 2^32-1이 정수 한계 이보다 큰수나 작은 수를 표현할 수 없음 실수로 계산할 때는 오차가 발생할 수 있음 문자열끼리의 […]

[2018/07/02] Python 1. Software 개론

컴퓨터 제일 처음 만든 사람은 계산기 대신에 만들었을 것. 계산이 조올라 빠름 컴퓨터 SW HW 구분하는 기준은 실제로 존재하느냐 SW: 하드웨어에게 명령들의 모임 SW도 시스템 소프트웨어와 응용 소프트웨어 시스템 소프트웨어: 하드웨어를 잘 이용하기 위해 사용하는 SW 응용 소프트웨어: 특적 목적을 […]