[2018/07/20] 연관규칙 및 빈발항목집합 분석

데이터베이스 쪽에서 나온 기술들 복잡한 수학이나 통계 이론 없이 DB 기술로! 빈발패턴을 먼저 구해야 연관규칙이 구해진다. 빈발항목집합 탐사 장바구니 분석: 여러 항목들이 동시에 또는 근접한 시점에 발생하는 데이터에 대해 적용 가능 빈발패턴 transaction: 한번에 같이 구매한 제품들 i.e. {빵, 버터} […]

[2018/07/19] 결정트리와 교차검증

100개를 분류한다고 해보자 A: 50, B: 50 특정 노드에 특정 샘플(A 30개 B 0개)만 있으면 불순도 0 불순도가 적은 방향으로 트리를 확대시켜 나가자 가장 기본적인 알고리즘이 CART와 ID3 ID3 조건을 선택하는 게 아니라 컬럼을 선택한다. 예를 들어 x2라는 특성을 범위를 […]

[2018/07/19] 머신러닝 2. 딥러닝 프레임워크, 텐서플로우, DNN 이해

다양한 종류 1. Tensorflow -스칼라나 Go는 인공지능에서 많이 쓰일 것이다. 2. Theano 3. Keras -tensorflow나 Theano는 저레벨 -인공신경망 구축 위한 절차들을 하나하나 코딩해줘야 한다. 4. Caffe 5. Torch -PyTorch라는 파이썬 기반 프레임워크로 만들어짐. -쉽게 접목 가능 6. Deeplearning4j -JVM만 설치돼있으면 […]

[2018/07/18] 머신러닝 1. 머신러닝 개요

인공지능 컴퓨터를 사람처럼 만들고자 하는 기술의 총칭 머신러닝 데이터를 주면 데이터를 기반으로 학습해서 로직을 자동으로 만들어내는 기술 다양한 알고리즘이 있음 딥러닝 인공신경망 방식으로 컴퓨터 스스로 해결하는 방법 신경망을 컴퓨터적으로 구현한 것. 나온 지 오래된 기술임. 머신러닝 중에서도 결정트리만 담당 인공지능 […]

[2018/07/16] 정규표현식

\d – 숫자 \w – 영문자 (, 숫자) 모든 문자 [a-z] 영문자 {} 연속된 패턴 \d{3} 연속된 숫자 3개 \d{1,3} 숫자가 1이나 2이나 3개 연속으로 나오는 패턴 + 한개 이상이 연속패턴 == {1,무한대} * 0개 이상의 연속 . 모든 음절 […]

[2018/07/11] 데이터전처리 2. 데이터 정제

결측값 파이썬에서는 NaN이라고 나옴 원측데이터와 가장 닮아있는 데이터를 넣을 수 있도록 한다. 5번이 4번보다 조금 더 고급적인 전처리 방법 값의 추정치를 넣을 수도 있다. 2.1. 결측값의 처리 전역상수를 사용하는 방법: 미리 정해진 수를     집어넣은 것 동일 너비 방식: 0 […]