[2019/05/28] 개발 2일차

장애물을 만났다. 카카오톡 자동응답 API를 이용해 만드려고 했는데 2018년 하반기부터 이 기능이 사라지고 대신 카카오의 대체 기술을 써야한다. 이 경우 카카오 측의 승인을 받아야만 개발이 가능하다. 일단 요청은 해놨는데 언제 승인이 될지는 모르겠다. 또한 처음 구상했던 ‘장 시작 전 단체 […]

[2018/07/26] 군집분석

데이터 마이닝 분석 방법 -그 중 하나가 군집 분석 -같은 그룹 내의 객체들은 유사한 객체들로, 서로 다른 그룹의 객체와는 다른 특성을 가지도록 객체들의 그룹을 찾는 방법 -비지도적 학습적 분류기법 대부분의 방법은 지도적 학습 –>투표 결과를 바탕으로 나누는 것. 답을 알고있는 […]

[2018/07/26] 머신러닝 6. CNN

iris의 경우 CNN을 사용하면 오히려 더 떨어짐 CNN의 경우 영상 처리에 많이 쓰인다 일반적인 마케팅이나 금융 데이터 분류 및 예측에는 맞지 않는다. 컨볼루션 신경망 1. 이미지에 적용되는 필터는 랜덤하게 선택된다. 이미지 하나가 네 개의 퍼셉트론으로 변환된다. 필터(W)를 거치고 활성화 함수 […]

[2018/07/25] 다중 회귀분석 & 로지스틱 회귀분석

다중공선성의 문제 (multicollinearity) -독립변수들 간 강한 상관관계가 나타나는 상태 -다중공선성을 확인하는 방법: 분산팽창계수 VIF = (1-R^2)^-1 -VIF는 점점 커질수록 안 좋다. -다중공선성의 해결방안: 주성분회귀분석, 릿지 회귀분석 -주성분회귀분석: 독립변수들 사이에서 새로운 변수를 만들어서 얘네들을 바탕으로 회귀분석을 하기. 이 새로운 변수들은 서로 […]

[2018/07/25] 머신러닝 5. 복합 계층 DNN을 이용한 모델링 & CNN

값이 어떤 분포를 가지냐에 따라 다른 활성화함수를 사용해야 한다. 첫번째 은닉계층의 W, b 여기서 360은 두번째 은닉계층에 입력되어야 할 값을 360개의 클래스로 하자는 의미. 다음 은닉계층의 뉴런의 수를 360개로 한 것. 출력 10개의 클래스 은닉층에서는 W, b에 0 대신 다른 […]

[2018/07/24] 회귀분석

관측치 (observation) 독립변수 종속변수 데이터의 종류 이산형 (범주형) 자료 -명목형 자료 -순위형 자료: 순서가 있다 연속형 자료 -구간형 자료 -비율형 자료 독립 변수 범주형 연속형 종속 변수 범주형 분할표 분석 로지스틱 연속형 분산 분석 선형회귀 회귀분석 단순회귀분석 -한개의 독립변수, 종속변수 […]