[2019/06/20] Word Embedding
블로그 바로가기 Word Embedding과 관련하여 한글로 정리된 글 중 가장 퀄리티가 높다 생각된다.
블로그 바로가기 Word Embedding과 관련하여 한글로 정리된 글 중 가장 퀄리티가 높다 생각된다.
딥 러닝 Q 러닝 시험 준비를 위해 머신러닝 및 딥러닝에 관한 내용을 찾던 중 발견했다. 내용이 잘 정리되어 있어 위에 첨부한다.
장애물을 만났다. 카카오톡 자동응답 API를 이용해 만드려고 했는데 2018년 하반기부터 이 기능이 사라지고 대신 카카오의 대체 기술을 써야한다. 이 경우 카카오 측의 승인을 받아야만 개발이 가능하다. 일단 요청은 해놨는데 언제 승인이 될지는 모르겠다. 또한 처음 구상했던 ‘장 시작 전 단체 […]
1. 많이 본 뉴스 크롤링– 연합 인포맥스에서 가장 많이 조회된 뉴스의 제목과 링크를 띄울 수 있게 함– 파이썬을 활용함– 최대한 크롬드라이버를 활용하지 않고 구현하도록 시도 중 2. 파이썬 가상 환경 로컬 설치 3. 장고 프로젝트 생성
주말까지 시간이 좀 남아서 그간 해보고 싶던 프로젝트를 시작해 보고자 한다. 카카오톡을 통해 전날의 마켓 정보를 받을 수 있는 챗봇이 바로 그것이다. 기술 자체는 구현이 불가할 정도로 어렵지 않을 것 같지만 생각보다 필요한 작업이 많아 보인다. 지금 당장 생각나는 것만 […]
데이터 마이닝 분석 방법 -그 중 하나가 군집 분석 -같은 그룹 내의 객체들은 유사한 객체들로, 서로 다른 그룹의 객체와는 다른 특성을 가지도록 객체들의 그룹을 찾는 방법 -비지도적 학습적 분류기법 대부분의 방법은 지도적 학습 –>투표 결과를 바탕으로 나누는 것. 답을 알고있는 […]
iris의 경우 CNN을 사용하면 오히려 더 떨어짐 CNN의 경우 영상 처리에 많이 쓰인다 일반적인 마케팅이나 금융 데이터 분류 및 예측에는 맞지 않는다. 컨볼루션 신경망 1. 이미지에 적용되는 필터는 랜덤하게 선택된다. 이미지 하나가 네 개의 퍼셉트론으로 변환된다. 필터(W)를 거치고 활성화 함수 […]
다중공선성의 문제 (multicollinearity) -독립변수들 간 강한 상관관계가 나타나는 상태 -다중공선성을 확인하는 방법: 분산팽창계수 VIF = (1-R^2)^-1 -VIF는 점점 커질수록 안 좋다. -다중공선성의 해결방안: 주성분회귀분석, 릿지 회귀분석 -주성분회귀분석: 독립변수들 사이에서 새로운 변수를 만들어서 얘네들을 바탕으로 회귀분석을 하기. 이 새로운 변수들은 서로 […]
값이 어떤 분포를 가지냐에 따라 다른 활성화함수를 사용해야 한다. 첫번째 은닉계층의 W, b 여기서 360은 두번째 은닉계층에 입력되어야 할 값을 360개의 클래스로 하자는 의미. 다음 은닉계층의 뉴런의 수를 360개로 한 것. 출력 10개의 클래스 은닉층에서는 W, b에 0 대신 다른 […]
관측치 (observation) 독립변수 종속변수 데이터의 종류 이산형 (범주형) 자료 -명목형 자료 -순위형 자료: 순서가 있다 연속형 자료 -구간형 자료 -비율형 자료 독립 변수 범주형 연속형 종속 변수 범주형 분할표 분석 로지스틱 연속형 분산 분석 선형회귀 회귀분석 단순회귀분석 -한개의 독립변수, 종속변수 […]