분류 전체보기 (35) 썸네일형 리스트형 뒤늦은 코딩테스트 준비 상반기 취업공채가 어느정도 마무리 되어가며 뒤늦은 코딩테스트를 시작하게 되었다. 감사하게도 2곳의 대기업에서 면접을 볼 수 있었고 중견기업에서 면접을 보며 너무나 열심히 사는 사람들이 많구나 느꼈다. 물론 작년에 상반기에는 나도 포스코 AI. 빅데이터 아카데미를 수료하고 후반기에는 빅리더 인턴십을 수료하고 수자원공사, 국립공원공단 협력 프로젝트에 참여하여 직무 관련하여 다양한 경험을 쌓았고 충분히 취업할 수 있다고 생각했다. 허지만 같이 면접 보는 사람들은 모두 석사 아니면 인턴 3회 이상... 모두 나보다 뛰어난 스펙을 갖고 있어서 면접 자기소개를 듣고 난 후에는 내가 어떻게 여기까지 왔지? 라는 생각까지 했다 그리고 대기업, 중견기업 면접까지 갈 수 있었던 이유는 코딩테스트가 없었던.. SQL 코딩테스트 에코마케팅 서류에 합격되었는데 SQL 테스트가 있어 급하게 공부하기! (순서, 두서없음) LIKE쿼리문 WHERE절에 주로 사용되며 부분적으로 일치하는 칼럼을 찾을때 사용됩니다.SELECT * FROM [테이블명] WHERE [컬럼명] LIKE [조건] # A로 시작하는 문자 찾기SELECT 컬럼명 FROM 테이블명 WHERE 컬럼명 LIKE 'A%'# A로 끝나는 문자 찾기SELECT 컬럼명 FROM 테이블명 WHERE 컬럼명 LIKE '%A'# A로 포함하는 문자 찾기SELECT 컬럼명 FROM 테이블명 WHERE 컬럼명 LIKE '%A%'# A로 시작하는 두글자 문자 찾기SELECT 컬럼명 FROM 테이블명 WHERE 컬럼명 LIKE 'A_'# 첫번째 문자가 A 가 .. Scaling 방법 선택하기 Scaling 종류 1. Standardization (표준화) 개념 : 데이터 평균을 0, 분산을 1로 만들는 scaling 코드 : 사이킷런의 StandardScaler 를 사용 특징 : 이상치에 영향을 받으며 기존 분포를 정규분포로 변환시킨다. 데이터 분포가 정규분포와 거리가 멀거나 이상치가 많은 경우 기존 데이터의 특징을 잃을 수 있다. 2. Normalization, Min-Max Scaling (정규화, 최소-최대) 개념 : 데이터 값을 0 ~ 1 사이로 변환하여 상대적 범위를 공통 척도로 통일 (ex. 키 1cm, 나이 1살 범위통일) 코드 : 사이킷런의 MinMaxScaler 를 사용 특징 : 기존 분포를 유지하여 분포를 그대로 유지하고 3. Robust Scaling (로버스트) 개념 :.. 8. 고객 Scoring Model, 추천 시스템 알고리즘(Content-based filtering, Collaborative filtering) 고객 Data 기반의 예측 Scoring Model 고객을 선별하여 고객에게 어떤 제품을 matching해서 상품을 추천하여 구매로 연결 시키는 모델 RFM Scoring (고객 분석) RFM Scoring은 고객의 가치를 분석하기 위한 기법으로 고객의 최근성(Recency), 구매빈도(Frequency), 구매금액(Monetary) 지표를 바탕으로 고객이 기업에 가져다 주는 수익에 얼마나 기여하는지를 판단할 수 있습니다. 추천시스템 1. Content-based filtering (컨텐츠 기반) 콘텐츠 기반 필터링 방식은 사용자가 특정 아이템을 선호하는 경우 그 아이템과 비슷한 콘텐츠를 가진 다른 아이템을 추천해주는 방식이다. Meta 정보가 풍부하거나 정리, DB 정제가 되어있다면 해당 방법 추천한다.. 6 - 4. Transformer(Self-Attention, Encoding, Decoding) Transformer Seq2Seq with Attention 발전하여 Attention module가 Encoder, Decoder 역할 수행 RNN, CNN 모델 없이 온전히 attention module 만으로 sequence 입력 및 출력 처리 Encoding 좌측 block이 encoding 역할을 하고 n번에 걸쳐 block을 쌓아 전 layer에서 encoding 된 hidden state vector를 입력 vector로 받아들여 두번째 block이 진행된다. 하지만 현재 연산 단계에서 문장의 순서를 고려하지 않아도 encoding에 영향이 가지 않는 단점을 극복하고자 단어가 몇번째 순서인지 정보를 주입하는 positional encoding을 사용한다. Add : skip connecti.. 6 - 3. Seq2Seq with Attention for Natural Language (RNN, LSTM, Seq2seq, Attention) RNN (Recurrent Neural Networks) sequence data에 특화된 딥러닝 모델 가중치는 고정한 상태로 h를 다시 입력으로 넣어 반복하는 구조이다 RNN 에서 가장 적합한 활성화함수 tanh 를 사용하여 결과 vector를 만든다 Vanila RNN 모델별 사용예시 one to many : image captioning many to one : sentiment classification many to many : machine translation, video classification Vanila RNN 을 사용한다면 학습 도중에 gradient vanishing 되거나 gradient 가 폭발적으로 증가하여 학습이 불안정한 문제점이 있다. 그래서 기본 구조는 동일하게 유지하되.. 6 - 2. Convoltional Neutral Netwrok and Image Classification (CNN, Pooling, Convolution Filter) CNN 특정 class에 존재하는 작은 특정 패턴들을 정의하고 그 패턴들이 주어진 이미지 상에 있는지 검출, 인식 예시를 보며 이해해보자 ex) 고양이 귀, 눈은 일관되게 나타나게 되어 자세,색깔,배경 등 모든 요소를 규정하지 않고 일관되게 나타나는 부분 특징들을 bottom up 방식으로 검출, 정보를 조합하여 최종적으로 고양이라고 인식 X와 삐뚤어진 X를 비교했을때, 머신러닝에서는 오차의 개수가 많아 같다고 보기 어렵지만 ConvNet에서는 부분 요소들에 일관된 패턴이 존재하여 같다고 판단 Convolution 연산 특정 위치에 오버랩 시켰을떄 특정 패턴과의 매칭 정도를 정량적으로 정의. 기존 값에 convolution filter를 곱하여 매칭을 정도를 나타내는 결과 이미지를 activation m.. 6 - 1. Introduction to Deep Neural Networks (Deep Learning, Forward Propagation, Back Propagation, Perceptron) Perceptron Neural Network 모델 구성하는 기본 알고리즘 입력값과 가중치 연산을 통해 가중합을 만들어내고 활성함수를 거쳐 최종 출력결과 전달한다 가중합의 값이 0보다 크다면 1, 0보다 작다면 0이 된다 Multi - Layer Perceptron ( Fully Connected Neural Network ) 선형모델로는 분류하기 힘든 복잡한 문제, XOR 문제를 Multi - Layer Perceptron 을 통해 해결할 수 있다. 그리고 입력노드와 출력노드 모두와 특정한 가중치 형태로 연결된 network 딥러닝 모델 구조 Forward Propagation input vector 를 column vector로 만들고 뉴런의 가중치를 row vector로 만들어 가중합을 연산, 활성.. 이전 1 2 3 4 5 다음