전체 게시글 108

ValueError : Must pass 2-d Input

ValueError : Must pass 2-d Input 에러 발견 어떤 이유인지 몰라서 파이참으로 디버깅을 하다보니 데이터가 아래와 같은 형태로 들어간 것을 발견. 알고보니 dict의 각 value에 모두 [ ] 가 쳐져 있었고 대괄호 제거하니 원하는 형태 얻을 수 있었음 input을 바꿀 수는 없어서 저렇게 생긴 dict에서 값을 추출하는 코드를 짜고 확인하니 해결!

TypeError: zip argument #1 must support iteration

아래의 tupletest와 같은 tuple에서 dataframe 부분만 분리시키고 싶었다. 여러 검색어(2d tuple, unpacking 등등)를 거쳐 조금 실마리를 찾았다. 구글링을 하면서 zip을 사용하는 법을 배워 처음엔 zip을 이용했었다. 하지만 내 tuple의 원소는 list가 아닌 하나의 값을 가지기 때문에 zip을 적용할 수 없었다. 그래서 TypeError: zip argument #1 must support iteration이라는 에러가 떴다. 두번째 시도, 각각의 값을 분리해보고자 2D array라고 생각하고 아래와 같이 써봤다. 분명 jupyter notebook에서는 잘 나왔는데 실제 코드에 넣고 돌리니까 TypeError: 'bool' object is not subscript..

ValueError : setting an array element with a sequence

Dict to numpy 하는 과정에서 생긴 에러. 먼저 dict 생성해준다. 그 다음, np.array를 이용해 dict의 value들만 가져와 array로 변환하는 과정에서 아래와 같은 에러를 만났다. 무슨 문제일까 싶어서 dict의 값을 모두 2개로 고정한뒤 똑같이 해보니 에러가 사라졌다. 하지만 나는 그렇게 고정한 데이터를 사용하는 것이 아니기 때문에 다른 방법을 고민. dtype을 str이 아닌 object로 바꿔주니 에러가 사라졌다. numpy로 값 쌓고 df로 변경하는 과정

Pandas_profiling

https://www.kaggle.com/jacklizhi/creditcard creditcard how to manage the unbalance dataset www.kaggle.com - Data는 kaggle에서 가져온 creditcard dataset을 이용했다. Pandas에 있는 pandas_profiling이라는 라이브러리 발견 심플 EDA를 해주는 거 같아 굉장히 흥미롭다. 이용하는 방법은 아래와 같다. 데이터 불러와서 그냥 바로 profile_report() 적용하면 저렇게 쭉 뜬다. 엄청 간단하다. 만약 html로 저장하고 싶다면 아래와 같이 하면 된다. 이렇게 나온다!

ValueError: If using all scalar values, you must pass an index

Pandas로 dict 을 dataframe으로 변환하는 과정에서 또 오류를 만났다. (사실 어제 오늘 계속 만났지만 ....) 그래서 orient = 'index'를 추가해 보았더니 위와 같은 오류는 사라지며 key value가 떴다. 알고보니, orient = 'index'는 column을 index 값으로 바꿔주는 것이었다. 어쨌든 해결 방법을 찾는 중이고 패키지 코드 들어가서 확인해 보니 [ ]가 비어있어서 그런 것 같다. pandas 패키지에 에러 부분을 확인해 보았더니 저렇게 나오길래 아래처럼 테스트 해봤다. 내가 반복문에서 dict의 key, value를 가져왔는데 위치를 잘못 잡았는지 어쨌는지... 값이 안 들어간 거 같다. 어쨌든 해결이 어려운 오류는 아니었다!

ValueError : arrays must all be same length

DataFrame을 이용하여 함수를 짜야할 일이 있어, 가지고 있는 dict를 dataframe으로 변환 그 과정에서 발생한 에러이다. 아래는 에러 메세지에 대해 고민을 하다가 눈으로 확인하기 위해 대충 예시로 적어본 것 아래와 같은 상황을 해결하기 위해 지금 여러 위치를 체크하며 dict 값 확인 종 똑같은 (크고 작은) 실수를 방지하기 위해 종종 기록할 예정!

tf.keras.callbacks

내가 필요해서 정리하는 tf.keras의 callback 함수들과 각 설명 1. tf.keras.callbacks.ReduceLROnPlateau 2. tf.keras.callbacks.EarlyStopping 검증 성능이 향상되지 않으면 훈련을 중지합니다. (monitor='val_auc', patience=10, mode='max') 3. tf.keras.callbacks.BaseLogger 4. tf.keras.callbacks.CSVLogger 5. tf.keras.callbacks.Callback 6. tf.keras.callbacks.History 7. tf.keras.LambdaCallback 8. tf.keras.ModelCheckpoint 일정 간격으로 모델의 체크포인트를 저장합니다. (..

PCA(Principal Component Analysis)

PCA: 주성분분석, 차원축소와 변수추출 기법으로 사용되는 기법으로 데이터의 분산을 최대한 보존하면서 서로 직교하는 축을 찾아 고차원 공간의 표본들을 선형 연관성이 없는 저차원 공간으로 변환하는 기법이다. Q. PCA의 주성분이 곧 eigenvalue 라고 봐도 되는가?? 참고 https://darkpgmr.tistory.com/110 [선형대수학 #6] 주성분분석(PCA)의 이해와 활용 주성분 분석, 영어로는 PCA(Principal Component Analysis). 주성분 분석(PCA)은 사람들에게 비교적 널리 알려져 있는 방법으로서, 다른 블로그, 카페 등에 이와 관련된 소개글 또한 굉장히 많다. 그래도 기존에.. darkpgmr.tistory.com https://ratsgo.github.io..

Deep RL based Recommendation with Explicit User-Item Interactions Modeling

논문 제목 : Deep Reinforcement Learning based Recommendation with Explicit User-Item Interactions Modeling 본 게시글은 DNN for YouTube Recommendation논문과 actor-critic에 대한 어느 정도의 이해를 필요로 합니다. Abstract Recommendation system은 collaborative filtering, matrix factorization, logistic regression, factorization machines 등 다양한 방법이 있다. 하지만 위와 같은 방법들은 두 가지 한계가 존재한다. 1) User의 preference가 계속 변하지 않는다고 가정한다. 2) 직전의 rewa..

DDPG(Deep DPG)

논문 제목 : Continuous Control with Deep Reinforcement Learning 논문 저자 : Timothy P.Lillicrap, Jonathan J.Hunt, Alexander Pritzel, Nicolas Heess, Tom Erez, Yuval Tassa, David Silver&Daan Wierstra Abstract - DDPG는 actor-critic, model free, off-policy algorithm이다. - Deterministic policy gradient를 기반으로 한다. - Continuous action space에서만 가능하다. - DDPG is able to find policies whose performance is competitive..