15주차
15주차에는 이미지 처리에 대하여 학습했다.
기본적인 합성곱신경망(CNN), 이미지 분할(Segmentation), 객체 탐지(Object Detection), AutoEncoder, GAN 등 이미지 처리와 관련하여 다양한 개념들을 학습하였다.
14주차의 자연어처리와는 다르게 각 Note마다 연결되는 부분들이 적어 학습하는데 어려움을 겪었다.
사실 NLP를 학습하는데 많은 에너지를 쏟아 그런지 이미지처리에는 크게 집중하지 못하였다.
NLP와 마찬가지로 코드를 작성하는 시간이 적었고, 개념에 대한 이해도 그렇게 깊지 못하였다.
16주차에 진행될 프로젝트 때문인지 학습량도 적었고 피로감이 더했다.
16주차(프로젝트)
16주차에는 프로젝트를 진행하였다. 이미지처리에는 개념도 제대로 학습못했고, 자신이 없고, 조금 더 관심이 있는
자연어처리를 선택하여 프로젝트를 진행했다.
프로젝트의 주제는 네이버 쇼핑 리뷰 데이터를 이용하여 감성분석을 하는 것이다.
텍스트를 생성하는 챗봇이나 번역 모델이 아니기 때문에 시간내에 완성시킬 수 있을 것이라 판단했다.
하지만 텍스트를 전처리하거나 프로젝트를 진행하는 과정에서 크고 작은 실수들이 있었고, 생각한대로 프로젝트가 진행되지는 못했다.
텍스트 전처리 과정에서 py-hanspell 라이브러리를 사용하여 띄어쓰기와 맞춤범을 교정하였는데 오류가 발생하였고, 오류를 처리하지 못하고 오류가 난 문구를 다른 라이브러리(pykospacing)를 사용하여 처리하는 방식으로 진행하였는데, 어떤 문장이었는지 확인하여, 좀 더 세밀하게 오류를 관찰했어야 하지만 시간이 촉박하다는 핑계로 관찰하지 못한것이 아쉽다.
또한 훈련/테스트 데이터를 먼저 분리하여 전처리를 진행하였는데 이 부분에서 시간을 비효율적으로 쓰게 만들었고,
테스트 데이터가 새롭게 들어온다 즉 우리가 모르는 데이터다라는 그런 기본 가정을 무시한것이 아닌가라는 생각이 들었다.
가장 기본적으로 지켜야했지만 그렇게 하지 못한것이 역시 아쉬움으로 남는다.
또한 kogpt, kobert와 같은 성능이 뛰어난 사전학습 모델을 사용하여 내가 만든 LSTM 모델과 비교해 보는것을 계획하였지만
LSTM모델을 하이퍼파라미터 튜닝하고, 발표자료를 만들다 보니 하지못했다는 핑계를 대본다.
딥러닝에서 가장 문제가 되는 부분인 과적합을 충분히 해결하지 못한 것이 있다.
여러방법을 사용하여 과적합을 해결해 보려고 했지만 만족스럽지 못한 결과를 보였다.
그래도 프로젝트를 통하여 NLP에 관하여 조금 더 이해가 되었고, keras 코드를 작성할 수 있었으니 나름 만족하는 프로젝트이다.
그동안 머리로만 이해했던 개념들을 실제로 코드를 돌려보면서 결과값을 확인해보면서 많이 배울 수 있었고 흐름을 파악할 수 있었다.
하지만 여전히 데이콘, 캐글에서 사용자들이 공유하는 코드들을 완벽하게 이해하기에는 조금 부족해보이지만, NLP와 관련 대회들이 나오면 예전처럼 무시하지 않고, 대회 참여나 코드를 확인할 수 있는 용기는 생긴것 같다.
지금까지 했던 프로젝트 중에서 가장 컴퓨터에 의존했던 프로젝트가 아니었나 싶다.
내가 모든것을 제어할 수 는 없었지만 내가 제어할 수 있는 부분에서는 최선을 다했다.
예전에 생활코딩의 강사님께서 이런말씀을 강의중에 하신적 있다.
지금 모든것을 알려고 하지 않아도 된다. 분명 그것을 알아야할 때가 오게 되는데 그때 마저 학습하면 된다라는 의미의 말이었다.
섹션4에서 그때 그때 모든것을 알려고 했고, 에너지 관리를 못한점이 있다.
생활코딩의 말을 기억하여 조급하지 않게 때를 기다려야겠다
마지막으로 이번 프로젝트가 알아야할 때가 라는 것이 아니었나 싶다. 정말 많이 배우고, 느낄 수 있었던 프로젝트였다.
'부트캠프 회고' 카테고리의 다른 글
코드스테이츠 AIB_13 18주차 회고 (0) | 2022.08.16 |
---|---|
코드스테이츠 AIB_13 17주차 회고 (0) | 2022.08.08 |
코드스테이츠 AIB_13 14주차 회고 (0) | 2022.07.19 |
코드스테이츠 AIB_13 13주차 회고 (0) | 2022.07.09 |
코드스테이츠 AIB_13 11&12주차 회고 (0) | 2022.06.28 |