-
플레이데이터 데이터 엔지니어링 31기 5주차 회고데이터 분석 공부/회고 2024. 5. 6. 22:58728x90
1) 전반적인 느낀 점 (일주일 동안 한 일)
- 자료구조
ㄴ선형 자료구조 : Linked List 를 중점적으로 배웠다. 직접 코드를 짜면서 어떻게 실행되는지 알게 되었다.
그 외 스택, 큐가 선형 자료구조에 속한다.
ㄴ비선형 자료구조 : 트리, 그래프가 이에 속한다. Decision Tree 알고리즘과 연결되는 이진 트리 구조에 대해 배웠다.
- 예측 클래스
예측 클래스는 TN / FP / FN / TP 네 영역으로 구성된다.
정확도 = 정밀도 / 재현도 라는 두 관점으로 나누어 볼 수 있음을 배웠다.
둘 중 어떤 관점에서 볼 것인지를 염두에 두어야 하고,
이에 따라 Precision Recall Curve, F1 스코어, ROC AUC 값 등 여러 지표를 확인할 수 있다.
- 머신러닝 모델 전처리 ~ 학습
교차 검증, 하이퍼 파라미터 튜닝,
앙상블 모델의 유형과 알고리즘에 대해 배웠다.
관련해서는 복습해서 별도의 글로 정리해 두어야지!
2) 좋았던 점 & 아쉬운 점
5/6 새벽 5시에 데이콘 프로젝트 제출을 마쳤다!
수없이 코드를 엎는 과정 속에서도 포기하지 않고 결국 제출을 마친 우리 팀 너무 대단해...!
KPI 선정하는 데에 있어서 좀 더 심플하게 생각했으면 쉬웠을 것 같은데,
어렵고 복잡한 길을 가느라 더 고생한 것 같다.
그렇지만 이번 아니면 못해봤을 경험 같기도 하고
내가 생각해 볼 수 없는 쪽으로 문제를 풀어나가본 귀한 경험이 되었다.
SQL
- DB 연결이나 쿼리 쓰는 것에 많이 익숙해졌다.
- 그렇지만 서브쿼리를 여러 번 써야 하는 경우나,
임시테이블이나 뷰를 만들어 놓고 필요한 정보를 계속 붙여가는 게
파이썬 판다스에 비해 아직은 좀 복잡하게 느껴진다.
태블로
- 태블로를 제대로 사용해본 것은 이번이 처음인데,
EDA 단계에서 코드 없이 원하는 정보를 쉽게 볼 수 있다는 점이 매우 매력적이었다.
판다스에서 시각화를 꽤 볼만하게 만드려면 꽤 긴 코드가 필요하기에...
간단하게 또 심미적으로도 예쁘게 볼 수 있는 태블로는 생각 이상으로 유용했다!
- 그렇지만 프로젝트 후반부에 우리가 정한 KPI를 처음보는 사람들에게도 쉽게 이해시킬 수 있게
구조를 짜고 시각화하는 게 어렵다는 걸 많이 느꼈다.
- 아래는 팀원 ㅈㅇ님과 함께 만든 태블로 대시보드 결과물이다.
dacon_final_dashborad_blue
dacon_final_dashborad_blue
public.tableau.com
3) 개선할 점
SQL
- SQL 쿼리 테스트 연습하는 사이트에서 문제 풀어보면서 복잡한 로직에 익숙해져봐야지.
태블로
- 프로젝트는 끝났지만 이번 대회 데이터셋으로 좀 더 제대로 된 대시보드를 만들어봐야겠다.
ㄴ툴바 선택으로 대시보드 시트 옮겨가기
ㄴ대시보드 음영 처리 등 디자인 요소 넣기
4) 다음 주 계획
- 다음 주엔 진짜진짜로 수업 복습도 매일 하고 가기 ... :)
- SQL 쿼리 테스트 하루 1문제 풀기
'데이터 분석 공부 > 회고' 카테고리의 다른 글
플레이데이터 데이터 엔지니어링 31기 10주차 회고 (0) 2024.06.11 플레이데이터 데이터 엔지니어링 31기 7주차 회고 (0) 2024.05.20 플레이데이터 데이터 엔지니어링 31기 6주차 회고 (0) 2024.05.12 플레이데이터 데이터 엔지니어링 31기 4주차 회고 (0) 2024.04.28 플레이데이터 데이터 엔지니어링 31기 2주차 회고 (0) 2024.04.14