Python 192

[SK캠프 9기] 2번째_무빙_250118~21 (EDA 미니프젝 끝)

[프로젝트 간략 소개]- 프로젝트 명: 무빙- 프로젝트 기간: 25.01.27 ~ 25.02.03- 문제 정의:영화 흥행 예측 및 투자 전략 수립 지원 필요- 역할 및 기여:기획, 데이터 수집·분석, LGBMClassifier 모델 개발 및 성능 개선 주도, Notion/Discord기반 팀 소통 및 이슈 관리 담당, GIt 기반 코드 공유·리뷰 품질 관리, 전체 팀 리드- 성과:약 83% 정확도 달성, 데이터 기반 투자 전략 가이드라인 및 의사결정 효율성 높임, 코드 관리 프로세스 강화- 깃허브: https://github.com/yujitaeng/eda_2teamhttps://github.com/yujitaeng/ml_2team [무빙] - Sprint 2 회고록기간: 2025.01.15 - 202..

SKN_09_Project 2025.01.22

[SK캠프 9기] 2번째_무빙_250115~250117 (벌써, 미니프로젝트)

[프로젝트 간략 소개]- 프로젝트 명: 무빙- 프로젝트 기간: 25.01.27 ~ 25.02.03- 문제 정의:영화 흥행 예측 및 투자 전략 수립 지원 필요- 역할 및 기여:기획, 데이터 수집·분석, LGBMClassifier 모델 개발 및 성능 개선 주도, Notion/Discord기반 팀 소통 및 이슈 관리 담당, GIt 기반 코드 공유·리뷰 품질 관리, 전체 팀 리드- 성과:약 83% 정확도 달성, 데이터 기반 투자 전략 가이드라인 및 의사결정 효율성 높임, 코드 관리 프로세스 강화- 깃허브: https://github.com/yujitaeng/eda_2teamhttps://github.com/yujitaeng/ml_2team [무빙] - Sprint 1 회고록기간: 2025.01.15 - 202..

SKN_09_Project 2025.01.21

앙상블 학습 및 랜덤 포레스트를 알아보자.

여러 모델의 협력 학습   오늘은 앙상블 학습 및 랜덤 포레스트에 대해 알아보자.오늘의 배움앙상블 학습의 기본 개념투표 기반 분류기와 배깅/페이스팅랜덤 포레스트와 부스팅 알고리즘1. 앙상블 학습 및 랜덤 포레스트 앙상블 학습이란? 여러 개의 모델(약한 학습기)을 결합하여 하나의 강력한 모델을 만드는 방법-> 여러 명의 전문가가 모여 의견을 모으는 것처럼, 다양한 모델의 예측을 결합하여 더 나은 결과를 도출하는 방법 📚 실제 예시로 이해하기- 의사 진단: 여러 의사의 의견을 종합하여 최종 진단을 내리는 것 - 투자 결정: 다양한 전문가의 의견을 종합하여 투자 결정을 하는 것- 주식 가격 예측: 여러 예측 모델의 결과를 종합하여 최종 예측- 질병 진단: 다양한 검사 결과를 종합하여 진단 2. 핵심 개념 정..

Develop/ML·DL 2025.01.21

서포트 벡터 머신(SVM)을 알아보자.

땅따먹기 같이 생긴 서포트 벡터 머신.   오늘은 서포트 벡터 머신(SVM)을 알아보자.오늘의 배움서포트 벡터 머신(SVM) 설명 및 특징선형, 비선형 분류SVR(SVM 회귀) 및 커널1. SVM 이론서포트 벡터 머신(SVM)이란?정의: 데이터를 가장 잘 구분하는 경계선(초평면)을 찾는 머신러닝 알고리즘핵심 개념 한 줄 설명: " 마치 운동장에 그려진 선처럼 데이터를 구분하는 경계선을 찾는 알고리즘 "SVM은 결정 경계(Decision Boundary) - 클래스 간 거리가 가장 먼 경계를 찾으면 -> 최적의 분리를 달성할 수 있음  📚 실제 예시로 이해하기1. 운동장 라인 그리기- 상황: 축구장에서 두 팀의 진영을 나누는 중앙선 그리기 - SVM 관점:   * 중앙선 = 초평면   * 양 팀 선수들 ..

Develop/ML·DL 2025.01.21

[SK캠프] 34일차 TIL 250121(queue, collections)

Intro프로젝트 진행 중 마주한 문제 상황과 이를 해결한 과정을 상세히 기록하고, 향후 동일한 문제가 발생할 경우 신속하게 해결할 수 있도록 트러블슈팅을 체계적으로 정리하려고 합니다.과정은 크게 문제 상황 발생 / 원인 추론 / 해결 방안 / 결과 확인 순으로 트러블 슈팅을 정리문제 상황 발생Q) 큐 회전큐에 1부터 N까지의 숫자가 들어있다 큐를 회전 시킨다. 회전 : 큐의 첫번째 요소를 맨 뒤로 보낸다. 첫번째 줄에 큐의 크기 N, 회전 횟수 K 입력한다. K번 회전 후의 큐 출력# 입력5 3# 출력4 5 1 2 3 A) 문제풀이 -> 오류from collections import dequeimport sysinput = sys.stdin.readlineN, K = map(int, input().sp..

[SK캠프] 33일차 TIL 250120 (스택)

Intro프로젝트 진행 중 마주한 문제 상황과 이를 해결한 과정을 상세히 기록하고, 향후 동일한 문제가 발생할 경우 신속하게 해결할 수 있도록 트러블슈팅을 체계적으로 정리하려고 합니다.과정은 크게 문제 상황 발생 / 원인 추론 / 해결 방안 / 결과 확인 순으로 트러블 슈팅을 정리문제 상황 발생Q)최소 스택직접 스택의 메소드를 구현해보자 하나의 클래스에 push,pop,top,get_min을 구현해보자.ms = MinStack()ms.push(5)ms.push(3)ms.push(7)print(ms.get_min()) # 3ms.pop()print(ms.get_min()) # 3ms.pop()print(ms.get_min()) # 5 A) 문제풀이 -> 오답class MinStack: def _..

결정 트리를 알아보자.

스무고개와 비슷한 결정 트리.   오늘은 머신러닝 모델 선정, 결정트리에 대해 알아보자.오늘의 배움결정트리 구성 요소중요 알고리즘 개념과적합 방지 기법 1. 결정 트리 구성 요소 결정 트리(Decision Tree)는 지도 학습 알고리즘으로, 데이터를 조건에 따라 분할하여 예측하는 데 사용된다.-> 결정 트리는 쉽게 말해서 '스무고개' 게임과 비슷하다. 내가 이해한 결정 트리의 핵심은 "조건에 따라 예측하는 지도 학습 알고리즘"이라는 것이다. 트리의 구성 요소 루트 노드 : 맨 위의 시작점 규칙 노드 : 조건이나 어떠한 규칙에 의해서 분할하는 것리프 노드 : 최종 결정값 (더이상 조건에 맞춰서 규칙 노드를 적용할 수 없는, 더이상 쪼갤 수 없는 것. 맨 마지막에 남는 것은 항상 리프노드)결정 트리 특징해..

Develop/ML·DL 2025.01.21

분류와 로지스틱 회귀를 알아보자.

비슷하지만, 점점 어려워지고 많아진다.   오늘은 분류와 로지스틱 회귀를 알아보자.오늘의 배움분류의 기본 개념 이해하기주요 분류 알고리즘 파악하기로지스틱 회귀의 원리 및 적용 이해하기모델 성능 측정 방법 익히기1. 분류분류(Classification)는 주어진 데이터를 특정 클래스(또는 레이블)로 나누는 머신러닝의 대표적인 지도 학습 문제 유형이다.분류의 특징출력 값이 연속적인 숫자가 아니라, 유한한 클래스 값으로 제한된다.학습 데이터에 각 데이터 포인트의 정답 레이블이 포함되어 있어야 한다.분류 문제의 유형이진 분류(Binary Classification)데이터가 두 개의 클래스 중 하나에 속한다.예: 이메일 분류(스팸/비스팸), 암 진단(양성/음성) 등다중 분류(Multi-class Classific..

Develop/ML·DL 2025.01.20

[SK캠프] 20일차 TIL 250107 (streamlit과 sql 연동 오류)

Intro프로젝트 진행 중 마주한 문제 상황과 이를 해결한 과정을 상세히 기록하고, 향후 동일한 문제가 발생할 경우 신속하게 해결할 수 있도록 트러블슈팅을 체계적으로 정리하려고 합니다.과정은 크게 문제 상황 발생 / 원인 추론 / 해결 방안 / 결과 확인 순으로 트러블 슈팅을 정리문제 상황 발생아까까지만 해도 잘되던 streamlit에 sql연동이 갑자기 오류메세지와 함께 되지 않는다. 원인 추론여러번의 중첩이 발생되면서 생긴 오류인 듯 하다.해결방안import로 설치했던 streamlit과 sql을 삭제하고 다시 설치해본다.그것도 되지 않는다면, streamlit 공식문서에 나와있는 방법으로 해결을 한다.https://docs.streamlit.io/develop/tutorials/databases/m..

[SK캠프] 28일차 TIL 250115 (최근접 이웃 분류 모델 훈련/평가)

Intro프로젝트 진행 중 마주한 문제 상황과 이를 해결한 과정을 상세히 기록하고, 향후 동일한 문제가 발생할 경우 신속하게 해결할 수 있도록 트러블슈팅을 체계적으로 정리하려고 합니다.과정은 크게 문제 상황 발생 / 원인 추론 / 해결 방안 / 결과 확인 순으로 트러블 슈팅을 정리문제 상황 발생iris를 load 받아, 최근접 이웃 분류 모델 훈련/평가 해보기iris_data = load_iris()iris_data.keys()# 데이터 전처리 -> 내 풀이 (라벨데이터에서 오류...)# 1. 입력-라벨 데이터train_input = iris_data.feature_namestrain_label = iris_data.target_names# 2. 훈련-테스트 데이터train_input, test_inpu..

728x90