Python 192

[SK캠프] 12주차 WIL 250303_250309 (LLM)

250303 ~ 250309 SK캠프 9기 12주 차 회고 일지 내용금주 주요 성과자연어 처리 핵심 응용보완해야할 점자연어 처리 학습 정리한 주 동안..자연어 딥러닝 응용 - attention자연어 딥러닝 응용 - 신경망 기계번역자연어 딥러닝 응용 - 전이학습LLM 개요KPT Keep수업시간 중 실습으로 이해해보자.​어텐션 매커니즘부터 신경망 기계번역, 전리학습 등 자연어 처리를 집중하여 학습했다. 임베딩의 모델, 트랜스 포머 모델들을 공부. 이번에도 이론적 개념과 실제 적용 실습을 하며 개념에 대해 접근해본다.​ Problem개념과 실제 구현은 다르다.​다양한 고급 개념을 한번에 학습하다보니 각 주제의 깊이 있는 이해가 부족하다. 실제 구현 및 실험을 통한 경험적 학습이 제한적이다. 어렵다 어려워.....

[SK캠프] 11주차 WIL 250224_250302 (자연어 처리)

250224 ~ 250302 SK캠프 9기 11주 차 회고 일지 내용금주 주요 성과자연어 처리를 위한 딥러닝 기술보완해야할 점자연어 처리 요약 정리한 주 동안..자연어 딥러닝 기초 - GRU자연어 딥러닝 기초 - 텍스트 분류자연어 딥러닝 기초 - 언어 모델링자연어 딥러닝 응용 - seq2seqKPT Keep일단 따라가보자.​이론과 실습을 함께하며 개념을 명확히 이해하려고 노력한다. 집에서 복습하면서 요약정리하는게 조금이나마 도움이 되길 바라본다... LLM을 드디어 하고 있다. MLDL보단 개념을 생각하는게 보다 흥미롭긴 하나 어려운건 그대로 인 것 같다 ㅎㅎ... ​ Problem많은 개념들이 머릿속에 입력되지 않았다.​아무래도 짧은 시간에 많은 모델의 개념을 학습하다보니 각 모델의 세부 구현에 대한 ..

파인튜닝을 알아보자.

AI 맞춤형 학습의 핵심 기술   오늘은 파인튜닝(Fine-tuning) 알아보자.오늘의 배움파인튜닝의 개념과 필요성프롬프트 엔지니어링과 파인튜닝의 차이소규모 언어모델(sLLM) 파인튜닝파인튜닝 모델 평가 및 활용 사례1. 파인튜닝(Fine-tuning)  정의: 이미 학습된 대규모 언어 모델(LLM)을 특정 작업이나 데이터셋에 맞춰 재학습시키는 과정한 줄 요약: "범용 AI를 특정 분야의 전문가로 만드는 맞춤형 학습 기술"특징:사전 학습된 모델의 지식을 유지하면서 특정 영역에 최적화도메인 특화된 용어와 맥락 이해 능력 향상특정 작업에 대한 성능과 정확도 개선필요성:일반적인 LLM은 특정 도메인에서 최적의 성능을 내지 못함프롬프트 엔지니어링만으로는 도메인별 깊은 이해가 어려움일관된 형식과 출력 스타일이 ..

Develop/AI 2025.03.16

프롬프트 엔지니어링 - Chain of Thought (CoT) 알아보자.

단계적 사고로 AI의 추론 능력을 강화하다   오늘은 사고 연결 기법(Chain of Thought)에 대해 알아보자.오늘의 배움사고 연결 기법(Chain of Thought)의 개념과 원리CoT의 다양한 유형(Zero-shot, Few-shot)CoT의 실제 응용 분야와 효과1. Chain of Thought(CoT)  정의: LLM이 복잡한 문제를 해결하기 위해 단계적 사고 과정을 명시적으로 전개하도록 설계된 프롬프트 전략한 줄 요약: "한 번에 답하지 말고, 생각하는 과정을 모두 보여줘"라고 AI에게 지시하는 방법특징:단계적 접근: 모델이 한 번에 답을 생성하지 않고, 단계별로 논리를 전개정확성 강화: 사고 과정을 명시해 오류를 줄이고 신뢰도를 높임프롬프트 설계: 명확한 지침으로 모델이 중간 단계를..

Develop/AI 2025.03.16

RAG (검색 증강 생성) 알아보자.

최신 정보 활용을 통한 정확한 응답 생성   오늘은 RAG (검색 증강 생성) 알아보자.오늘의 배움RAG 개념RAG 구조 (Vector DB와 LLM 결합)RAG 성능 최적화 기법1. RAG  정의: RAG구조는 벡터 데이터베이스(Vector DB)와 언어 모델(LLM)을 결합하여, 사용자가 입력한 질문을 바탕으로 검색된 데이터를 활용해 문맥에 맞는 자연어 응답을 생성하는 기술이다.한 줄 요약: RAG는 최신 정보를 활용해 문맥에 맞는 정확한 답을 제공하는 시스템이다.작동 원리벡터화: 텍스트 데이터를 임베딩 벡터로 변환해 Vector DB에 저장유사도 검색: 사용자의 질문을 벡터로 변환해 관련 데이터를 검색응답 생성: 검색된 데이터를 컨텍스트로 사용해 LLM이 자연어 응답 생성특징:최신 정보 활용정확도 ..

Develop/AI 2025.03.15

LangChain을 알아보자.

LLM의 기능 확장   오늘은 프롬프트 엔지니어링 응용 - LangChain 알아보자.오늘의 배움LangChain 개요프롬프트 템플릿Output Parser와 체인에이전트와 도구메모리1. LangChain 정의: LangChain은 LLM의 기능을 확장하고 체계화하여 복잡한 애플리케이션을 구축할 수 있도록 지원하는 프레임워크이다.한 줄 요약: LLM을 효율적으로 활용할 수 있게 해주는 구조화된 프레임워크이다.특징:여러 프롬프트, 도구, 데이터 소스를 체인으로 연결외부 데이터와의 상호작용 지원대화의 문맥 유지필요성: LLM을 활용하기 위한 복잡한 코드 작성과 통합 작업을 간소화한다.장점/단점:장점: 재사용 가능하고 효율적인 구조 제공단점: 초기 설정과 이해가 필요할 수 있음예시: 자동 번역, 문서 요약, ..

Develop/AI 2025.03.15

벡터 데이터베이스를 알아보자.

AI 가능한 패턴 검색 복제하기   오늘은 벡터 데이터베이스 알아보자.오늘의 배움벡터 데이터베이스란? 벡터 DB의 특징 벡터  DB의 유형 및 활용 사례1. 벡터 데이터베이스정의: 벡터 데이터베이스는 벡터 형식으로 저장된 데이터(고차원 임베딩 데이터)를 관리하고, 유사도 기반 검색 및 작업을 최적화하는 데이터베이스이다.한 줄 요약: 고차원 임베딩 데이터를 효율적으로 관리하고 검색하는 시스템이다.특징:벡터 임베딩 저장: 데이터를 벡터로 변환해 저장유사도 검색 최적화: 입력 벡터와 가장 유사한 벡터를 빠르게 검색확장성: 대규모 벡터 데이터를 처리할 수 있는 구조 제공필요성: AI/ML, 자연어 처리(NLP), 이미지 검색 등에서 데이터 효율적 관리를 위해 필요하다.장점/단점:장점: 고차원 데이터 관리 용이,..

Develop/AI 2025.03.15

ollama 사용 설정

ollama 사용 설정   오늘은 ollama 사용 설정 알아보자.오늘의 배움ollama 사용 설정1. A40으로 pod 생성2. apt 업데이트apt updateapt install lshw 3. Ollama 설치(curl -fsSL https://ollama.com/install.sh | sh && ollama serve > ollama.log 2>&1) & 4. 모델 다운로드 또는 실행ollama pull [model name]# ollama pull llama3orollama run [model name]# ollama run llama3  EEVE Korean 10.8B 모델 사용 설정 1. Hugging Face CLI를 설치pip install --user huggingface-hub 2. ..

Develop/AI 2025.03.15

LLM 주요 파라미터 및 적용에 대해 알아보자.

효과적인 활용법   오늘은 0000 알아보자.오늘의 배움LLM 주요 파라미터LLM 활용 방식LLM의 한계 및 해결 방법1. LLM 주요 파라미터정의: LLM의 출력을 조정하는 다양한 설정 값으로, 생성된 응답의 다양성, 창의성, 길이 등을 제어한다.한 줄 요약: 파라미터를 조정하면 원하는 스타일과 품질의 출력을 얻을 수 있다.특징:텍스트 생성 과정에 직접적인 영향을 준다.특정한 값을 설정하면 결과의 일관성을 높이거나 창의성을 극대화할 수 있다.필요성: 모델의 활용도를 극대화하고, 사용 목적에 맞는 결과를 얻기 위해 필요하다.장점/단점:장점: 원하는 스타일에 맞춘 조정 가능단점: 적절한 값을 찾는 데 실험이 필요예시:Temperature 값이 낮으면 정확하고 일관된 응답을, 높이면 창의적인 응답을 얻을 수..

Develop/AI 2025.03.15

LLM 사용에 대해 알아보자.

효과적인 프롬프트 설계와 API 활용    오늘은 LLM(Large Language Model)의 사용 알아보자.오늘의 배움프롬프트 설계 기법과 중요성LLM의 다양한 활용 사례API를 통한 LLM 호출 방식1. LLM이란?정의: LLM(Large Language Model)은 대량의 텍스트 데이터를 학습하여 다양한 자연어 처리(NLP) 작업을 수행할 수 있는 AI 모델이다.한 줄 요약: 인간과 자연스럽게 대화하거나 텍스트 생성, 요약, 번역 등을 수행하는 대규모 인공지능 모델.특징:방대한 학습 데이터로 훈련됨다양한 자연어 작업 수행 가능입력된 프롬프트에 따라 출력이 달라짐필요성: 고객 응대, 콘텐츠 생성, 번역, 법률 검토 등 다양한 분야에서 자동화 및 생산성 향상이 가능함.장점:다양한 텍스트 작업 자동..

Develop/AI 2025.03.15
728x90