Develop/AI 37

자연어 이미지 멀티모달 - 이미지 생성, Image Captioning 알아보자.

이미지와 언어의 경계를 허물다   오늘은 자연어 이미지 멀티모달 - 이미지 생성, Image Captioning 알아보자.오늘의 배움멀티모달 학습의 기본 개념과 원리이미지 캡셔닝(Image Captioning)의 작동 방식텍스트-이미지 생성 기술과 대표 모델들01. 자연어-이미지 멀티모달 정의: 텍스트와 이미지라는 서로 다른 형태(모달리티)의 데이터를 함께 처리하고 이해하는 AI 학습 방법한 줄 요약: "보는 것과 읽는 것을 동시에 이해하고 연결하는 AI의 능력"특징:단일 모달리티보다 풍부한 정보 처리 가능상호보완적 학습 효과인간의 다감각적 인지 능력에 더 가까운 접근필요성:실제 세계의 정보는 대부분 여러 형태로 존재이미지만으로 설명하기 어려운 맥락 정보 보완텍스트만으로 표현하기 어려운 시각적 요소 보완..

Develop/AI 2025.04.10

이미지 딥러닝 응용 - Style Transfer Learning, GAN 알아보자.

창의성의 새로운 지평   오늘은 Style Transfer와 GAN 알아보자.오늘의 배움이미지 딥러닝 기술Style Transfer 학습GAN(생성적 적대 신경망) 이해1. Style Transfer  정의: 한 이미지의 콘텐츠와 다른 이미지의 스타일을 결합하여 새로운 이미지를 생성하는 딥러닝 기법한 줄 요약: 사진을 예술 작품으로 변환하는 AI의 마법 같은 기술특징:콘텐츠와 스타일 분리CNN 기반 Feature Map 활용손실 함수를 통한 이미지 생성필요성:예술적 표현의 확장창의적 디자인 지원시각적 경험의 혁신장점:빠른 이미지 스타일 변환다양한 예술적 표현고품질 이미지 생성단점:고성능 컴퓨팅 리소스 필요계산 시간 긴 문제완벽한 스타일 전이의 어려움예시:셀카를 고흐, 모네 스타일로 변환풍경 사진을 수채화..

Develop/AI 2025.03.25

합성곱(CNN) 신경망 주요 모델 알아보자.

합성곱(CNN) 신경망 주요 모델   오늘은 합성곱(CNN) 신경망 주요 모델 알아보자.오늘의 배움LeNetAlexNetVGGNet모델 비교와 선택 기준ResNet현대 CNN 모델1. 주요 CNN 모델1-1. LeNetLeNet-5의 구조입력층: 32x32 크기의 흑백 이미지합성곱 층 1:필터 수: 6개필터 크기: 5x5활성화 함수: tanh서브샘플링(풀링) 층 1:방식: 평균 풀링크기: 2x2합성곱 층 2:필터 수: 16개필터 크기: 5x5활성화 함수: tanh서브샘플링(풀링) 층 2:방식: 평균 풀링크기: 2x2완전 연결 층 1:뉴런 수: 120개활성화 함수: tanh완전 연결 층 2:뉴런 수: 84개활성화 함수: tanh출력층:뉴런 수: 10개 (클래스 수)활성화 함수: SoftmaxLeNet 구현..

Develop/AI 2025.03.23

합성곱(CNN) 신경망 알아보자.

이미지 인식의 핵심 알고리즘   오늘은 합성곱(CNN) 신경망 알아보자.오늘의 배움CNN의 개념과 구조CNN의 순전파 과정필터 & 특징 맵, 패딩 & 스트라이드, 풀링 레이어(최대, 최소, 평균, 글로벌) 01. 합성곱 신경망 (Convolutional Neural Network, CNN)정의: 합성곱 연산을 사용하여 이미지의 공간적 특징을 추출하고 분석하는 딥러닝 신경망.한 줄 요약: 이미지 처리에서 주변 픽셀과의 가중합을 계산하여 특징을 추출하는 연산 특징:이미지의 지역적 특징을 학습하여 효율적인 패턴 분석 가능층이 깊어질수록 추상적인 특징을 학습할 수 있음완전연결 신경망보다 연산량이 적고 효율적필요성:전통적인 방법보다 더 정밀한 이미지 분석 가능자동으로 유용한 특징을 추출하여 성능 향상장점/단점:장..

Develop/AI 2025.03.22

DPO를 알아보자.

강화 학습을 넘어 더 효율적인 최적화   오늘은 DPO 알아보자.오늘의 배움DPO 개념과 정의RLHF와의 차이점 및 비교DPO 학습 과정 및 실제 적용 사례1. DPO (Direct Preference Optimization)정의: DPO(Direct Preference Optimization)는 보상 모델을 따로 학습할 필요 없이, 사람의 선호 데이터를 직접 최적화하는 방식으로 LLM을 조정하는 학습 방법이다.한 줄 요약: RLHF의 강화 학습 단계를 생략하고, 선호 데이터를 활용해 모델을 직접 최적화하는 방법DPO 학습 과정1단계: 선호 데이터(Preference Data) 수집2단계: 선호 데이터 기반으로 직접 모델 최적화3단계: 보상 모델 없이 최적화된 모델 평가특징:보상 모델 없이도 효과적인 모..

Develop/AI 2025.03.22

RLHF을 알아보자.

사람의 피드백을 활용한 강화 학습   오늘은 RLHF 알아보자.오늘의 배움RLHF 개념과 정의RLHF 학습 과정RLHF와 InstructGPT/ChatGPT의 관계1. RLHF (Reinforcement Learning from Human Feedback) 정의: RLHF(Reinforcement Learning from Human Feedback)는 사람의 피드백을 보상 신호로 활용하여 AI 모델을 최적화하는 강화 학습 기법이다.한 줄 요약: AI 모델이 사람이 선호하는 답변을 학습하도록 강화 학습을 적용하는 기법이다.특징:AI의 출력을 사람이 직접 평가하여 보상 모델을 만든다.강화 학습을 활용해 보상 모델을 최적화한다.모델이 더 자연스럽고 유용한 답변을 생성하도록 유도한다.필요성: 기존 AI 모델은 ..

Develop/AI 2025.03.22

파인튜닝 - PEFT를 알아보자.

PEFT로 AI 모델 효율적으로 학습하기   오늘은 PEFT 알아보자.오늘의 배움파라미터 효율적 미세조정(PEFT) 개념LoRA, Q-LoRA, DoRA 기법Soft Prompts 기법1. PEFT (Parameter Efficient Fine-Tuning) 정의: 모델 전체를 재학습하지 않고, 일부 파라미터만 조정하여 학습 비용을 줄이는 방법한 줄 요약: 대규모 AI 모델을 적은 자원으로 특정 작업에 맞게 효율적으로 조정하는 기술특징:전체 모델 중 일부 파라미터만 업데이트메모리와 계산 비용 대폭 감소기존 모델의 지식 유지하며 새로운 작업 수행 가능필요성:대규모 모델 전체 재학습 시 막대한 자원 소요제한된 하드웨어로 최신 모델 활용 필요다양한 도메인별 맞춤형 모델 구축 요구장점/단점:장점: 학습 비용 절..

Develop/AI 2025.03.22

파인튜닝을 알아보자.

AI 맞춤형 학습의 핵심 기술   오늘은 파인튜닝(Fine-tuning) 알아보자.오늘의 배움파인튜닝의 개념과 필요성프롬프트 엔지니어링과 파인튜닝의 차이소규모 언어모델(sLLM) 파인튜닝파인튜닝 모델 평가 및 활용 사례1. 파인튜닝(Fine-tuning)  정의: 이미 학습된 대규모 언어 모델(LLM)을 특정 작업이나 데이터셋에 맞춰 재학습시키는 과정한 줄 요약: "범용 AI를 특정 분야의 전문가로 만드는 맞춤형 학습 기술"특징:사전 학습된 모델의 지식을 유지하면서 특정 영역에 최적화도메인 특화된 용어와 맥락 이해 능력 향상특정 작업에 대한 성능과 정확도 개선필요성:일반적인 LLM은 특정 도메인에서 최적의 성능을 내지 못함프롬프트 엔지니어링만으로는 도메인별 깊은 이해가 어려움일관된 형식과 출력 스타일이 ..

Develop/AI 2025.03.16

프롬프트 엔지니어링 - Chain of Thought (CoT) 알아보자.

단계적 사고로 AI의 추론 능력을 강화하다   오늘은 사고 연결 기법(Chain of Thought)에 대해 알아보자.오늘의 배움사고 연결 기법(Chain of Thought)의 개념과 원리CoT의 다양한 유형(Zero-shot, Few-shot)CoT의 실제 응용 분야와 효과1. Chain of Thought(CoT)  정의: LLM이 복잡한 문제를 해결하기 위해 단계적 사고 과정을 명시적으로 전개하도록 설계된 프롬프트 전략한 줄 요약: "한 번에 답하지 말고, 생각하는 과정을 모두 보여줘"라고 AI에게 지시하는 방법특징:단계적 접근: 모델이 한 번에 답을 생성하지 않고, 단계별로 논리를 전개정확성 강화: 사고 과정을 명시해 오류를 줄이고 신뢰도를 높임프롬프트 설계: 명확한 지침으로 모델이 중간 단계를..

Develop/AI 2025.03.16

RAG (검색 증강 생성) 알아보자.

최신 정보 활용을 통한 정확한 응답 생성   오늘은 RAG (검색 증강 생성) 알아보자.오늘의 배움RAG 개념RAG 구조 (Vector DB와 LLM 결합)RAG 성능 최적화 기법1. RAG  정의: RAG구조는 벡터 데이터베이스(Vector DB)와 언어 모델(LLM)을 결합하여, 사용자가 입력한 질문을 바탕으로 검색된 데이터를 활용해 문맥에 맞는 자연어 응답을 생성하는 기술이다.한 줄 요약: RAG는 최신 정보를 활용해 문맥에 맞는 정확한 답을 제공하는 시스템이다.작동 원리벡터화: 텍스트 데이터를 임베딩 벡터로 변환해 Vector DB에 저장유사도 검색: 사용자의 질문을 벡터로 변환해 관련 데이터를 검색응답 생성: 검색된 데이터를 컨텍스트로 사용해 LLM이 자연어 응답 생성특징:최신 정보 활용정확도 ..

Develop/AI 2025.03.15
728x90