LLM 정의
LLM(Large Language Model, 대규모 언어 모델)은
방대한 텍스트 데이터를 학습해, 사람의 언어를 이해하고 생성할 수 있는 인공지능 모델
LLM 원리
1.
수많은 책, 웹 문서, 코드 등을 데이터로 학습
2.
단어와 문장의 통계적 패턴을 기억
3.
지금까지 입력된 내용을 바탕으로 다음에 올 단어를 확률적으로 예측
LLM의 한계
•
사실이 아닌 답변(환각, Hallucination)
•
긴 맥락 유지 어려움
•
최신 정보 부족
•
보안/프라이버시 문제
주요 용어
토큰(Token)
•
LLM이 언어를 처리하는 최소 단위
•
보통 한 단어, 혹은 단어 조각 수준
•
예: “프로그래밍” → “프로”, “그래”, “밍” (3개 토큰으로 분리될 수 있음)
프롬프트(Prompt)
•
모델에게 주는 입력 문장
•
질문, 명령, 역할 부여 등 모든 지시를 포함
•
예: “오늘 저녁에 요리할건데, 요리 레시피 하나 알려줘”
시스템 메시지(System Message)
•
대화형 모델에서 모델의 행동/역할을 지정
•
예: “당신은 친절한 상담원입니다.”
컨텍스트(Context)
•
모델이 참고하는 대화·문서의 이전 내용
•
길이가 길수록 더 많은 정보를 기억 가능하지만, 제한이 있음
환각(Hallucination)
•
LLM이 사실과 다른 정보를 생성하는 현상
•
특히 최신 정보, 특정 수치나 날짜에서 발생
멀티모달(Multipmodal)
•
텍스트뿐 아니라 이미지, 음성, 영상을 함께 처리
•
예: GPT-4o Vision, Runway ML
LLM 종류
1.
GPT (OpenAI) - ChatGPT, GPT-4, GPT-4o
2.
Claude (Anthropic) - 대화와 안전성 중심
3.
Gemini (Google) - 검색, 멀티모달 강점
4.
LLaMA (Meta) - 오픈소스 기반, 연구와 확장에 유리
5.
기타 오픈소스 모델 - Mistral, Deep Seek 등
LLM 활용 서비스
위의 LLM (기반 모델)을 갖고서 활용하여 만든 실제 애플리케이션 서비스
챗봇
•
고객 문의를 실시간으로 처리하고, FAQ를 자동 응답
•
예시 :
◦
ChatGPT : 웹사이트 고객 문의 챗봇
◦
Zendesk AI : 기업 고객 지원 자동화
◦
Kakao i Chatbot : 국내 고객 상담용 AI 챗봇
문서 요약
•
긴 문서 내용을 핵심만 추출, 시간 절약
•
예시 :
◦
DeepL : AI 기반 고품질 번역
◦
Google Translate + GPT 보정 : 의미와 톤까지 자연스럽게 번역
◦
Microsoft Translator : 실시간 다국어 번역
코딩 도우미
•
코드 작성, 오류 수정, 함수 추천
•
예시 :
◦
GitHub Copilot : 코드 자동 완성
◦
Replit Ghostwriter : 온라인 코딩 지원 AI
◦
OpenAI Code Interpreter : 데이터 분석 코드 작성
콘텐츠 생성
•
블로그, 마케팅 문안, 아이디어 브레인스토밍 지원
•
예시 :
◦
Jasper AI : 마케팅, 블로그 글 작성
◦
Writesonic : 광고, 기사, 이메일 콘텐츠 제작
◦
Copy.ai : 창의적인 문안 생성
멀티모달
•
이미지 설명, 음성 대화, 영상 자막 등 다양한 형식 처리
•
예시 :
◦
GPT-4o Vision : 이미지 인식과 설명, 퀴즈 제작
◦
Runway ML : 이미지·영상 생성 및 편집
◦
Descript : 음성·영상 편집, 자동 자막 생성

