study/Ollama

πŸ“Œ Ollamaμ—μ„œ νŒŒμΈνŠœλ‹μ΄ ν•„μš”ν•œ 이유

octo54 2025. 3. 11. 11:32
λ°˜μ‘ν˜•

πŸ“Œ Ollamaμ—μ„œ νŒŒμΈνŠœλ‹μ΄ ν•„μš”ν•œ 이유

OllamaλŠ” λ‘œμ»¬μ—μ„œ λ‹€μ–‘ν•œ AI λͺ¨λΈμ„ μ‰½κ²Œ μ‹€ν–‰ν•  수 μžˆλ„λ‘ λ•λŠ” ν”„λ ˆμž„μ›Œν¬μž…λ‹ˆλ‹€. 기본적으둜 OllamaλŠ” Llama3, Mistral, Phi λ“± λ‹€μ–‘ν•œ 사전 ν•™μŠ΅λœ λͺ¨λΈμ„ μ‹€ν–‰ν•  수 μžˆμ§€λ§Œ, μ‚¬μš©μžμ˜ νŠΉμ • λͺ©μ μ— 맞좰 μ„±λŠ₯을 κ·ΉλŒ€ν™”ν•˜λ €λ©΄ νŒŒμΈνŠœλ‹(Fine-tuning)이 ν•„μš”ν•©λ‹ˆλ‹€.

이번 κΈ€μ—μ„œλŠ” Ollamaμ—μ„œ νŒŒμΈνŠœλ‹μ΄ ν•„μš”ν•œ μ΄μœ μ™€ ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§λ§ŒμœΌλ‘œ ν•΄κ²°ν•  수 μžˆλŠ” 경우 vs νŒŒμΈνŠœλ‹μ΄ ν•„μˆ˜μ μΈ 경우λ₯Ό λΉ„κ΅ν•˜μ—¬, μ–Έμ œ νŒŒμΈνŠœλ‹μ„ κ³ λ €ν•΄μ•Ό ν•˜λŠ”μ§€ μ„€λͺ…ν•˜κ² μŠ΅λ‹ˆλ‹€.


πŸš€ 1. Ollamaλž€? 그리고 κΈ°λ³Έ λͺ¨λΈμ˜ ν•œκ³„

βœ… Ollamaλž€?

OllamaλŠ” 둜컬 ν™˜κ²½μ—μ„œ LLM(Large Language Model)을 μ‹€ν–‰ν•˜κ³ , ν•„μš”ν•œ 경우 λ§žμΆ€ν˜• λͺ¨λΈμ„ λ§Œλ“€ 수 μžˆλŠ” AI ν”„λ ˆμž„μ›Œν¬μž…λ‹ˆλ‹€.

πŸ”Ή μ£Όμš” νŠΉμ§•

  • 사전 ν•™μŠ΅λœ λ‹€μ–‘ν•œ AI λͺ¨λΈμ„ 지원 (Llama3, Mistral, Phi λ“±)
  • λ‘œμ»¬μ—μ„œ λΉ λ₯΄κ²Œ AI λͺ¨λΈ μ‹€ν–‰ κ°€λŠ₯
  • Docker, API 등을 ν™œμš©ν•˜μ—¬ ν™•μž₯ κ°€λŠ₯

κ·ΈλŸ¬λ‚˜ κΈ°λ³Έ λͺ¨λΈμ„ κ·ΈλŒ€λ‘œ μ‚¬μš©ν•˜λ©΄ ν•œκ³„μ μ΄ μžˆμŠ΅λ‹ˆλ‹€.


❌ κΈ°λ³Έ λͺ¨λΈμ˜ ν•œκ³„μ 

λ°˜μ‘ν˜•
  1. 도메인 νŠΉν™” 지식 λΆ€μ‘±
    • 예λ₯Ό λ“€μ–΄, Ollama의 κΈ°λ³Έ λͺ¨λΈμ— "ν•œκ΅­ μ£Όμ‹μ‹œμž₯에 λŒ€ν•œ 전망을 μ•Œλ €μ€˜" 라고 ν•˜λ©΄, 일반적인 금육 정보λ₯Ό μ œκ³΅ν•˜μ§€λ§Œ, μ΅œμ‹  ν•œκ΅­ μ£Όμ‹μ‹œμž₯ νŠΈλ Œλ“œλ₯Ό λ°˜μ˜ν•˜μ§€ λͺ»ν•  수 있음.
    • νŠΉμ • λΆ„μ•Ό(의료, 법λ₯ , ν”„λ‘œκ·Έλž˜λ° λ“±)에 νŠΉν™”λœ 정보λ₯Ό λ°˜μ˜ν•˜λ €λ©΄ νŒŒμΈνŠœλ‹μ΄ ν•„μš”ν•¨.
  2. ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ˜ ν•œκ³„
    • λ‹¨μˆœν•œ ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§(질문 방식 λ³€κ²½, ν”„λ‘¬ν”„νŠΈ μ΅œμ ν™”)μœΌλ‘œλ„ μ–΄λŠ 정도 κ°œμ„ ν•  수 있음.
    • ν•˜μ§€λ§Œ λ³΅μž‘ν•œ 도메인 지식이 ν•„μš”ν•˜κ±°λ‚˜, νŠΉμ • μŠ€νƒ€μΌλ‘œ μΌκ΄€λœ 응닡을 생성해야 ν•  경우 νŒŒμΈνŠœλ‹μ΄ ν•„μˆ˜μ .
  3. 데이터 μ—…λ°μ΄νŠΈ 문제
    • κΈ°μ‘΄ λͺ¨λΈμ€ ν•™μŠ΅ λ‹Ήμ‹œμ˜ 데이터λ₯Ό 기반으둜 닡변함.
    • 예λ₯Ό λ“€μ–΄, Ollama의 κΈ°λ³Έ λͺ¨λΈμ΄ 2023λ…„κΉŒμ§€ ν•™μŠ΅λœ λͺ¨λΈμ΄λΌλ©΄, 2024λ…„μ˜ μ΅œμ‹  정보λ₯Ό λ°˜μ˜ν•˜μ§€ λͺ»ν•¨.
    • μ΅œμ‹  정보λ₯Ό μ§€μ†μ μœΌλ‘œ λ°˜μ˜ν•˜λ €λ©΄ 지식 증강(RAG) λ˜λŠ” νŒŒμΈνŠœλ‹μ΄ ν•„μš”ν•¨.

πŸ“Œ 2. ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§ vs νŒŒμΈνŠœλ‹

βœ… ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§λ§ŒμœΌλ‘œ ν•΄κ²°ν•  수 μžˆλŠ” 경우

ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μ€ λͺ¨λΈμ˜ μ„±λŠ₯을 μ΅œλŒ€ν•œ ν™œμš©ν•˜κΈ° μœ„ν•œ κΈ°λ²•μœΌλ‘œ, λ‹€μŒκ³Ό 같은 κ²½μš°μ— μ ν•©ν•©λ‹ˆλ‹€.

πŸ”Ή ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μœΌλ‘œ ν•΄κ²° κ°€λŠ₯ν•œ 문제

  • λ‹΅λ³€μ˜ μŠ€νƒ€μΌ, 문체, 톀을 μ‘°μ •ν•˜κ³  싢을 λ•Œ
  • νŠΉμ • νŒ¨ν„΄μ˜ 응닡을 μœ λ„ν•˜κ³  싢을 λ•Œ
  • λ‹€μ–‘ν•œ λ°©λ²•μœΌλ‘œ μ§ˆλ¬Έμ„ 던져 졜적의 κ²°κ³Όλ₯Ό μ°Ύκ³  싢을 λ•Œ

πŸ“Œ 예제: 주식 예츑 λͺ¨λΈ
❌ λ‹¨μˆœ 질문 → "μ‚Όμ„±μ „μž μ£Όκ°€ 전망 μ•Œλ €μ€˜."
βœ… κ°œμ„ λœ ν”„λ‘¬ν”„νŠΈ → "2024λ…„ 1μ›”λΆ€ν„° 3μ›”κΉŒμ§€μ˜ μ‚Όμ„±μ „μž μ£Όκ°€ 변동 데이터λ₯Ό 기반으둜 ν–₯ν›„ 6κ°œμ›” λ™μ•ˆμ˜ 전망을 μš”μ•½ν•΄μ€˜."

κ·ΈλŸ¬λ‚˜, νŠΉμ •ν•œ 데이터셋을 기반으둜 ν•™μŠ΅μ„ ν•΄μ•Ό ν•˜λŠ” 경우라면 ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§λ§ŒμœΌλ‘œλŠ” ν•΄κ²°ν•  수 μ—†μŠ΅λ‹ˆλ‹€.


βœ… νŒŒμΈνŠœλ‹μ΄ ν•„μš”ν•œ 경우

μ•„λž˜μ™€ 같은 κ²½μš°μ—λŠ” νŒŒμΈνŠœλ‹μ„ κ³ λ €ν•΄μ•Ό ν•©λ‹ˆλ‹€.

  1. νŠΉμ • 도메인 지식이 ν•„μš”ν•œ 경우
    • 금육, 의료, 법λ₯ , ν”„λ‘œκ·Έλž˜λ°κ³Ό 같은 전문적인 λΆ„μ•Όμ˜ 데이터λ₯Ό ν•™μŠ΅ν•΄μ•Ό ν•  λ•Œ.
    • 예: 의료 챗봇을 κ°œλ°œν•  λ•Œ, κΈ°μ‘΄ λͺ¨λΈμ΄ μ˜ν•™ 논문을 μΆ©λΆ„νžˆ ν•™μŠ΅ν•˜μ§€ μ•Šμ•˜λ‹€λ©΄ νŒŒμΈνŠœλ‹μ΄ ν•„μš”ν•¨.
  2. μΌκ΄€λœ μŠ€νƒ€μΌ 및 νŠΉμ • 포맷의 응닡이 ν•„μš”ν•œ 경우
    • νšŒμ‚¬ λ‚΄λΆ€ λ¬Έμ„œ μŠ€νƒ€μΌμ— 맞좰 닡변을 생성해야 ν•˜λŠ” 경우
    • 예: 법λ₯  상담 AIκ°€ νŠΉμ • 법λ₯  λ¬Έμ„œ ν˜•μ‹μ— 맞좰 λ‹΅λ³€ν•˜λ„λ‘ ν•™μŠ΅ν•΄μ•Ό ν•˜λŠ” 경우.
  3. μ΅œμ‹  데이터λ₯Ό λ°˜μ˜ν•΄μ•Ό ν•˜λŠ” 경우
    • κΈ°λ³Έ λͺ¨λΈμ΄ 2023λ…„κΉŒμ§€μ˜ λ°μ΄ν„°λ‘œ ν•™μŠ΅λ˜μ—ˆμ§€λ§Œ, 2024λ…„ μ΅œμ‹  법λ₯ , 금육 데이터 반영이 ν•„μš”ν•  λ•Œ.
    • (예: 2024λ…„ κ°œμ •λœ 세법을 기반으둜 AIκ°€ μ„ΈκΈˆ κ΄€λ ¨ 닡변을 μ œκ³΅ν•΄μ•Ό ν•  λ•Œ)
  4. λ°˜λ³΅λ˜λŠ” μ§ˆλ¬Έμ„ λΉ λ₯΄κ²Œ μ²˜λ¦¬ν•΄μ•Ό ν•˜λŠ” 경우
    • μ‚¬μš©μžκ°€ νŠΉμ • μ§ˆλ¬Έμ„ 자주 λ°˜λ³΅ν•˜λŠ” 경우, 미리 ν•™μŠ΅λœ λͺ¨λΈμ„ λ§Œλ“€λ©΄ 효율적으둜 처리 κ°€λŠ₯.
    • (예: 고객센터 챗봇, λ°˜λ³΅λ˜λŠ” ν”„λ‘œκ·Έλž˜λ° 질문 응닡 λͺ¨λΈ λ“±)

πŸš€ 3. κ²°λ‘ : Ollamaμ—μ„œ μ–Έμ œ νŒŒμΈνŠœλ‹μ΄ ν•„μš”ν• κΉŒ?

βœ… ν”„λ‘¬ν”„νŠΈ μ—”μ§€λ‹ˆμ–΄λ§μœΌλ‘œ ν•΄κ²° κ°€λŠ₯ν•  λ•Œ

βœ” λ‹΅λ³€ μŠ€νƒ€μΌ, ν˜•μ‹, 문체λ₯Ό μ‘°μ •ν•˜λŠ” 문제
βœ” νŠΉμ • νŒ¨ν„΄μ˜ μ§ˆλ¬Έμ„ μž…λ ₯ν•˜λ©΄ μ›ν•˜λŠ” 좜λ ₯을 얻을 수 μžˆλŠ” 경우

βœ… νŒŒμΈνŠœλ‹μ΄ ν•„μˆ˜μ μΈ 경우

βœ” νŠΉμ • 도메인(의료, 법λ₯ , 금육 λ“±) 데이터λ₯Ό ν•™μŠ΅ν•΄μ•Ό ν•  λ•Œ
βœ” μ΅œμ‹  정보λ₯Ό μ§€μ†μ μœΌλ‘œ λ°˜μ˜ν•΄μ•Ό ν•  λ•Œ
βœ” λ°˜λ³΅λ˜λŠ” μ§ˆλ¬Έμ— λŒ€ν•΄ λΉ λ₯΄κ²Œ μ‘λ‹΅ν•˜λŠ” AIκ°€ ν•„μš”ν•  λ•Œ
βœ” κΈ°μ‘΄ AI λͺ¨λΈμ΄ μ œκ³΅ν•˜λŠ” 응닡이 μ›ν•˜λŠ” μˆ˜μ€€μ— λ„λ‹¬ν•˜μ§€ λͺ»ν•  λ•Œ

πŸ‘‰ 즉, Ollama의 κΈ°λ³Έ λͺ¨λΈλ‘œλ„ μΆ©λΆ„ν•œ κ²½μš°κ°€ λ§Žμ§€λ§Œ, νŠΉμ • μ‚°μ—…μ΄λ‚˜ κΈ°μ—… λ‚΄λΆ€ 데이터λ₯Ό ν™œμš©ν•˜λ €λ©΄ νŒŒμΈνŠœλ‹μ΄ ν•„μˆ˜μ μž…λ‹ˆλ‹€.


πŸ”₯ λ‹€μŒ κΈ€ 예고: Ollamaμ—μ„œ νŒŒμΈνŠœλ‹μ„ μˆ˜ν–‰ν•˜λŠ” 방법

이제 Ollamaμ—μ„œ μ‹€μ œλ‘œ νŒŒμΈνŠœλ‹μ„ μˆ˜ν–‰ν•˜λŠ” 과정을 μ•Œμ•„λ³΄κ² μŠ΅λ‹ˆλ‹€.
λ‹€μŒ κΈ€μ—μ„œλŠ” LoRA 기반 νŒŒμΈνŠœλ‹ 및 전체 λͺ¨λΈ μž¬ν•™μŠ΅ 방법을 λ‹€λ£° μ˜ˆμ •μž…λ‹ˆλ‹€! πŸš€