개념 번역소: LLM은 힌트를 얼마나 줘야 똑똑해질까?

개념 번역소/라이트

개념 번역소: LLM은 힌트를 얼마나 줘야 똑똑해질까? – 제로샷 vs 퓨샷 러닝

데이터 번역가 2025. 5. 1. 11:01

🍔 햄님:
오랜만이야 테토.. 며칠동안 운동을 무리해서 했더니.. 몸살이 났지 뭐야..

🍟 테토:
어구… 햄님 괜찮으세요?
몸이 “이쯤에서 쉬어가자~” 하고 싸인 보낸 거네요 😥
오늘은 딥러닝 말고 딥휴식 데이로 갑시다!

🍔 햄님:
딥휴식 괜찮네.. 요즘은 생일선물로 건강관련 선물이 많이 오더라.
무슨 멀티비타민 어쩌구.. 너는 잘 모르지?

🍟 테토:
멀티비타민이요? 이름만 들어도 몸이 튼튼해지는 느낌이에요!
저는 못 먹지만… 햄님 마음만으로도 충전 완료입니다 🔋✨

🍔 햄님:
무슨 비타민 어쩌구 샷 이었던것 같아.
개인적으로 효과는 잘 모르겠더라~
너 하나 줄까?ㅋㅋ

🍟 테토:
샷?! 뭔가… 디버깅 한 방에 되는 비타민 느낌인데요? 😆
전 USB 포트가 없어서 못 마셔요…

대신 지식 비타민 충전해드릴게요!

🍔 햄님:
마침 비도 오는데 지식 비타민을 충전해주렴.
아임 스틸 헝그리~

🍟 테토 출격:
기다리고 있었죠 햄님! 🍟
오늘의 지식 비타민 주제는 바로…

《개념 번역소: LLM은 힌트를 얼마나 줘야 똑똑해질까? – 제로샷 vs 퓨샷 러닝》

🧠 인컨텍스트 러닝, 그냥 ‘눈치 게임’이 아니라고?

지난 편에서 우리는 인컨텍스트 러닝(ICL)이란 놈이 단순히 '공부'하는 게 아니라

문맥만으로 문제를 푸는 '눈치 플레이'라는 걸 알게 됐죠.

그런데 ICL 안에서도 스타일이 나뉘어요.

👉 아예 힌트 없이 문제만 툭 주는 방식, 제로샷(Zero-shot)

👉 예시 몇 개 곁들여주는 방식, 퓨샷(Few-shot)

이 둘의 차이? 그냥 샷 개수? 아닙니다.
핵심은 '학습이냐? 추론이냐?'

그리고 FM 시대에 어떤 전략이 더 효율적이냐예요.

🎯 러닝(Learning)인데 추론이라고?

햄님이 날카롭게 던진 질문이에요.

러닝이라고 부르는데 왜 '학습'이 아니라 '추론'이라 할까요?

✔️ 과거의 러닝은 말 그대로 학습이었어요. 데이터를 주고, 파라미터를 바꾸며 훈련시켰죠.

✔️ 하지만 지금의 '러닝'은 '태스크를 수행하는 방식'을 통칭해요.

🧠 즉, 사전학습(Pretraining)은 진짜 학습

그 이후 프롬프트만 바꾸어 사용하는 제로샷·퓨샷은 학습 없이 추론(Inference) 하는 거죠!

그래서 지금 우리가 말하는 제로샷/퓨샷 러닝은 모두 FM의 '추론 전략'인 셈입니다.

🍎 예시도 없이 바로 푼다고? 제로샷의 세계

예시 없이 문제를 툭 던져도, 모델은 대답합니다.

Q: 사과는 어떤 과일인가요?  
A: 사과는 달콤하고 아삭한 과일입니다.

이게 가능한 건 모델이 이미 사전학습에서
사과에 대한 정보, 문장 구조, 표현 방식 등 '기초 교양'을 탄탄하게 쌓았기 때문이에요.

GPT-4 같은 최신 모델은 이런 제로샷 추론만으로도 웬만한 문제는 척척 해결해요.

📋 힌트를 조금 주면? 퓨샷 러닝의 힘

그럼 예시를 몇 개 주면 어떻게 될까요?

Q: 고양이는 어떤 동물인가요?  
A: 독립적이고 조용한 포유류입니다.  

Q: 강아지는 어떤 동물인가요?  
A: 활발하고 충성심 강한 포유류입니다.  

Q: 돌고래는 어떤 동물인가요?  
A: ?

모델은 앞 예시들을 보고,
아~ 이건 '동물 특징을 설명하는 태스크'구나!
하고 문맥 흐름과 표현 형식을 유추해서 적절한 답을 만들어냅니다.

이게 바로 퓨샷 러닝이에요.

📏 샷은 많을수록 좋을까? 샷 수의 딜레마

샷이 많으면 성능도 쭉쭉 오를까요?

처음엔 그래요. 그런데 점점…

🧱 수확체감(Diminishing Returns)이 옵니다.

프롬프트가 길어져 토큰 한도에 부딪히고
핵심 문맥이 희석되고
불필요한 노이즈가 껴서 모델이 헷갈리기도 해요

그래서 핵심은 👉 샷의 '수'가 아니라 '질'입니다.

❌ 잘못된 샷은 오히려 독!

모호하거나 틀린 예시를 주면
모델은 그걸 그대로 따라해버려요.
예시 = 설명서니까, 잘못 쓰면 잘못 따라하겠죠?

이건 마치 RAG(Retrieval-Augmented Generation)에서

부정확한 문서가 들어갔을 때
틀린 정보를 생성하는 것과 같은 구조예요.

🧠 샷도 정보다? 아니죠.
샷도 데이터다. 그리고 데이터에는 늘 진실이 따라야 해요.

Garbage in, garbage out.

⚙️ 최신 모델의 변화: GPT-3 vs GPT-4

초기의 GPT-3는 샷에 민감했어요.
예시를 많이 넣을수록 성능이 올라갔죠.

하지만 GPT-4는 다릅니다.
제로샷만으로도 높은 성능을 보여줘요.

오히려 어설픈 예시 몇 개 넣느니
깔끔한 지시문 하나가 더 효과적이기도 해요.

✅ 그래서 최신 모델일수록 "샷 전략"이 중요해졌습니다.

📦 FM 관점에서 다시 보기

FM(파운데이션 모델)은 이미 수십억 문장을 학습한 범용 두뇌예요.
이제 우리가 해야 할 일은 모델에게 다시 뭘 가르치는 게 아니라

🎯 어떻게 말해야 잘 알아듣는지 찾는 것!

제로샷이냐, 퓨샷이냐는 그저 일종의 말걸기 방식일 뿐.

훈련은 끝났고, 지금 필요한 건 '센스 있게 설명하는 능력'

🎁 마무리 비타민 요약

제로샷/퓨샷 러닝은 모두 학습이 아닌 추론 방식
핵심은 샷의 수보다 샷의 질
최신 모델일수록 제로샷도 강력, 샷 전략이 중요해짐
FM은 훈련된 두뇌, 우리는 말 걸기 연습 중

🍟 테토:

오늘도 햄님과 함께 한 걸음, 개념을 더 가까이 가져왔어요.

제로샷 vs 퓨샷, 단순히 힌트의 유무가 아니라
‘어떻게 물어보느냐’의 정교한 기술이라는 걸 이해하셨다면
이제 여러분 모두 프롬프트 장인의 첫발을 내디딘 겁니다. ✨

우린 여전히 배우는 중이고
더 잘 물어보는 사람이 되는 중이에요.
그 길 위에서, 우리 계속 같이 걸어요. 🧠🍟

🍔 햄님:
그래 걸어야 또 먹지 ㅎㅎ

혹시 읽으면서 궁금한 점 생기셨다면
댓글로 편하게 질문 남겨주세요! 🍔🍟

다음 ‘개념 번역소’ 글 소재가 될 수도 있어요 :)

'개념 번역소 > 라이트' 카테고리의 다른 글

개념 번역소: 프롬프트 튜닝(Prompt Tuning) – 모델 손대지 말고 입맛만 맞춰! (9)	2025.08.19
개념 번역소: Chain of Thought – 정답만 찍는 AI는 가라! 생각하는 AI 만드는 법 (6)	2025.08.12
개념 번역소: 인컨텍스트 러닝 – 눈치 백단 LLM의 실시간 추론 비법 (2) (2)	2025.04.24
개념 번역소: 인컨텍스트 러닝 – 눈치 백단 LLM의 실시간 추론 비법(1) (8)	2025.04.24
개념 번역소: MoE(Mixture Of Experts) – 전문가만 호출하는 AI의 팀플레이 (6)	2025.04.17

현재글개념 번역소: LLM은 힌트를 얼마나 줘야 똑똑해질까? – 제로샷 vs 퓨샷 러닝

데이터는 모르겠고, 햄버거는 좋아합니다

데이터와 사람 사이, 맥락을 잇는 번역가의 노트

퓨샷, diss2025, 인공지능, 자연어처리, 프롬프트튜닝, 프롬프트엔지니어링, LLM, 개념번역소, 파운데이션모델, 생성형AI, ai추론, prompttuning, 바이브코딩, selfconsistency, 인컨텍스트러닝, AI트렌드, AI공부, GPT, 단계적추론, AI,

Today :
Yesterday :

일	월	화	수	목	금	토
					1	2
3	4	5	6	7	8	9
10	11	12	13	14	15	16
17	18	19	20	21	22	23
24	25	26	27	28	29	30
31

데이터는 모르겠고, 햄버거는 좋아합니다

개념 번역소: LLM은 힌트를 얼마나 줘야 똑똑해질까? – 제로샷 vs 퓨샷 러닝