LoRA์™€ QLoRA: AI ๋ชจ๋ธ ํŠœ๋‹์˜ ํŒ๋„๋ฅผ ๋ฐ”๊พธ๋‹ค

LoRA์™€ QLoRA: AI ๋ชจ๋ธ ํŠœ๋‹์˜ ํŒ๋„๋ฅผ ๋ฐ”๊พธ๋‹ค

D
dongAuthor
11 min read

๋Œ€๊ทœ๋ชจ ์–ธ์–ด ๋ชจ๋ธ(LLM)์„ ํŠน์ • ์ž‘์—…์— ๋งž๊ฒŒ ์กฐ์ •ํ•˜๋Š” ๊ฒƒ์€ ๋งˆ์น˜ F1 ๊ฒฝ์ฃผ์šฉ ์ž๋™์ฐจ๋ฅผ ํŠน์ • ํŠธ๋ž™์— ๋งž๊ฒŒ ํŠœ๋‹ํ•˜๋Š” ๊ฒƒ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค. ์ตœ๊ณ ์˜ ์„ฑ๋Šฅ์„ ๋Œ์–ด๋‚ด๊ธฐ ์œ„ํ•ด ์„ฌ์„ธํ•œ ์กฐ์ •์ด ํ•„์š”ํ•˜์ง€๋งŒ, ์ด ๊ณผ์ •์€ ์—„์ฒญ๋‚œ ์ž์›๊ณผ ์‹œ๊ฐ„์„ ์†Œ๋ชจํ•  ์ˆ˜ ์žˆ์ฃ . ์ „ํ†ต์ ์ธ ์ „์ฒด ํŒŒ๋ผ๋ฏธํ„ฐ ํŒŒ์ธํŠœ๋‹(Full Fine-tuning) ๋ฐฉ์‹์€ ๋ชจ๋ธ์˜ ๋ชจ๋“  ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์—…๋ฐ์ดํŠธํ•ด์•ผ ํ•ด์„œ ๋น„์šฉ์ด ๋งŽ์ด ๋“ค๊ณ , ๋•Œ๋กœ๋Š” 'ํŒŒ๊ตญ์  ๋ง๊ฐ(catastrophic forgetting)'์ด๋ผ๋Š” ๋ฌธ์ œ์— ๋ถ€๋”ชํžˆ๊ธฐ๋„ ํ•ฉ๋‹ˆ๋‹ค.

ํ•˜์ง€๋งŒ ๊ฑฑ์ • ๋งˆ์„ธ์š”! ์ด์ œ ๋” ํšจ์œจ์ ์ธ ๋ฐฉ๋ฒ•์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐ”๋กœ ํŒŒ๋ผ๋ฏธํ„ฐ ํšจ์œจ์  ํŒŒ์ธํŠœ๋‹(Parameter-Efficient Fine-Tuning, PEFT) ๊ธฐ๋ฒ•์ž…๋‹ˆ๋‹ค. ์ด ๊ธ€์—์„œ๋Š” PEFT์˜ ๋Œ€ํ‘œ์ ์ธ ์ฃผ์ž์ธ LoRA์™€, ๊ทธ๋ณด๋‹ค ํ•œ ๋‹จ๊ณ„ ๋” ๋‚˜์•„๊ฐ„ QLoRA์— ๋Œ€ํ•ด ์ž์„ธํžˆ ์•Œ์•„๋ณผ ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด ๋‘ ๊ธฐ์ˆ ์ด ์–ด๋–ป๊ฒŒ LLM ํŠœ๋‹์˜ ํŒจ๋Ÿฌ๋‹ค์ž„์„ ๋ฐ”๊พธ๊ณ  ์žˆ๋Š”์ง€, ๊ทธ๋ฆฌ๊ณ  ๊ฐ๊ฐ ์–ด๋–ค ์ƒํ™ฉ์— ๋” ์ ํ•ฉํ•œ์ง€ ๋ช…ํ™•ํ•˜๊ฒŒ ์ดํ•ดํ•˜๊ฒŒ ๋˜์‹ค ๊ฒ๋‹ˆ๋‹ค.

I. ํŒŒ๋ผ๋ฏธํ„ฐ ํšจ์œจ์  ํŒŒ์ธํŠœ๋‹(PEFT) ์ž…๋ฌธ

PEFT๋ž€ ๋ฌด์—‡์ด๋ฉฐ ์™œ ์ค‘์š”ํ• ๊นŒ์š”?

PEFT๋Š” ์ด๋ฆ„ ๊ทธ๋Œ€๋กœ โ€˜ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ํšจ์œจ์ ์œผ๋กœโ€™ ํŒŒ์ธํŠœ๋‹ํ•˜๋Š” ๊ธฐ์ˆ ์ž…๋‹ˆ๋‹ค. ์ˆ˜์‹ญ์–ต, ์ˆ˜๋ฐฑ์–ต ๊ฐœ์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ฐ€์ง„ ๊ฑฐ๋Œ€ํ•œ ์‚ฌ์ „ ํ›ˆ๋ จ๋œ ๋ชจ๋ธ(Pre-trained Model)์˜ ๋ชจ๋“  ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ์žฌํ•™์Šต์‹œํ‚ค๋Š” ๋Œ€์‹ , ๋ชจ๋ธ์˜ ์•„์ฃผ ์ž‘์€ ์ผ๋ถ€ ํŒŒ๋ผ๋ฏธํ„ฐ๋งŒ ์„ ํƒ์ ์œผ๋กœ ์—…๋ฐ์ดํŠธํ•˜๋Š” ๋ฐฉ์‹์ด์ฃ .

๊ธฐ์กด ๋ชจ๋ธ์˜ ๊ฐ€์ค‘์น˜๋Š” ๋Œ€๋ถ€๋ถ„ โ€˜๊ณ ์ •(frozen)โ€™ ์ƒํƒœ๋กœ ๋‘๊ณ , ์†Œ์ˆ˜์˜ ์ƒˆ๋กœ์šด ํŒŒ๋ผ๋ฏธํ„ฐ๋งŒ ์ถ”๊ฐ€ํ•˜์—ฌ ํ•™์Šต์‹œํ‚ต๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด ๋งˆ์น˜ ๊ฑฐ๋Œ€ํ•œ ๋นŒ๋”ฉ์˜ ๊ธฐ๋ณธ ๊ตฌ์กฐ๋Š” ๊ทธ๋Œ€๋กœ ๋‘” ์ฑ„, ํŠน์ • ๊ณต๊ฐ„์˜ ์ธํ…Œ๋ฆฌ์–ด๋งŒ ๋ฐ”๊ฟ”์„œ ์ƒˆ๋กœ์šด ์šฉ๋„๋กœ ์‚ฌ์šฉํ•˜๋Š” ๊ฒƒ๊ณผ ๊ฐ™์Šต๋‹ˆ๋‹ค.

PEFT๊ฐ€ ์ค‘์š”ํ•œ ์ด์œ ๋Š” ๋ช…ํ™•ํ•ฉ๋‹ˆ๋‹ค.

  • ์ž์› ์ ˆ์•ฝ: ํ›จ์”ฌ ์ ์€ ์ˆ˜์˜ ํŒŒ๋ผ๋ฏธํ„ฐ๋งŒ ํ•™์Šต์‹œํ‚ค๋ฏ€๋กœ, GPU ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰๊ณผ ํ•™์Šต ์‹œ๊ฐ„์„ ํš๊ธฐ์ ์œผ๋กœ ์ค„์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ๋น„์šฉ ์ ˆ๊ฐ: ์ปดํ“จํŒ… ์ž์›์„ ๋œ ์‚ฌ์šฉํ•˜๋‹ˆ ๋‹น์—ฐํžˆ ๋น„์šฉ๋„ ์ ˆ์•ฝ๋ฉ๋‹ˆ๋‹ค.
  • ํŒŒ๊ตญ์  ๋ง๊ฐ ๋ฐฉ์ง€: ๊ธฐ์กด ๋ชจ๋ธ์˜ ์ง€์‹ ๋Œ€๋ถ€๋ถ„์„ ๋ณด์กดํ•˜๋ฏ€๋กœ, ์ƒˆ๋กœ์šด ์ž‘์—…์— ๋Œ€ํ•œ ํ•™์Šต์œผ๋กœ ์ธํ•ด ๊ธฐ์กด์— ํ•™์Šต๋œ ์ค‘์š”ํ•œ ์ •๋ณด๋ฅผ ์žƒ์–ด๋ฒ„๋ฆฌ๋Š” โ€˜ํŒŒ๊ตญ์  ๋ง๊ฐโ€™ ๋ฌธ์ œ๋ฅผ ์™„ํ™”ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ๋ชจ๋ธ ๊ด€๋ฆฌ ์šฉ์ด์„ฑ: ์›๋ณธ ๋ชจ๋ธ์€ ํ•˜๋‚˜๋งŒ ์œ ์ง€ํ•˜๊ณ , ๊ฐ ์ž‘์—…์— ๋งž๊ฒŒ ํ•™์Šต๋œ ์ž‘์€ ํฌ๊ธฐ์˜ ์ถ”๊ฐ€ ํŒŒ๋ผ๋ฏธํ„ฐ(์–ด๋Œ‘ํ„ฐ)๋งŒ ๊ต์ฒดํ•˜๋ฉด ๋˜๋ฏ€๋กœ ์—ฌ๋Ÿฌ ์ž‘์—…์„ ๊ด€๋ฆฌํ•˜๊ธฐ๊ฐ€ ํ›จ์”ฌ ์ˆ˜์›”ํ•ด์ง‘๋‹ˆ๋‹ค.

์ „ํ†ต์ ์ธ ํŒŒ์ธํŠœ๋‹ vs. PEFT

ํŠน์ง• ์ „์ฒด ํŒŒ๋ผ๋ฏธํ„ฐ ํŒŒ์ธํŠœ๋‹ (Full Fine-tuning) ํŒŒ๋ผ๋ฏธํ„ฐ ํšจ์œจ์  ํŒŒ์ธํŠœ๋‹ (PEFT)
ํ•™์Šต ๋Œ€์ƒ ๋ชจ๋ธ์˜ ๋ชจ๋“  ํŒŒ๋ผ๋ฏธํ„ฐ ๋ชจ๋ธ์˜ ์ผ๋ถ€ ํŒŒ๋ผ๋ฏธํ„ฐ (์ „์ฒด์˜ 1% ๋ฏธ๋งŒ)
GPU ๋ฉ”๋ชจ๋ฆฌ ๋งค์šฐ ๋†’์€ ๋ฉ”๋ชจ๋ฆฌ ์š”๊ตฌ๋Ÿ‰ ํ›จ์”ฌ ์ ์€ ๋ฉ”๋ชจ๋ฆฌ ์š”๊ตฌ๋Ÿ‰
ํ•™์Šต ์‹œ๊ฐ„ ์˜ค๋ž˜ ๊ฑธ๋ฆผ ์งง๊ฒŒ ๊ฑธ๋ฆผ
ํŒŒ๊ตญ์  ๋ง๊ฐ ๋ฐœ์ƒ ์œ„ํ—˜ ๋†’์Œ ๋ฐœ์ƒ ์œ„ํ—˜ ๋‚ฎ์Œ
๋ชจ๋ธ ์ €์žฅ ๊ฐ ์ž‘์—…๋งˆ๋‹ค ์ „์ฒด ๋ชจ๋ธ ํฌ๊ธฐ์˜ ์‚ฌ๋ณธ ํ•„์š” ์›๋ณธ ๋ชจ๋ธ + ์ž‘์€ ์–ด๋Œ‘ํ„ฐ ํŒŒ์ผ๋งŒ ํ•„์š”

์ด์ฒ˜๋Ÿผ PEFT๋Š” ์ž์›์˜ ์ œ์•ฝ ์†์—์„œ๋„ LLM์˜ ๊ฐ•๋ ฅํ•œ ์„ฑ๋Šฅ์„ ํŠน์ • ๋„๋ฉ”์ธ์— ๋งž๊ฒŒ ์ตœ์ ํ™”ํ•  ์ˆ˜ ์žˆ๋Š” ๋งค์šฐ ์‹ค์šฉ์ ์ด๊ณ  ๊ฐ•๋ ฅํ•œ ์ ‘๊ทผ๋ฒ•์ž…๋‹ˆ๋‹ค. LoRA์™€ QLoRA๋Š” ๋ฐ”๋กœ ์ด PEFT ๊ณ„์—ด์˜ ํ•ต์‹ฌ ๊ธฐ์ˆ ์ž…๋‹ˆ๋‹ค.

II. LoRA ํŒŒํ—ค์น˜๊ธฐ: ๋” ๊ฐ€๋ณ๊ณ  ๋น ๋ฅธ ํŠœ๋‹์˜ ์‹œ์ž‘

LoRA(Low-Rank Adaptation)๋Š” PEFT ๊ธฐ๋ฒ• ์ค‘์—์„œ๋„ ๊ฐ€์žฅ ๋„๋ฆฌ ์‚ฌ์šฉ๋˜๋Š” ๋ฐฉ๋ฒ• ์ค‘ ํ•˜๋‚˜์ž…๋‹ˆ๋‹ค. LoRA์˜ ํ•ต์‹ฌ ์•„์ด๋””์–ด๋Š” '์ €๊ณ„์ˆ˜(Low-Rank) ํ–‰๋ ฌโ€™์„ ์ด์šฉํ•ด ํŒŒ๋ผ๋ฏธํ„ฐ ์—…๋ฐ์ดํŠธ๋ฅผ ํšจ์œจํ™”ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.

LoRA๋Š” ์–ด๋–ป๊ฒŒ ์ž‘๋™ํ• ๊นŒ์š”?

LLM์˜ ๊ฐ ๋ ˆ์ด์–ด์—๋Š” ๊ฑฐ๋Œ€ํ•œ ๊ฐ€์ค‘์น˜ ํ–‰๋ ฌ(Weight Matrix, W)์ด ์žˆ์Šต๋‹ˆ๋‹ค. ์ „์ฒด ํŒŒ์ธํŠœ๋‹์—์„œ๋Š” ์ด ํ–‰๋ ฌ W๋ฅผ ์ง์ ‘ ์—…๋ฐ์ดํŠธํ•˜์ง€๋งŒ, LoRA๋Š” ๋‹ค๋ฅธ ๋ฐฉ์‹์„ ์ทจํ•ฉ๋‹ˆ๋‹ค.

  1. ์›๋ณธ ๊ฐ€์ค‘์น˜ ๊ณ ์ •: ๊ธฐ์กด์˜ ์‚ฌ์ „ ํ›ˆ๋ จ๋œ ๊ฐ€์ค‘์น˜ ํ–‰๋ ฌ W๋Š” ํ•™์Šต ์ค‘์— ๋ณ€๊ฒฝ๋˜์ง€ ์•Š๋„๋ก ๊ณ ์ •(freeze)ํ•ฉ๋‹ˆ๋‹ค.
  2. ์ €๊ณ„์ˆ˜ ํ–‰๋ ฌ ์ถ”๊ฐ€: W ์˜†์— ํ›จ์”ฌ ์ž‘์€ ๋‘ ๊ฐœ์˜ ํ–‰๋ ฌ, ์ฆ‰ โ€˜์ €๊ณ„์ˆ˜ ํ–‰๋ ฌโ€™ A์™€ B๋ฅผ ์ถ”๊ฐ€ํ•ฉ๋‹ˆ๋‹ค. ์ด ๋‘ ํ–‰๋ ฌ๋งŒ์ด ํ•™์Šต์˜ ๋Œ€์ƒ์ด ๋ฉ๋‹ˆ๋‹ค.
  3. ํ–‰๋ ฌ ๋ถ„ํ•ด: ์›๋ž˜ ๊ฐ€์ค‘์น˜ ์—…๋ฐ์ดํŠธ๋Ÿ‰(ฮ”W)์„ ๋‘ ๊ฐœ์˜ ์ž‘์€ ํ–‰๋ ฌ(A์™€ B)์˜ ๊ณฑ(BA)์œผ๋กœ ๊ทผ์‚ฌ(approximate)ํ•ฉ๋‹ˆ๋‹ค. ์—ฌ๊ธฐ์„œ A๋Š” (d x r), B๋Š” (r x d) ์ฐจ์›์„ ๊ฐ€์ง€๋ฉฐ, r(rank)์€ ์›๋ž˜ ์ฐจ์› d๋ณด๋‹ค ํ›จ์”ฌ ์ž‘์€ ๊ฐ’์ž…๋‹ˆ๋‹ค. (์˜ˆ: r=8, 16, d=4096)
  4. ์ตœ์ข… ์ถœ๋ ฅ ๊ณ„์‚ฐ: ๋ชจ๋ธ์˜ ์ตœ์ข… ์ถœ๋ ฅ์€ ์›๋ณธ ๊ฐ€์ค‘์น˜ W๋ฅผ ํ†ต๊ณผํ•œ ๊ฒฐ๊ณผ์™€, ๋‘ ๊ฐœ์˜ ์ž‘์€ ํ–‰๋ ฌ BA๋ฅผ ํ†ต๊ณผํ•œ ๊ฒฐ๊ณผ๋ฅผ ๋”ํ•ด์„œ ๊ณ„์‚ฐ๋ฉ๋‹ˆ๋‹ค. ์ฆ‰, h = Wx + BAx๊ฐ€ ๋ฉ๋‹ˆ๋‹ค.

ํ•™์Šต์ด ๋๋‚˜๋ฉด ์šฐ๋ฆฌ๋Š” ์›๋ณธ ๋ชจ๋ธ W์™€๋Š” ๋ณ„๊ฐœ๋กœ, ์•„์ฃผ ์ž‘์€ ํฌ๊ธฐ์˜ ํ–‰๋ ฌ A์™€ B๋งŒ ์ €์žฅํ•˜๋ฉด ๋ฉ๋‹ˆ๋‹ค. ์ถ”๋ก  ์‹œ์—๋Š” W' = W + BA์ฒ˜๋Ÿผ ๋‘ ๊ฐ€์ค‘์น˜๋ฅผ ํ•ฉ์ณ์„œ ์‚ฌ์šฉํ•˜๊ฑฐ๋‚˜, ๋ถ„๋ฆฌ๋œ ์ƒํƒœ ๊ทธ๋Œ€๋กœ ์‚ฌ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

LoRA์˜ ์žฅ์ 

  • ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜ ๊ฐ์†Œ: ๋žญํฌยฎ๋ฅผ ์ž‘๊ฒŒ ์„ค์ •ํ•˜๋ฉด ํ•™์Šตํ•ด์•ผ ํ•  ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๊ฐ€ ๊ทน์ ์œผ๋กœ ์ค„์–ด๋“ญ๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ๋žญํฌ๋ฅผ 8๋กœ ์„ค์ •ํ•˜๋ฉด ํ›ˆ๋ จ ๊ฐ€๋Šฅํ•œ ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๊ฐ€ ์ˆ˜๋ฐฑ๋งŒ ๊ฐœ ์ˆ˜์ค€์œผ๋กœ ์ค„์–ด๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ๋ฉ”๋ชจ๋ฆฌ ๋ฐ ๊ณ„์‚ฐ ๋น„์šฉ ์ ˆ๊ฐ: ํ•™์Šตํ•  ํŒŒ๋ผ๋ฏธํ„ฐ๊ฐ€ ์ ์œผ๋‹ˆ ๋‹น์—ฐํžˆ GPU ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰๊ณผ ํ•™์Šต ์‹œ๊ฐ„์ด ์ค„์–ด๋“ญ๋‹ˆ๋‹ค.
  • ๊ณผ์ ํ•ฉ(Overfitting) ์œ„ํ—˜ ๊ฐ์†Œ: ๋” ์ ์€ ํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ํ•™์Šต์‹œํ‚ค๋ฏ€๋กœ, ์ œํ•œ๋œ ๋ฐ์ดํ„ฐ์…‹์— ๋ชจ๋ธ์ด ๊ณผ๋„ํ•˜๊ฒŒ ๋งž์ถฐ์ง€๋Š” ๊ณผ์ ํ•ฉ์˜ ์œ„ํ—˜์ด ์ค„์–ด๋“ญ๋‹ˆ๋‹ค.
  • ์œ ์—ฐํ•œ ๋ชจ๋ธ ์ ์šฉ: ๋ชจ๋ธ์˜ ํŠน์ • ๋ถ€๋ถ„(์˜ˆ: ์–ดํ…์…˜ ๋ ˆ์ด์–ด)์—๋งŒ LoRA๋ฅผ ์„ ํƒ์ ์œผ๋กœ ์ ์šฉํ•  ์ˆ˜ ์žˆ์–ด ๋ฏธ์„ธ ์กฐ์ •์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.

III. QLoRA ๊นŠ์ด ๋ณด๊ธฐ: ๋ฉ”๋ชจ๋ฆฌ ํšจ์œจ์˜ ๊ทนํ•œ์„ ์ถ”๊ตฌํ•˜๋‹ค

QLoRA(Quantized Low-Rank Adaptation)๋Š” LoRA๋ฅผ ํ•œ ๋‹จ๊ณ„ ๋” ๋ฐœ์ „์‹œํ‚จ ๊ธฐ์ˆ ์ž…๋‹ˆ๋‹ค. ์ด๋ฆ„์˜ 'Qโ€™๊ฐ€ ์˜๋ฏธํ•˜๋“ฏ, ์–‘์žํ™”(Quantization) ๊ธฐ์ˆ ์„ ์ ‘๋ชฉํ•˜์—ฌ ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰์„ ๊ทนํ•œ๊นŒ์ง€ ์ค„์ด๋Š” ๋ฐ ์ดˆ์ ์„ ๋งž์ถฅ๋‹ˆ๋‹ค.

QLoRA๋ž€ ๋ฌด์—‡์ผ๊นŒ์š”?

QLoRA์˜ ํ•ต์‹ฌ ๋ชฉํ‘œ๋Š” LoRA๋ณด๋‹ค๋„ ๋” ์ ์€ ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด์„œ ๋น„์Šทํ•œ ์ˆ˜์ค€์˜ ์„ฑ๋Šฅ์„ ์œ ์ง€ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ์ด๋ฅผ ์œ„ํ•ด ๋‹ค์Œ๊ณผ ๊ฐ™์€ ํ˜์‹ ์ ์ธ ๊ธฐ๋ฒ•๋“ค์„ ๋„์ž…ํ–ˆ์Šต๋‹ˆ๋‹ค.

  1. 4๋น„ํŠธ NF4(NormalFloat) ์–‘์žํ™”: QLoRA๋Š” ์‚ฌ์ „ ํ›ˆ๋ จ๋œ LLM์˜ ๊ฑฐ๋Œ€ํ•œ ๊ฐ€์ค‘์น˜(W)๋ฅผ 4๋น„ํŠธ NormalFloat(NF4) ๋ผ๋Š” ์ƒˆ๋กœ์šด ๋ฐ์ดํ„ฐ ํƒ€์ž…์œผ๋กœ ์–‘์žํ™”ํ•˜์—ฌ ์••์ถ•ํ•ฉ๋‹ˆ๋‹ค. ๊ธฐ์กด์˜ 32๋น„ํŠธ ๋˜๋Š” 16๋น„ํŠธ ๋ถ€๋™์†Œ์ˆ˜์  ์ˆซ์ž๋ฅผ 4๋น„ํŠธ ์ˆซ์ž๋กœ ํ‘œํ˜„ํ•จ์œผ๋กœ์จ, ๋ชจ๋ธ ๊ฐ€์ค‘์น˜๊ฐ€ ์ฐจ์ง€ํ•˜๋Š” ๋ฉ”๋ชจ๋ฆฌ ๊ณต๊ฐ„์„ 1/4 ๋˜๋Š” 1/8๊นŒ์ง€ ์ค„์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ค‘์š”ํ•œ ์ ์€, ์ด ์–‘์žํ™”๋Š” ์ •๋ณด ์†์‹ค์„ ์ตœ์†Œํ™”ํ•˜๋„๋ก ์„ค๊ณ„๋œ ๋ฐ์ดํ„ฐ ์ค‘์‹ฌ์ ์ธ ๋ฐฉ์‹์ด๋ผ๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค.
  2. ์ด์ค‘ ์–‘์žํ™”(Double Quantization): ์–‘์žํ™” ๊ณผ์ • ์ž์ฒด์—๋„ ์ถ”๊ฐ€์ ์ธ ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ํ•„์š”ํ•œ๋ฐ(์–‘์žํ™” ์ƒ์ˆ˜ ๋“ฑ), QLoRA๋Š” ์ด ์ƒ์ˆ˜๋“ค๋งˆ์ € ๋‹ค์‹œ ํ•œ๋ฒˆ ์–‘์žํ™”ํ•˜๋Š” '์ด์ค‘ ์–‘์žํ™”โ€™๋ฅผ ํ†ตํ•ด ๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰์„ ๋”์šฑ ์ ˆ์•ฝํ•ฉ๋‹ˆ๋‹ค.
  3. ํŽ˜์ด์ง€๋“œ ์˜ตํ‹ฐ๋งˆ์ด์ €(Paged Optimizers): GPU ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ๋ถ€์กฑํ•  ๊ฒฝ์šฐ, ์˜ตํ‹ฐ๋งˆ์ด์ €์˜ ์ƒํƒœ(state)๋ฅผ CPU ๋ฉ”๋ชจ๋ฆฌ๋กœ ์˜ฎ๊ธฐ๋Š”(offload) ๊ธฐ์ˆ ์„ ์‚ฌ์šฉํ•˜์—ฌ ๋ฉ”๋ชจ๋ฆฌ ์ŠคํŒŒ์ดํฌ ํ˜„์ƒ์„ ๊ด€๋ฆฌํ•˜๊ณ  ํ•™์Šต ์•ˆ์ •์„ฑ์„ ๋†’์ž…๋‹ˆ๋‹ค.

ํ•™์Šต ๊ณผ์ •์—์„œ, ๊ณ ์ •๋œ 4๋น„ํŠธ ๊ธฐ๋ณธ ๋ชจ๋ธ ๊ฐ€์ค‘์น˜(W)๋Š” ๊ณ„์‚ฐ์ด ํ•„์š”ํ•  ๋•Œ๋งˆ๋‹ค 16๋น„ํŠธ(bfloat16)๋กœ ์—ญ์–‘์žํ™”(dequantized)๋˜์–ด LoRA ๊ฐ€์ค‘์น˜(A, B)์™€ ๊ณ„์‚ฐ๋ฉ๋‹ˆ๋‹ค. LoRA ๊ฐ€์ค‘์น˜ ์ž์ฒด๋Š” ์ผ๋ฐ˜์ ์ธ 16๋น„ํŠธ ํ˜•์‹์œผ๋กœ ํ•™์Šต๋ฉ๋‹ˆ๋‹ค.

QLoRA๊ฐ€ LoRA๋ณด๋‹ค ๋‚˜์€ ์ 

  • ํ˜์‹ ์ ์ธ ๋ฉ”๋ชจ๋ฆฌ ์ ˆ์•ฝ: 4๋น„ํŠธ ์–‘์žํ™” ๋•๋ถ„์— LoRA๋ณด๋‹ค ํ›จ์”ฌ ์ ์€ GPU ๋ฉ”๋ชจ๋ฆฌ๋กœ๋„ ๊ฑฐ๋Œ€ํ•œ ๋ชจ๋ธ์„ ํŒŒ์ธํŠœ๋‹ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, 24GB์˜ GPU ๋ฉ”๋ชจ๋ฆฌ๋กœ๋„ 65B(650์–ต) ํŒŒ๋ผ๋ฏธํ„ฐ ๋ชจ๋ธ์„ ํŠœ๋‹ํ•˜๋Š” ๊ฒƒ์ด ๊ฐ€๋Šฅํ•ด์ง‘๋‹ˆ๋‹ค.
  • ์„ฑ๋Šฅ ์œ ์ง€: ์ •๋ฐ€ํ•œ ์–‘์žํ™” ๊ธฐ๋ฒ• ๋•๋ถ„์—, 4๋น„ํŠธ๋กœ ์••์ถ•ํ–ˆ์Œ์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  16๋น„ํŠธ๋กœ ํŒŒ์ธํŠœ๋‹ํ•œ ๋ชจ๋ธ๊ณผ ๊ฑฐ์˜ ๋™๋“ฑํ•œ ์ˆ˜์ค€์˜ ์„ฑ๋Šฅ์„ ์œ ์ง€ํ•ฉ๋‹ˆ๋‹ค.
  • ์ ‘๊ทผ์„ฑ ํ–ฅ์ƒ: ๊ณ ๊ฐ€์˜ ํ•˜์ด์—”๋“œ GPU๊ฐ€ ์—†๋Š” ์—ฐ๊ตฌ์ž๋‚˜ ๊ฐœ๋ฐœ์ž๋„ ๋น„๊ต์  ์ €๋ ดํ•œ ์†Œ๋น„์ž์šฉ GPU๋กœ LLM์„ ํŒŒ์ธํŠœ๋‹ํ•  ์ˆ˜ ์žˆ๊ฒŒ ๋˜์–ด AI ๊ธฐ์ˆ ์˜ ๋ฏผ์ฃผํ™”์— ๊ธฐ์—ฌํ•ฉ๋‹ˆ๋‹ค.

IV. LoRA vs. QLoRA: ์ƒ์„ธ ๋น„๊ต ๋ถ„์„

๊ทธ๋ ‡๋‹ค๋ฉด ์–ธ์ œ LoRA๋ฅผ ์“ฐ๊ณ , ์–ธ์ œ QLoRA๋ฅผ ์จ์•ผ ํ• ๊นŒ์š”? ๋‘ ๊ธฐ์ˆ ์˜ ์žฅ๋‹จ์ ์„ ๋ช…ํ™•ํžˆ ๋น„๊ตํ•ด ๋ณด๊ฒ ์Šต๋‹ˆ๋‹ค.

๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰

๋‹จ์—ฐ QLoRA์˜ ์••์Šน์ž…๋‹ˆ๋‹ค. 4๋น„ํŠธ ์–‘์žํ™”๋Š” QLoRA์˜ ๊ฐ€์žฅ ํฐ ํŠน์ง•์ด์ž ์žฅ์ ์ž…๋‹ˆ๋‹ค. QLoRA๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด LoRA ๋Œ€๋น„ ์•ฝ 30% ์ •๋„์˜ ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ์ ˆ์•ฝํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, LoRA๋กœ 21GB์˜ ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ํ•„์š”ํ–ˆ๋‹ค๋ฉด QLoRA๋กœ๋Š” 14GB ์ •๋„๋ฉด ์ถฉ๋ถ„ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. GPU ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ์กฐ๊ธˆ ๋ชจ์ž๋ผ์„œ ํ•™์Šต์„ ์‹œ์ž‘์กฐ์ฐจ ๋ชป ํ•˜๋Š” ๋ชจ๋ธ์ด ์žˆ๋‹ค๋ฉด QLoRA๊ฐ€ ์œ ์ผํ•œ ํ•ด๊ฒฐ์ฑ…์ด ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

ํ•™์Šต ์†๋„

์—ฌ๊ธฐ์„œ๋Š” ํŠธ๋ ˆ์ด๋“œ์˜คํ”„๊ฐ€ ๋ฐœ์ƒํ•ฉ๋‹ˆ๋‹ค. QLoRA๋Š” ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ์•„๋ผ๋Š” ๋Œ€์‹ , ํ•™์Šต ์‹œ๊ฐ„์ด ๋” ์˜ค๋ž˜ ๊ฑธ๋ฆฝ๋‹ˆ๋‹ค. ๊ฐ€์ค‘์น˜๋ฅผ ๊ณ„์‚ฐํ•  ๋•Œ๋งˆ๋‹ค 4๋น„ํŠธ์—์„œ 16๋น„ํŠธ๋กœ ์—ญ์–‘์žํ™”ํ•˜๋Š” ๊ณผ์ •์ด ์ถ”๊ฐ€๋˜๊ธฐ ๋•Œ๋ฌธ์ž…๋‹ˆ๋‹ค. ๊ฒฝํ—˜์ ์œผ๋กœ QLoRA๋Š” LoRA๋ณด๋‹ค ์•ฝ 30% ์ •๋„ ํ•™์Šต ์‹œ๊ฐ„์ด ๋” ์†Œ์š”๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๋งŒ์•ฝ ์ถฉ๋ถ„ํ•œ GPU ๋ฉ”๋ชจ๋ฆฌ๋ฅผ ํ™•๋ณดํ•  ์ˆ˜ ์žˆ๊ณ , ๋น ๋ฅธ ํ•™์Šต ์†๋„๊ฐ€ ๋” ์ค‘์š”ํ•˜๋‹ค๋ฉด LoRA๊ฐ€ ๋” ๋‚˜์€ ์„ ํƒ์ผ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์„ฑ๋Šฅ (์ •ํ™•๋„)

๋†€๋ž๊ฒŒ๋„, QLoRA๋Š” ๊ทน์‹ฌํ•œ ๋ฉ”๋ชจ๋ฆฌ ์••์ถ•์—๋„ ๋ถˆ๊ตฌํ•˜๊ณ  ์„ฑ๋Šฅ ์ €ํ•˜๊ฐ€ ๊ฑฐ์˜ ์—†์Šต๋‹ˆ๋‹ค. ์—ฌ๋Ÿฌ ๋ฒค์น˜๋งˆํฌ ๊ฒฐ๊ณผ์— ๋”ฐ๋ฅด๋ฉด, QLoRA๋กœ ํŠœ๋‹ํ•œ ๋ชจ๋ธ์€ LoRA๋‚˜ ์ „์ฒด ํŒŒ์ธํŠœ๋‹ ๋ชจ๋ธ๊ณผ ๋น„๊ตํ–ˆ์„ ๋•Œ ์œ ์˜๋ฏธํ•œ ์„ฑ๋Šฅ ์ฐจ์ด๊ฐ€ ๋‚˜์ง€ ์•Š๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค. ํŠน์ • ๋ฒค์น˜๋งˆํฌ์—์„œ๋Š” ๋ฏธ์„ธํ•œ ์„ฑ๋Šฅ ํ•˜๋ฝ์ด ๊ด€์ฐฐ๋˜๊ธฐ๋„ ํ•˜์ง€๋งŒ, ๋Œ€๋ถ€๋ถ„์˜ ์‹ค์ œ ์‚ฌ์šฉ ์‚ฌ๋ก€์—์„œ๋Š” ๊ทธ ์ฐจ์ด๋ฅผ ์ฒด๊ฐํ•˜๊ธฐ ์–ด๋ ต์Šต๋‹ˆ๋‹ค.

ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ ํŠœ๋‹

LoRA์™€ QLoRA ๋ชจ๋‘ ๋น„์Šทํ•œ ํ•˜์ดํผํŒŒ๋ผ๋ฏธํ„ฐ๋ฅผ ๊ณต์œ ํ•˜๋ฉฐ, ์ด๋ฅผ ์–ด๋–ป๊ฒŒ ์„ค์ •ํ•˜๋А๋ƒ๊ฐ€ ์„ฑ๋Šฅ์— ํฐ ์˜ํ–ฅ์„ ๋ฏธ์นฉ๋‹ˆ๋‹ค.

  • ๋žญํฌ ยฎ: ํ•™์Šตํ•  ํŒŒ๋ผ๋ฏธํ„ฐ์˜ ์ˆ˜๋ฅผ ๊ฒฐ์ •ํ•ฉ๋‹ˆ๋‹ค. ๋žญํฌ๋ฅผ ๋†’์ด๋ฉด ํ‘œํ˜„๋ ฅ์€ ์ข‹์•„์งˆ ์ˆ˜ ์žˆ์ง€๋งŒ, ํŒŒ๋ผ๋ฏธํ„ฐ ์ˆ˜๊ฐ€ ๋Š˜์–ด๋‚˜๊ณ  ๊ณผ์ ํ•ฉ์˜ ์œ„ํ—˜๋„ ์ปค์ง‘๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ 8, 16, 32, 64 ๋“ฑ์˜ ๊ฐ’์„ ์‚ฌ์šฉํ•˜๋ฉฐ, โ€œ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ํ—ˆ์šฉํ•˜๋Š” ํ•œ ๊ฐ€๋Šฅํ•œ ํฌ๊ฒŒโ€ ์„ค์ •ํ•˜๋Š” ๊ฒƒ์ด ์ข‹๋‹ค๋Š” ์‹คํ—˜ ๊ฒฐ๊ณผ๋„ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์•ŒํŒŒ (alpha): LoRA์˜ ์Šค์ผ€์ผ๋ง ํŒฉํ„ฐ์ž…๋‹ˆ๋‹ค. ์ผ๋ฐ˜์ ์œผ๋กœ ์•ŒํŒŒ๋Š” ๋žญํฌ์˜ 2๋ฐฐ๋กœ ์„ค์ •ํ•˜๋Š” ๊ฒƒ์ด ๊ตญ๋ฃฐ์ฒ˜๋Ÿผ ์—ฌ๊ฒจ์ง‘๋‹ˆ๋‹ค. (์˜ˆ: r=16์ด๋ฉด alpha=32). ๋žญํฌ๋งŒ ์˜ฌ๋ฆฌ๊ณ  ์•ŒํŒŒ๋ฅผ ๊ณ ์ •ํ•˜๋ฉด ์„ฑ๋Šฅ์ด ์˜คํžˆ๋ ค ๋‚˜๋น ์งˆ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ๋Œ€์ƒ ๋ชจ๋“ˆ (target_modules): LoRA๋ฅผ ์ ์šฉํ•  ๋ ˆ์ด์–ด๋ฅผ ์ง€์ •ํ•ฉ๋‹ˆ๋‹ค. ์ „ํ†ต์ ์œผ๋กœ๋Š” ์–ดํ…์…˜ ๋ ˆ์ด์–ด์˜ query, key์—๋งŒ ์ ์šฉํ–ˆ์ง€๋งŒ, value, output ๋ฐ mlp ๋ ˆ์ด์–ด๊นŒ์ง€ ํ™•์žฅํ•˜๋ฉด ์„ฑ๋Šฅ์ด ํ–ฅ์ƒ๋˜๋Š” ๊ฒฝํ–ฅ์ด ์žˆ์Šต๋‹ˆ๋‹ค. ๊ฐ€๋Šฅํ•œ ๋ชจ๋“  ์„ ํ˜• ๋ ˆ์ด์–ด์— ์ ์šฉํ•˜๋Š” ๊ฒƒ์ด ์ข‹์€ ์„ฑ๋Šฅ์„ ๋ณด์ธ๋‹ค๋Š” ์‹คํ—˜ ๊ฒฐ๊ณผ๊ฐ€ ๋งŽ์Šต๋‹ˆ๋‹ค.
๋น„๊ต ํ•ญ๋ชฉ LoRA QLoRA ์ถ”์ฒœ ์ƒํ™ฉ
๋ฉ”๋ชจ๋ฆฌ ์‚ฌ์šฉ๋Ÿ‰ ๋†’์Œ ๋‚ฎ์Œ GPU ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ๋ถ€์กฑํ•  ๋•Œ QLoRA
ํ•™์Šต ์†๋„ ๋น ๋ฆ„ ๋А๋ฆผ ๋น ๋ฅธ ์‹คํ—˜ ๋ฐ˜๋ณต์ด ํ•„์š”ํ•  ๋•Œ LoRA
์„ฑ๋Šฅ ์šฐ์ˆ˜ ๊ฑฐ์˜ ๋™๋“ฑ ์„ฑ๋Šฅ ์ €ํ•˜๊ฐ€ ์šฐ๋ ค๋œ๋‹ค๋ฉด LoRA, ํ•˜์ง€๋งŒ ๋Œ€๋ถ€๋ถ„ QLoRA๋„ ์ถฉ๋ถ„
ํ•ต์‹ฌ ๊ธฐ์ˆ  ์ €๊ณ„์ˆ˜ ํ–‰๋ ฌ ๋ถ„ํ•ด ์ €๊ณ„์ˆ˜ ํ–‰๋ ฌ + 4๋น„ํŠธ ์–‘์žํ™” -

V. ์‹ค์ œ ์ ์šฉ ์‚ฌ๋ก€ ๋ฐ ํ™œ์šฉ

LoRA์™€ QLoRA๋Š” ๋‹ค์–‘ํ•œ ์‹ค์ œ ์‹œ๋‚˜๋ฆฌ์˜ค์—์„œ LLM์˜ ํ™œ์šฉ๋„๋ฅผ ๋†’์ด๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค.

  • ์ฑ—๋ด‡ ๊ฐœ์ธํ™”: ๊ธฐ์—…์€ ์ž์‚ฌ ๊ณ ๊ฐ ๋ฌธ์˜ ๋ฐ์ดํ„ฐ๋‚˜ ๋‚ด๋ถ€ ๋ฌธ์„œ๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ LLM์„ ํŒŒ์ธํŠœ๋‹ํ•จ์œผ๋กœ์จ, ์ž์‚ฌ ์ œํ’ˆ์— ๋Œ€ํ•ด ์ •ํ™•ํžˆ ๋‹ต๋ณ€ํ•˜๋Š” ๋งž์ถคํ˜• ์ฑ—๋ด‡์„ ๋งŒ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด ๊ณผ์ •์—์„œ QLoRA๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ๋น„๊ต์  ์ ์€ ๋น„์šฉ์œผ๋กœ๋„ ๊ณ ํ’ˆ์งˆ์˜ ์ฑ—๋ด‡ ๊ตฌ์ถ•์ด ๊ฐ€๋Šฅํ•ฉ๋‹ˆ๋‹ค.
  • ์ฝ”๋“œ ์ƒ์„ฑ ์–ด์‹œ์Šคํ„ดํŠธ: ํŠน์ • ํ”„๋กœ๊ทธ๋ž˜๋ฐ ์–ธ์–ด, ํ”„๋ ˆ์ž„์›Œํฌ, ๋˜๋Š” ํšŒ์‚ฌ ๋‚ด๋ถ€์˜ ์ฝ”๋“œ ์Šคํƒ€์ผ์— ๋งž๊ฒŒ LLM์„ ํŠœ๋‹ํ•˜์—ฌ ๊ฐœ๋ฐœ ์ƒ์‚ฐ์„ฑ์„ ๋†’์ด๋Š” ์ฝ”๋“œ ์–ด์‹œ์Šคํ„ดํŠธ๋ฅผ ๋งŒ๋“ค ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.
  • ์ฝ˜ํ…์ธ  ์ƒ์„ฑ: ํŠน์ • ์ž‘๊ฐ€์˜ ๋ฌธ์ฒด๋‚˜ ํŠน์ • ๋ธŒ๋žœ๋“œ์˜ ๋ชฉ์†Œ๋ฆฌ๋ฅผ ํ•™์Šต์‹œ์ผœ, ๊ทธ ์Šคํƒ€์ผ์— ๋งž๋Š” ๋งˆ์ผ€ํŒ… ์นดํ”ผ, ๋ธ”๋กœ๊ทธ ๊ธ€, ์ด๋ฉ”์ผ ๋“ฑ์„ ์ž๋™์œผ๋กœ ์ƒ์„ฑํ•˜๋Š” ๋ฐ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

์ €ํฌ FinanceCoreAI์—์„œ๋„ ๊ธˆ์œต ๋ถ„์•ผ์— ํŠนํ™”๋œ LLM์„ ๊ฐœ๋ฐœํ•˜๊ณ  ๊ณ ๊ฐ์‚ฌ์— ์ œ๊ณตํ•  ๋•Œ LoRA์™€ QLoRA ๊ธฐ์ˆ ์„ ์ ๊ทน์ ์œผ๋กœ ํ™œ์šฉํ•˜๊ณ  ์žˆ์Šต๋‹ˆ๋‹ค. ๋ฐฉ๋Œ€ํ•œ ๊ธˆ์œต ๋ณด๊ณ ์„œ, ๋‰ด์Šค, ๊ทœ์ œ ๋ฌธ์„œ๋ฅผ ํ•™์Šต์‹œ์ผœ ๊ธˆ์œต ์ „๋ฌธ๊ฐ€ ์ˆ˜์ค€์˜ ๋ถ„์„ ๋ฐ ์š”์•ฝ ๋Šฅ๋ ฅ์„ ๊ฐ–์ถ˜ ๋ชจ๋ธ์„ ๋งŒ๋“ค ๋•Œ, ์ „์ฒด ํŒŒ์ธํŠœ๋‹์€ ๋น„์šฉ ๋ถ€๋‹ด์ด ๋งค์šฐ ํฝ๋‹ˆ๋‹ค. ์ด๋•Œ QLoRA๋ฅผ ์‚ฌ์šฉํ•˜๋ฉด ํ•ฉ๋ฆฌ์ ์ธ ๋น„์šฉ์œผ๋กœ ๊ฐ ๊ณ ๊ฐ์‚ฌ์˜ ํŠน์ • ์š”๊ตฌ์‚ฌํ•ญ(์˜ˆ: ํŠน์ • ์ž์‚ฐ ๋ถ„์„, ๋‚ด๋ถ€ ๋ฆฌ์Šคํฌ ํ‰๊ฐ€ ๊ธฐ์ค€)์— ๋งž๋Š” ๋งž์ถคํ˜• ๋ชจ๋ธ์„ ์‹ ์†ํ•˜๊ฒŒ ์ œ๊ณตํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

๋ฏธ๋ž˜๋ฅผ ํ–ฅํ•œ ํšจ์œจ์ ์ธ ๊ฑธ์Œ

LoRA์™€ QLoRA๋Š” LLM ์‹œ๋Œ€์˜ '๊ฒŒ์ž„ ์ฒด์ธ์ €โ€™์ž…๋‹ˆ๋‹ค. ์ด ๊ธฐ์ˆ ๋“ค์€ ๋ง‰๋Œ€ํ•œ ์ปดํ“จํŒ… ์ž์›์˜ ์žฅ๋ฒฝ์„ ๋‚ฎ์ถ”์–ด, ๋” ๋งŽ์€ ๊ฐœ๋ฐœ์ž์™€ ๊ธฐ์—…์ด AI์˜ ํ˜œํƒ์„ ๋ˆ„๋ฆด ์ˆ˜ ์žˆ๋„๋ก ๋งŒ๋“ค์—ˆ์Šต๋‹ˆ๋‹ค.

  • LoRA๋Š” ์†๋„์™€ ํšจ์œจ์„ฑ ์‚ฌ์ด์˜ ํ›Œ๋ฅญํ•œ ๊ท ํ˜•์ ์„ ์ œ๊ณตํ•˜๋ฉฐ, ๋น ๋ฅธ ํ”„๋กœํ† ํƒ€์ดํ•‘๊ณผ ์‹คํ—˜์— ์ด์ƒ์ ์ž…๋‹ˆ๋‹ค.
  • QLoRA๋Š” ๋ฉ”๋ชจ๋ฆฌ ํšจ์œจ์„ฑ์„ ๊ทนํ•œ์œผ๋กœ ๋Œ์–ด์˜ฌ๋ ค, ์ œํ•œ๋œ ํ•˜๋“œ์›จ์–ด ํ™˜๊ฒฝ์—์„œ๋„ ๊ฑฐ๋Œ€ ๋ชจ๋ธ์„ ๋‹ค๋ฃฐ ์ˆ˜ ์žˆ๋Š” ๊ธธ์„ ์—ด์–ด์ฃผ์—ˆ์Šต๋‹ˆ๋‹ค.

๊ฒฐ๋ก ์ ์œผ๋กœ, GPU ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ์ถฉ๋ถ„ํ•˜๊ณ  ๋น ๋ฅธ ํ•™์Šต์ด ์šฐ์„ ์ด๋ผ๋ฉด LoRA๋ฅผ, ๋ฉ”๋ชจ๋ฆฌ๊ฐ€ ๋ถ€์กฑํ•˜๊ฑฐ๋‚˜ ๋น„์šฉ์„ ์ตœ์†Œํ™”ํ•˜๋ฉฐ ๊ณ ์„ฑ๋Šฅ์„ ์œ ์ง€ํ•˜๊ณ  ์‹ถ๋‹ค๋ฉด QLoRA๋ฅผ ์„ ํƒํ•˜๋Š” ๊ฒƒ์ด ํ˜„๋ช…ํ•œ ์ „๋žต์ž…๋‹ˆ๋‹ค.

AI ๊ธฐ์ˆ ์€ ๊ณ„์†ํ•ด์„œ ๋ฐœ์ „ํ•˜๊ณ  ์žˆ์œผ๋ฉฐ, ํŒŒ์ธํŠœ๋‹ ๊ธฐ์ˆ  ๋˜ํ•œ ๋”์šฑ ํšจ์œจ์ ์ด๊ณ  ๊ฐ•๋ ฅํ•ด์งˆ ๊ฒƒ์ž…๋‹ˆ๋‹ค. LoRA์™€ QLoRA์™€ ๊ฐ™์€ PEFT ๊ธฐ๋ฒ•์„ ์ดํ•ดํ•˜๊ณ  ํ™œ์šฉํ•˜๋Š” ๊ฒƒ์€, ๋น ๋ฅด๊ฒŒ ๋ณ€ํ™”ํ•˜๋Š” AI ์ƒํƒœ๊ณ„์—์„œ ๊ฒฝ์Ÿ๋ ฅ์„ ์œ ์ง€ํ•˜๊ณ  ํ˜์‹ ์„ ์ด๋Œ์–ด๊ฐ€๋Š” ์ค‘์š”ํ•œ ์—ด์‡ ๊ฐ€ ๋  ๊ฒƒ์ž…๋‹ˆ๋‹ค.

LoRA์™€ QLoRA: AI ๋ชจ๋ธ ํŠœ๋‹์˜ ํŒ๋„๋ฅผ ๋ฐ”๊พธ๋‹ค | devdong