AI 학습은 리팩토링과 닮아 있다

비즈니스 로직은 사실 룰베이스드, 개발자의 리팩토링은 곧 사람이 하는 학습입니다. 머신러닝은 이 과정을 자동화·정교화한 것일 뿐입니다. 개발자와 기획자가 매일 경험하는 코딩과 AI 학습의 닮은 점을 통해, 기술과 사고를 확장하는 새로운 관점을 제공합니다.
1. NPC 이야기에서 다시 출발하기
앞선 글에서 우리는 맞고 NPC를 설계하면서 룰베이스드 → 휴리스틱 → 학습으로 이어지는 과정을 살펴봤다. 단순한 게임 규칙을 고민하다가 결국 AI의 본질과 닿게 된 셈이다. 이번 글에서는 그 과정을 현업 개발 과정과 연결해 살펴보려 한다.
이전글
2025.08.25 - [AI, 기술적인 이야기들] - 고스톱 NPC에서 배우는 AI와 학습 I
고스톱 NPC에서 배우는 AI와 학습 I
고스톱 NPC로 보는 AI의 시작고스톱 NPC를 만들면서 룰베이스 규칙, 휴리스틱 우선순위, 머신러닝과 강화학습까지 이어지는 AI 발전 단계를 쉽게 살펴봅니다. 게임 속 단순한 규칙이 어떻게 AI 사고
gtpmore.tistory.com
2. 룰베이스드 = 우리가 매일 짜는 비즈니스 로직
사실 현업 개발 과정에서 매일 다루는 비즈니스 로직도 NPC의 단순 규칙과 크게 다르지 않다. 처음에는 단순한 조건문처럼 보이지만, 자세히 보면 우리가 늘 코딩하는 규칙 체계가 곧 NPC의 규칙과 닮아 있다는 걸 알 수 있다.
예를 들어:
- 장바구니 금액이 5만 원 이상이면 배송비 무료
- 회원 등급이 Gold 이상이면 할인율 10%
- 재고가 0이면 품절 처리
이처럼 명시적인 규칙에 따라 시스템이 동작하는 것은 곧 룰베이스드 로직이다. 맞고 NPC가 "같은 달 카드가 있으면 낸다"는 규칙을 따르는 것과 본질적으로 같다. 즉, 작은 게임 규칙을 고민하는 일이 곧 우리가 매일 다루는 시스템 로직을 이해하는 일과 이어진다.
3. 리팩토링 = 사람이 하는 학습
NPC 규칙을 조금씩 수정해 가며 더 나은 플레이를 만들듯, 우리가 다루는 코드도 시간이 지나면 손질이 필요하다. 규칙은 시간이 흐르면서 낡고, 요구사항이 바뀌며, 로그에서 예외 케이스가 발견되고, 코드가 복잡해져 유지보수가 어려워진다. 이때 개발자가 하는 것이 바로 리팩토링이다.
리팩토링은 단순히 코드를 보기 좋게 다듬는 일이 아니다. 더 나은 규칙 체계로 갱신하는 과정이다. 다시 말해, 사람이 경험과 관찰을 바탕으로 판단 기준을 보정하는 것 = 학습이라고 할 수 있다.
예를 들어, 결제 로직에서 특정 카드사의 결제 오류가 자주 발생한다는 로그가 쌓였다고 하자. 개발자는 이 패턴을 관찰하고, 조건문을 추가하거나 구조를 개선해 문제를 줄인다. 이는 곧 사람이 데이터를 바탕으로 규칙을 학습해 가는 과정이다.
4. 머신러닝·딥러닝 = 자동 리팩토링의 심화
쉽게 말하면, 머신러닝은 사람이 직접 규칙을 추가하는 대신 데이터를 보면서 스스로 규칙을 수정하는 방식이다. 딥러닝은 그중에서도 훨씬 더 많은 데이터와 복잡한 패턴까지 자동으로 다룰 수 있는 확장판이라고 보면 된다.
머신러닝(ML)은 데이터를 바탕으로 규칙을 스스로 찾아내는 방식이다. 사람이 if–else로 규칙을 추가·수정하던 것을, 모델이 관찰된 데이터에 맞춰 내부 파라미터를 조정하며 자동으로 “규칙을 리팩토링”한다.
- 지도학습: 입력→정답(라벨) 데이터를 보고 예측 오차를 줄이며 규칙을 갱신한다. 예) 사기 탐지, 이탈 예측.
- 비지도학습: 정답 없이 패턴을 묶는다. 예) 고객 군집화, 이상치 탐지.
- 강화학습: 시도-보상 데이터를 통해 정책을 개선한다. 예) NPC의 고/스톱 타이밍 학습.
실무에서는 특징(Feature)을 로그에서 뽑아 주기적으로 재학습(배치)하거나, 온라인 학습으로 조금씩 갱신한다. 이는 개발자가 로그를 보고 규칙을 손보는 과정과 구조가 같다.
딥러닝(DL)은 인공 신경망을 이용해 표현학습(Representation Learning)을 수행하며, 수작업 특징 없이도 복잡한 패턴을 스스로 학습한다.
가중치를 조금씩 조정하는 방식(경사하강법)을 수천만 번 반복해 모델을 미세 조정하고, 이미지·음성·텍스트처럼 고차원 데이터를 효과적으로 다룬다. 규모가 커지면 LLM처럼 언어라는 방대한 규칙 체계까지 포괄할 수 있다.
예시로, 추천 시스템은 클릭·체류시간 같은 로그로 사용자·아이템 특징을 만들고 정기 재학습으로 모델을 갱신한다. 이는 사람이 수작업으로 룰을 고치는 것과 같은 구조지만, ML/DL은 더 정밀하고 대규모로 이를 수행한다.
5. 같은 루프 속의 사람과 기계
정리하면, 사람과 AI는 모두 같은 루프를 돈다.
규칙 정의 → 관찰/데이터 수집 → 보정(리팩토링/학습) → 재판단 → 다시 규칙 정의 …
사람은 경험과 리팩토링을 통해, 기계는 데이터와 학습을 통해 같은 루프를 반복한다. 두 주체가 서로 다른 도구를 쓰지만, 근본 구조는 동일하다.
6. 마무리 – NPC에서 딥러닝과 LLM까지
맞고 NPC에서 출발한 이야기는 결국 현업 개발 과정과 맞닿아 있다.
- 비즈니스 로직 = 룰베이스드 AI
- 리팩토링 = 사람이 하는 학습
- 머신러닝 = 자동 리팩토링
- 딥러닝 = 복잡한 패턴까지 포괄하는 대규모 자동 리팩토링
- LLM = 언어라는 가장 복잡한 규칙 체계를 학습해 리팩토링하는 모델
즉, 리팩토링은 사람이 하는 학습이고, 학습은 기계가 하는 리팩토링이다.
단순한 맞고 NPC 규칙을 고민하는 일에서 출발했지만, 어느새 딥러닝과 LLM 같은 거대한 기술의 맥락까지 연결된다.
작은 규칙을 탐구하는 과정이 곧 AI 전체의 진화를 이해하는 길로 이어진다.
실무적으로는, 예를 들어 LLM은 고객센터 로그를 요약하거나 이상 이슈를 자동 분류하는 방식으로 활용될 수 있다.
'AI, 기술적인 이야기들' 카테고리의 다른 글
| 의미를 계산하는 언어모델 — 통계적 문맥에서 의미적 문맥으로 (0) | 2025.10.18 |
|---|---|
| 문맥 이해의 진짜 정체 — GPT는 정말 ‘이해’하고 있을까? (0) | 2025.10.18 |
| 고스톱 NPC에서 배우는 AI와 학습 I (0) | 2025.08.25 |
| 딥러닝이 보는 건 숫자, 이해하는 건 관계 — MLP와 CNN을 통해 이해하는 딥러닝의 벡터 처리 방식 (0) | 2025.06.24 |
| 사람처럼 말하는 ChatGPT — 신뢰와 착각의 UX 구조 분석 (0) | 2025.06.20 |