[추론 엔진 #5] LLM 앱은 코드베이스가 두 개다 | 프롬프트 엔지니어링은 개발이다

코딩이 끝났다고 생각했는데 테스트할 때마다 에러가 났습니다. 프롬프트가 비어 있었습니다. LLM 앱에서 코드보다 먼저 완성해야 하는 것, 프롬프트 엔지니어링은 개발입니다.

코딩이 끝났다고 생각했다. 그래서 테스트를 시작했다.

고쳐도 고쳐도 이상했다

에러가 계속 났다.

뭘 수정해도 다음 테스트에서 또 다른 문제가 나왔다.

코드 문제가 아닌 것 같았다.

그런데 어디가 문제인지 잡히지 않았다.

답답해서 Gemini한테 물어봤다.

에러 로그를 주고 뭐가 문제냐고 했더니, 예상치 못한 질문이 돌아왔다.

"프롬프트를 어떻게 개발하고 계세요?"

그 순간 깨달았다.

프롬프트를 앱에서 실행하면서 고치고 있었다.

API를 호출할 때마다 결과를 보고, 이상하면 프롬프트 문자열을 수정하고, 다시 실행하고. 개발 내내 그렇게 했다.

그게 문제였다.

프롬프트가 엔진인 앱은 다르다

Project B는 코드가 엔진이었다.

룰이 코드 안에 있었고, 프롬프트는 보조 역할이었다.

그래서 앱을 실행하면서 바로 테스트할 수 있었다.

Project C는 달랐다.

추론 로직이 프롬프트 안에 있었다.

사용자 입력을 어떻게 읽고,

후보를 어떻게 소거하고,

어떤 조건에서 RISK를 판정하는지

— 전부 프롬프트가 결정했다.

코드는 그 결과를 받아서 화면에 보여줄 뿐이었다.

프롬프트가 엔진인데, 엔진을 완성하지 않은 채로 코드를 짜고 있었던 것이다.

올바른 순서는 반대였다.

프롬프트를 먼저 완성하고,

그걸 코드에 붙여야 했다.

API를 호출하지 않고 AI Studio에서 시뮬레이션으로 테스트하면서.

AI Studio에서 단계별로 쪼갰다

기존 prompt.ts에는 SYSTEM_PROMPT가 하나였다.

6단계 플로우 전체가 한 덩어리 문자열 안에 들어있었다.

export const SYSTEM_PROMPT = `당신은 "탐색의 기술" 추론 엔진입니다.
6단계 (순서 엄수): RISK → 원하는 것 → 후보+교차검증 → 조건 → 확정...`

이걸 단계별로 분리했다.

각 SET마다 프롬프트를 하나씩 만들고, AI Studio에서 입력-출력 쌍을 만들어 테스트했다. 통과하면 다음으로 넘어갔다.

결과물이 이렇게 됐다.

// SET 2 — 원하는 것 (Desire Mapping)
// 테스트: Happy 2/2 ✓ Edge 4/4 ✓ 수정 1회
export const SET2_PROMPT = `...`

// SET 3 — 자동 교차검증 (Auto Elimination)
// 테스트: Happy 2/2 ✓ Edge 2/2 ✓ 수정 0회
export const SET3_PROMPT = `...`

프롬프트 위에 테스트 기록이 박혔다.

몇 번 테스트했고 몇 번 수정했는지.

코드 함수처럼 관리되기 시작했다.

프롬프트가 타입이 되는 순간이었다.

느슨한 자연어가 아니라, 입력과 출력 계약이 있는 인터페이스.

want < 2개면 need_more: true 반환, 후보 전부 탈락 시 ERROR 반환 — 엣지 케이스까지 명시된 스펙.

LLM 앱에는 코드베이스가 두 개 있다.

IDE에서 관리하는 코드,

그리고 Playground에서 개발하는 프롬프트.

이걸 몰랐기 때문에 앱에서 계속 에러를 고치고 있었다.

엔진을 완성하지 않은 채로.

프롬프트 엔지니어링은 개발이다.

다음 편에서는 프롬프트를 완성한 뒤에도 Gemini가 말을 듣지 않았던 이야기를 다룬다. 검색 결과를 주었는데 사용자 입력만 그대로 돌려줬다. 프롬프트를 세 번 고쳤다. 그래도 안 됐다. 결국 구조를 바꿨다

그리고 이 시리즈의 결과물이 궁금하신 분은 직접 체험해 보실 수 있습니다.

글에서 다룬 추론 엔진, 탐색의 기술에서 실제로 작동하고 있습니다.

2026.04.21 - [AI 빌더] - 작동하는 AX를 설계합니다 — AX Studio by gtpmore 포트폴리오

작동하는 AX를 설계합니다 — AX Studio by gtpmore 포트폴리오

AI 도입이 작동하지 않는 이유는 구조의 문제입니다. AX 컨설턴트 gtpmore 포트폴리오 — 지식 구조화(RAG), 판단 기준 알고리즘, 자율 추론 엔진 3가지 축으로 실제 업무에 작동하는 AX를 설계합니다.

gtpmore.tistory.com

저작자표시 비영리 변경금지 (새창열림)

'AI 빌더' 카테고리의 다른 글

[AI와 제대로 일하는 법 #1]AI로 만들었는데 왜 내가 더 바빠질까 \| 판단 기준 없이 시작한 대가 (0)	2026.05.07
[추론 엔진 #6] 프롬프트로 안 되면 구조를 바꿔라 \| Agentic Workflow의 실체 (0)	2026.04.28
[추론 엔진 #4] 완성된 코드를 버리기로 결정한 날 \| AI 빌더의 피벗 (0)	2026.04.25
[추론 엔진 #3] 바이브 코딩의 한계 \| Reasoning Engine을 만들다 막힌 날 (0)	2026.04.24
[추론 엔진 #2] AI에게 맡겼더니 AI가 폭주했다 \| 추론 엔진 개발자의 실패 기록 (0)	2026.04.23

AI, 어디까지 써봤고 어떻게 써야 했는지 – 구조부터 전략까지

[추론 엔진 #5] LLM 앱은 코드베이스가 두 개다 | 프롬프트 엔지니어링은 개발이다

고쳐도 고쳐도 이상했다

프롬프트가 엔진인 앱은 다르다

AI Studio에서 단계별로 쪼갰다

'AI 빌더' 카테고리의 다른 글

티스토리툴바

[추론 엔진 #5] LLM 앱은 코드베이스가 두 개다 | 프롬프트 엔지니어링은 개발이다

고쳐도 고쳐도 이상했다

프롬프트가 엔진인 앱은 다르다

AI Studio에서 단계별로 쪼갰다

'AI 빌더' 카테고리의 다른 글

'AI 빌더' Related Articles

티스토리툴바