본문 바로가기

AI, 기술적인 이야기들

AI 빌더: 프롬프트로 시작해서 컨텍스트를 지나 하네스까지

프롬프트(코어), 컨텍스트(그리드), 하네스(외곽 프레임)의 3단계 진화를 형상화

LLM의 비결정성을 통제하는 '하네스 엔지니어링'의 핵심 원리와 AI 빌더에게 필요한 구조적 사고를 다룹니다. 프롬프트와 컨텍스트를 넘어, 시스템적으로 모델을 제어하는 실질적인 아키텍처 전략을 확인해 보세요.


LLM(거대언어모델) 애플리케이션 개발 패러다임이 '프롬프트' 작성에서 '소프트웨어 엔지니어링'으로 급격히 이동하고 있습니다. 

 

초기에는 모델에게 '어떻게 말할 것인가'를 고민하던 프롬프트 엔지니어링의 시대였다면,
이제는 모델이 참조할 정보를 최적화하는 컨텍스트 엔지니어링을 넘어,
모델의 거동을 구조적으로 제어하고 시스템 부품으로 통합하는
하네스 엔지니어링(Harness Engineering)이 엔터프라이즈 레벨의 핵심 역량으로 떠오르고 있습니다.

 

이 글에서는LLM의 작동 원리에 기반한 이 기술적 진화 과정과 클로드(Claude) 등의 실제 사례를 통해 하네스 엔지니어링의 본질을 깊이 있게 다룹니다.


1. 기술적 당위성: 왜 프롬프트만으로는 부족한가?

LLM을 실제 서비스에 도입하려는 개발자가 가장 먼저 부딪히는 벽은 모델의 비결정성(Non-determinism)입니다.

이는 LLM의 근본적인 원리와 연결됩니다.


Phase 1. Prompt: '확률적 완성'의 한계

초기 프롬프트 엔지니어링은 모델의 Next Token Prediction(다음 토큰 예측) 능력에 의존합니다.

개발자는 텍스트 지시어(Instruction)를 통해 모델의 확률 분포를 원하는 방향으로 유도합니다. 

 

하지만 이는 근본적으로 입력에 대해 출력이 고정되지 않는 확률론적 인터페이스입니다.
서비스 아키텍처 관점에서 이는 가장 큰 리스크(Hallucination)이며, 불안정한 시스템의 원인이 됩니다.


Phase 2. Context: 'Attention Mechanisms'의 자원 최적화

이 불안정성을 완화하고 모델에게 새로운 지식을 제공하기 위해 RAG(검색 증강 생성) 같은 컨텍스트 엔지니어링이 등장했습니다. 

이는 모델의 Attention Mechanism(어텐션 메커니즘)이 특정 데이터(참조 정보)에 집중하도록 유도하는 기술입니다.

 

하지만 컨텍스트가 길어질수록 모델은 'Lost in the Middle(중간 정보를 놓치는 현상)'을 겪거나 불필요한 노이즈까지 처리해야 하는 한계에 도달했습니다.


Phase 3. Harness: 시스템적 제어 메커니즘

결국 엔지니어들은 모델 내부로 정보를 밀어 넣는 것만으로는 충분하지 않다는 결론에 도달했습니다.

모델이 똑똑해질수록, 그 모델을 외부에서 '감싸는(Wrapping)' 물리적·논리적 제어 계층이 필요해졌습니다.

 

이것이 바로 하네스 엔지니어링입니다.


2. 하네스(Harness)와 스티어링(Steering)의 기술적 이해

하네스 엔지니어링을 이해하기 위해 '하네스'와 '스티어링'이라는 두 가지 핵심 개념을 엔지니어링 시각에서 정의합니다.

 

  • 하네스(Harness) - [구조적 궤도 설정]: 말 그대로 모델을 감싸는 '시스템적 외벽'입니다.
    모델의 입력과 출력을 소프트웨어 스키마에 가두는 역할을 합니다.
핵심 기술: Constrained Decoding (제약된 디코딩)이 대표적입니다.
예를 들어, 모델의 출력을 가로채서 특정 JSON 스키마나 프로그래밍 언어의 문법(Grammar)에 맞지 않으면 확률 분포(Logits) 자체를 조작하여 특정 토큰 생성을 강제하거나 재생성을 요청합니다.

입력의 규격(Input Schema) 강제와 출력 검증(Output Validation/Guardrails) 역시 하네스 계층에서 수행됩니다.
  • 스티어링(Steering) - [동적 조향 계층]: 하네스가 만든 아케텍처 안에서 모델이 나아갈 '방향(태도, 톤앤매너, 윤리)'을 미세하게 조정합니다.
핵심 기술: 초기에는 Few-shot이나 시스템 프롬프트를 통한 '언어적 조향'이었으나,
최근에는 Mechanistic Interpretability(기계론적 해석 가능성) 분야의 연구(예: 앤스로픽의 SAE)를 통해 모델 내부의 가중치나 특정 개념(Feature)의 활성화 패턴에 직접 영향을 주어 모델의 거동을 제어하는 고차원적 기술로 발전하고 있습니다.

 

요약: 하네스는 모델이 움직일 수 있는 '비즈니스 로직의 파이프라인(Structure)'을 만드는 것이며, 스티어링은 그 파이프라인 안에서 모델이 유지해야 할 '페르소나와 안전성(Direction)'을 제어합니다


3. 클로드(Claude) 소스코드 분석을 통한 하네스의 역할

최근 공개된 앤트로픽(Anthropic)의 클로드(Claude) 시스템 구조 및 관련 로직을 분석하면, 현대적 의미의 하네스가 어떻게 구현되는지 명확한 레퍼런스를 얻을 수 있습니다.

 

클로드 시스템 아키텍처 내에서 하네스는 다음과 같은 결정적 역할을 수행합니다.

  1. XML 태그를 활용한 입력 구조의 규격화:
    클로드는 사용자 입력을 <user_query>, <context> 등의 XML 태그 하네스로 감싸서 받습니다.
    이는 모델이 지시어와 데이터를 명확히 구분하게 만들어 Instruction Injection 공격을 방어하고, 파싱 효율을 극대화하는 하네스 설계의 정수입니다.
  2. Chain-of-Thought(CoT)의 명시적 하네싱 (Thinking Block):
    클로드는 최종 출력 전에
    <thinking> 태그를 통해 모델이 '내부 추론' 과정을 반드시 거치도록 구조적으로 강제합니다.
    이 과정은 하네스 계층에서 최종 사용자에게 노출되지 않도록 필터링되지만, 모델의 추론 논리를 인간이 정의한 구조 안에 묶어두는 강력한 제어 메커니즘입니다.

  3. Constitutional AI의 Guardrail:
    모델의 답변 생성 직후, 하네스 계층은 '윤리 가이드라인' 위반 여부를 스캔하는 별도의 검증 단계(Output Validator)를 거칩니다.
    위반 시 하네스는 사용자에게 답변을 제공하는 대신 사전에 정의된 거부 메시지를 출력하거나 답변을 재생성하도록 시스템 루트를 돌립니다.

4. 결론: 빌더에게 요구되는 역량 - '사고 구조화 능력'

프롬프트 기법이 화려해지고 SAE 같은 복잡한 물리적 제어 기술이 등장하고 있지만, 빌더가 놓치지 말아야 할 기술의 본질은 변하지 않습니다. 

 

모델이 똑똑해질수록, 그리고 그 모델을 감싸는 시스템이 정교해질수록 ’ 중요해지는 것은 그것을 설계하는 인간의 '사고 구조화 능력'입니다.

 

과거의 개발자가 주어진 스펙에 맞춰 코드를 구현하는 '구문 중심의 프로그래머'였다면
미래의 AI 빌더는 모델의 비결정성을 제어하기 위한 '논리적 하네스 설계자(Architect)'가 되어야 합니다.

 

하네스를 설계한다는 것은 단순히 코딩을 잘하는 것이 아니라,
해결해야 할 문제 도메인을 명확히 이해하고 이를 논리적인 단계(Step)로 분해하며, 발생 가능한 예외 상황을 체계적으로 정의하는 능력을 의미합니다. 

 

도구는 복잡해져도, 그 도구를 다루는 핸들은 결국 설계자의 명확한 논리 구조 위에서만 올바르게 작동하기 때문입니다.


이글에서 설명하는 개념을 실제로 보고 싶다면?

2026.04.21 - [AI 빌더] - 작동하는 AX를 설계합니다 — AX Studio by gtpmore 포트폴리오

 

작동하는 AX를 설계합니다 — AX Studio by gtpmore 포트폴리오

AI 도입이 작동하지 않는 이유는 구조의 문제입니다. AX 컨설턴트 gtpmore 포트폴리오 — 지식 구조화(RAG), 판단 기준 알고리즘, 자율 추론 엔진 3가지 축으로 실제 업무에 작동하는 AX를 설계합니다.

gtpmore.tistory.com

 


[부록] LLM 애플리케이션의 기술적 위계 구조 다이어그램

아래 다이어그램은 프롬프트(Instruction), 컨텍스트(Knowledge), 하네스(Structural Control)가 LLM 코어를 중심으로 어떻게 상호작용하며 하나의 견고한 시스템을 구성하는지를 기술적 관점에서 보여줍니다.

LLM 애플리케이션의 기술적 위계 구조'라는 제목의 상세 기술 다이어그램.