프롬프트에서 하네스까지 - AI 에이전틱 패턴 4년의 기록

xguru · 2026-04-08T09:46:01+09:00

2022~2026년, AI 개발 패러다임이 세 번 전환됨: Prompt Engineering → Context Engineering → Harness Engineering 각 전환은 이전 패러다임이 약속을 지키지 못한 실패에서 비롯되었으며, 엔지니어링의 엄밀함은 사라진 것이 아니라 프롬프트에서 컨텍스트로, 컨텍스트에서 하네스로 위치를 옮겼을 뿐임 [1시대] Prompt Engineering (2022~2024) "영어가 곧 프로그래밍 언어", "단계별로 생각하라" 아무리 정교한 프롬프트도 컨텍스트 윈도우에 없는 파일은 모름 [2시대] Context Engineering (2025) "어떤 말을 해야 하나"에서 "어떤 정보를 넣어야 하나"로 완벽한 컨텍스트를 구성해도, 그것을 소비하는 루프 자체가 잘못 설계되면 여전히 실패 [2.5시대] 바이브 코딩과 그 숙취 diff도 안 보고 AI 제안을 전부 수락 - 코드가 읽을 수 있는 수준을 넘어서 자라남 "LLM이 코드를 썼더라도 당신이 리뷰했다면 그건 vibe coding이 아니다" [3시대] Harness Engineering (2026~) "에이전트가 실수하면 에이전트가 아니라 하네스를 고쳐라" 에이전트 = 모델 + 하네스 Anthropic 3-에이전트 아키텍처, Ralph 패턴, Lethal Trifecta, Meta AI의 Rule of Two 2026년 현재 핵심 메트릭은 프롬프트 품질이 아니라 KV-cache hit rate(모델이 이전 계산을 재활용하는 비율)와 하네스 복잡도로 전환됨 바이브 코딩(Vibe Coding)의 숙취, 에이전트의 자기 평가 불능, 보안 취약점 등 실제 프로덕션 장벽들이 각 시대의 한계를 증명했으며, 하네스는 이 모든 문제에 대한 구조적 대응임 각 시대는 이전 시대를 대체하지 않고 포함(subsume) 하며, 프롬프트 엔지니어링은 죽은 것이 아니라 하네스 엔지니어링의 서브모듈이 되었음 하네스는 뜯어낼 수 있어야(rippable) 함 — 모델이 발전하면 기존 에러 복구 로직의 절반이 불필요해짐 엄밀함의 다음 이동 방향: Guardian Agent(실시간 감시 레이어) → 평가 엔지니어링(behavior beats benchmarks) → 지식 엔진(코드 그래프·커밋 히스토리·메모리 결합)

(bits-bytes-nn.github.io)

54P by xguru 2일전 | ★ favorite | 댓글 7개

2022~2026년, AI 개발 패러다임이 세 번 전환됨: Prompt Engineering → Context Engineering → Harness Engineering
각 전환은 이전 패러다임이 약속을 지키지 못한 실패에서 비롯되었으며, 엔지니어링의 엄밀함은 사라진 것이 아니라 프롬프트에서 컨텍스트로, 컨텍스트에서 하네스로 위치를 옮겼을 뿐임
[1시대] Prompt Engineering (2022~2024)
- "영어가 곧 프로그래밍 언어", "단계별로 생각하라"
- 아무리 정교한 프롬프트도 컨텍스트 윈도우에 없는 파일은 모름
[2시대] Context Engineering (2025)
- "어떤 말을 해야 하나"에서 "어떤 정보를 넣어야 하나"로
- 완벽한 컨텍스트를 구성해도, 그것을 소비하는 루프 자체가 잘못 설계되면 여전히 실패
[2.5시대] 바이브 코딩과 그 숙취
- diff도 안 보고 AI 제안을 전부 수락 - 코드가 읽을 수 있는 수준을 넘어서 자라남
- "LLM이 코드를 썼더라도 당신이 리뷰했다면 그건 vibe coding이 아니다"
[3시대] Harness Engineering (2026~)
- "에이전트가 실수하면 에이전트가 아니라 하네스를 고쳐라"
- 에이전트 = 모델 + 하네스
- Anthropic 3-에이전트 아키텍처, Ralph 패턴, Lethal Trifecta, Meta AI의 Rule of Two
2026년 현재 핵심 메트릭은 프롬프트 품질이 아니라 KV-cache hit rate(모델이 이전 계산을 재활용하는 비율)와 하네스 복잡도로 전환됨
바이브 코딩(Vibe Coding)의 숙취, 에이전트의 자기 평가 불능, 보안 취약점 등 실제 프로덕션 장벽들이 각 시대의 한계를 증명했으며, 하네스는 이 모든 문제에 대한 구조적 대응임
각 시대는 이전 시대를 대체하지 않고 포함(subsume) 하며, 프롬프트 엔지니어링은 죽은 것이 아니라 하네스 엔지니어링의 서브모듈이 되었음
하네스는 뜯어낼 수 있어야(rippable) 함 — 모델이 발전하면 기존 에러 복구 로직의 절반이 불필요해짐
엄밀함의 다음 이동 방향: Guardian Agent(실시간 감시 레이어) → 평가 엔지니어링(behavior beats benchmarks) → 지식 엔진(코드 그래프·커밋 히스토리·메모리 결합)