프롬프트에서 하네스까지 - AI 에이전틱 패턴 4년의 기록
(bits-bytes-nn.github.io)- 2022~2026년, AI 개발 패러다임이 세 번 전환됨: Prompt Engineering → Context Engineering → Harness Engineering
- 각 전환은 이전 패러다임이 약속을 지키지 못한 실패에서 비롯되었으며, 엔지니어링의 엄밀함은 사라진 것이 아니라 프롬프트에서 컨텍스트로, 컨텍스트에서 하네스로 위치를 옮겼을 뿐임
-
[1시대] Prompt Engineering (2022~2024)
- "영어가 곧 프로그래밍 언어", "단계별로 생각하라"
- 아무리 정교한 프롬프트도 컨텍스트 윈도우에 없는 파일은 모름
-
[2시대] Context Engineering (2025)
- "어떤 말을 해야 하나"에서 "어떤 정보를 넣어야 하나"로
- 완벽한 컨텍스트를 구성해도, 그것을 소비하는 루프 자체가 잘못 설계되면 여전히 실패
-
[2.5시대] 바이브 코딩과 그 숙취
- diff도 안 보고 AI 제안을 전부 수락 - 코드가 읽을 수 있는 수준을 넘어서 자라남
- "LLM이 코드를 썼더라도 당신이 리뷰했다면 그건 vibe coding이 아니다"
-
[3시대] Harness Engineering (2026~)
- "에이전트가 실수하면 에이전트가 아니라 하네스를 고쳐라"
- 에이전트 = 모델 + 하네스
- Anthropic 3-에이전트 아키텍처, Ralph 패턴, Lethal Trifecta, Meta AI의 Rule of Two
- 2026년 현재 핵심 메트릭은 프롬프트 품질이 아니라 KV-cache hit rate(모델이 이전 계산을 재활용하는 비율)와 하네스 복잡도로 전환됨
- 바이브 코딩(Vibe Coding)의 숙취, 에이전트의 자기 평가 불능, 보안 취약점 등 실제 프로덕션 장벽들이 각 시대의 한계를 증명했으며, 하네스는 이 모든 문제에 대한 구조적 대응임
- 각 시대는 이전 시대를 대체하지 않고 포함(subsume) 하며, 프롬프트 엔지니어링은 죽은 것이 아니라 하네스 엔지니어링의 서브모듈이 되었음
- 하네스는 뜯어낼 수 있어야(rippable) 함 — 모델이 발전하면 기존 에러 복구 로직의 절반이 불필요해짐
- 엄밀함의 다음 이동 방향: Guardian Agent(실시간 감시 레이어) → 평가 엔지니어링(behavior beats benchmarks) → 지식 엔진(코드 그래프·커밋 히스토리·메모리 결합)
깃헙이 시장의 지배자는 아니어도 흐름의 첨단에 있다고는 생각했었습니다. 각 프로젝트의 스코프가 너무 작아서 시장에서 채용되는 비율이 낮을뿐, 종합적으로 볼 때에는 효과적인 컨셉들을 많이 만들고 있었다고 봐요. 제가 개발자라서일까요.
AWS Korea 데이터 사이언티스트인 김영민님이 몇년간의 개발 방식 변화에 대한 기록들을 잘 정리해주셨네요.
요즘 대체 뭐가 이렇게 바뀌었나요? 하는 개발자들에게 보여주기 좋은 글인거 같아요.