1P by sbyoun 19시간전 | ★ favorite | 댓글과 토론

AI 투자, 다들 관심 있지 않나요

X나 쓰레드를 보면 AI로 투자해본 경험을 공유하는 글이 정말 많습니다. 코딩 에이전트한테 시키면 투자 전략도 딸깍 만들어주고, 돌려볼 수도 있고요. 아마 처음에는 대부분 AI 한테 종목을 골라달라고 하는 것부터 시작할 것 같습니다.

근데 이 방식에는 구조적인 한계가 있습니다. AI 판단 기반 투자는 과학적 검증이 어렵습니다. AI는 과거 데이터를 이미 학습한 상태이기 때문에, "2020년 3월 시점의 뉴스를 보고 종목을 골라봐"라고 시켜도 의미가 없습니다 — 이미 결과를 알고 있으니까요. 결국 라이브로 돌리면서 실제 수익을 추적하는 수밖에 없고, 사전에 수익을 가늠할 방법이 없습니다.

이걸 깨닫고 나면 자연스럽게 퀀트 방식 — 팩터 기반 스크리닝, 데이터 기반 백테스트 — 으로 관심이 갑니다. 진지하게 투자를 체계화하려면 이게 정석이라고 생각합니다.

근데 데이터가 생각보다 어렵습니다

퀀트 투자를 하려면 데이터가 필요합니다. 한국 시장 일봉, 재무제표, 수급 데이터를 10년치 이상 갖고 있어야 백테스트가 의미가 있습니다. 물론 코딩 에이전트 시키면 수집도 해주긴 합니다. 근데 공짜로 일회성으로 가져오는 건 생각보다 한계가 있습니다. API 호출 제한, 데이터 정합성, 상폐 종목 처리 같은 것들을 다 감안하면 꽤 손이 갑니다.

거기에 백테스트 엔진, 스케줄 잡으로 매일 돌리기, 알림, 나중에 자동 매매까지 연결하려면 할 일이 꽤 많습니다.

그래서 이 환경을 미리 구축해두고, 자연어로 쉽게 쓸 수 있게 만들어본 게 FoldAlpha입니다.

이런 것들을 할 수 있습니다

  • 자연어 백테스트: "PBR 0.5 이하, 영업이익률 10% 이상 종목으로 분기 리밸런싱" 같은 전략을 자연어로 정의하면, 에이전트가 SQL로 변환해서 10년치 백테스트를 돌립니다. CAGR, MDD, Sharpe Ratio, 코스피 대비 초과수익까지 자동 계산됩니다.
  • 스케줄 잡 + 텔레그램 알림: "매일 아침 9시에 급등 가능성 있는 종목 분석해줘" 같은 조건을 등록하면, 매일 자동으로 실행되고 결과를 텔레그램으로 보내줍니다.
  • 금융 데이터 질의응답: 자연어로 재무제표, 주가, 수급 데이터를 조회하고 분석할 수 있습니다.

저도 이 데이터로 한국, 미국 시장에서 월단위·분기단위로 종목 선정, 리밸런싱하면서 실제 투자하고 있습니다. 수익률이 엄청나다고는 못 하지만, 개인이 할 수 있는 가장 논리적이고 객관적인 방법이라고 생각합니다.

AI 추천 투자도 당연히 가능합니다

뉴스, 실적 보고, "HBM 밸류체인 수혜주", "트럼프 관세 수혜주" — 주변에서도 거의 다 이렇게 투자합니다.

이것도 당연히 할 수 있습니다. 스케줄 잡으로 "매일 오늘의 급등 가능 종목을 뉴스 기반으로 분석해줘"를 등록해두면, 에이전트가 실시간 뉴스를 검색·분석해서 매일 추천하고, 다음 날 실제로 올랐는지 추적할 수 있습니다. 지금 이 시나리오를 라이브로 돌리면서 결과를 쌓고 있습니다.

지금은 라이브 추천 결과를 좀 더 관찰한 다음에, 여기에 자동 매매까지 연결하는 걸 다음 단계로 생각하고 있습니다. 한국투자증권 API 기준으로 초기 세팅이 좀 복잡하긴 한데, 키 등록만 해주면 매매 거는 것 자체는 어렵지 않을 것 같습니다.

뉴스 기반 전략 투자도 과학적으로 접근하려면 뉴스 아카이브 구축이 필요한데, 과거 뉴스를 소급해서 수집하는 건 블룸버그도 쉽지 않은 과제일거 같습니다. 장기적으로 풀어나가려고 합니다.

어떻게 만들었나

당연히 바이브 코딩으로 만들었습니다. Claude Code, Codex, Cursor를 다양하게 쓰고 있습니다. 다만 바이브 코딩으로 다 만드는 게 "딸깍"은 아닙니다. 특히 LLM 에이전트 런타임 — 하네스를 만드는 부분은 꽤 깊이 들어가야 했습니다.

처음에 바이브 코딩이 만들어낸 에이전트는 intent classifier + 9개 도구의 복잡한 파이프라인이었는데, 레이턴시도 느리고 확장이 안 됐습니다. 최근 공개된 Claude Code, Codex CLI 같은 코딩 에이전트들의 아키텍처를 분석해서, LLM이 매 스텝마다 직접 판단하는 single-loop 경량 구조로 새로 설계했더니 레이턴시가 2배 이상 줄었습니다. 이 과정을 테크니컬 리포트로 작성했고, 런타임 코드도 오픈소스로 공개했습니다.

기술 스택:

  • 프론트엔드: Next.js (Vercel)
  • 백엔드: Fastify (Node.js)
  • LLM 에이전트 런타임: Python, 자체 구현 — single-loop 에이전트 패턴
  • 주식 데이터 DB: Oracle Autonomous DB (한국 시장 일봉, 재무, 수급 10년치)
  • 사용자 데이터: Supabase (PostgreSQL)
  • 뉴스 검색: Brave Search API
  • LLM: Gemini / GPT / Claude (BYOK — 사용자가 자기 API 키 사용)

인프라: 전부 무료 티어

  • Vercel: 프론트엔드 호스팅
  • Supabase: 사용자 DB + 인증
  • Oracle ADB: 주식 데이터 DB (Always Free)
  • Oracle Cloud: VM 인스턴스 1대 — 운영/개발 서버 둘 다 여기서 돌리고 있습니다
  • Cloudflare: 도메인 + CDN

유일한 비용은 도메인 구입비입니다. 운영과 개발을 한 인스턴스에서 포트만 나눠서 돌리고 있습니다.

링크

피드백 환영합니다.