▲1대1 RTS 게임으로 만든 LLM 벤치마크 (yare.io)8P by levmiseri 17일전 | ★ favorite | 댓글과 토론 함께 보면 좋은 글 β JavaScript로 유닛을 제어하는 RTS 게임 MemAware – AI 에이전트가 "내가 뭘 알고 있는지"를 아는지 측정하는 벤치마크 LLM 시스템을 평가하는 방법 OneRAG - 챗봇PM이 만든, 설정 한 줄로 벡터DB/LLM 등이 교체 가능한 RAG 소스 AI 시스템 평가 방식의 약점을 밝힌 연구 인증 이메일 클릭후 다시 체크박스를 눌러주세요