▲10억 매개변수 LLM 실행에 전구용 13와트 전력이면 충분 (arxiv.org)1P by flypeace 2024-07-13 | ★ favorite | 댓글과 토론 https://news.ucsc.edu/2024/06/matmul-free-llm.html matmul free 알고리즘 + 전용 fpga로 효율 극대화 함께 보면 좋은 글 β 동적 길이 부동소수를 통한 효율적인 GPU 추론을 위한 무손실 LLM 압축 LLM을 칩 위에 ‘인쇄’하는 Taalas의 방식 LLM 함수 호출은 확장되지 않는다; 코드 오케스트레이션이 더 간단하고 효과적임 LLM-Wiki - LLM을 활용하여 개인 지식저장소 구축 하기 PonderTTT - TTT 기반 적응형 연산 할당 인증 이메일 클릭후 다시 체크박스를 눌러주세요