레드추파

Detailed close up image of a vintage analog weighi

Lumen 사이드 9편 – 측정-주도 의사결정, 직관 11번 중 8번이 틀린 이유

사이드 6주 동안 가설 11번 세웠는데 그중 8번이 측정으로 부정. 그 패턴이 어떤 모양이고 왜 그게 사이드의 본질인지. 50줄 마이크로벤치가 1주일 디버깅을 1시간으로 줄인 사례, prefill batching이 2.9배 회귀였던 충격까지.

Lumen 사이드 9편 – 측정-주도 의사결정, 직관 11번 중 8번이 틀린 이유 게시물 읽기"

A close up view of an industrial manifold with pre

Lumen 사이드 8편 – 8 코어인데 8배가 아닌 이유, 메모리 대역폭의 벽

8 코어 CPU에서 8 스레드 가속이 8배가 아닌 1.5배 정도밖에 안 나오는 이유. 메모리 대역폭이 코어 수와 무관한 하드웨어 한계라서. 한 우물에서 8명이 물 긷기 비유로 풀어봅니다. atomic counter 패턴이 mutex보다 빠른 이유까지.

Lumen 사이드 8편 – 8 코어인데 8배가 아닌 이유, 메모리 대역폭의 벽 게시물 읽기"

Colorful abstract pattern with pastel blue and pin

Lumen 사이드 6편 – 양자화, 32비트를 8비트로 줄여도 답이 같은 이유

모델 weight를 32비트 float에서 8비트 정수로 압축하면 메모리 4배 줄어드는데 답이 거의 똑같은 게 어떻게 가능한지. Q8과 Q4의 차이, fused matmul, VNNI 명령어까지. mm 단위 청사진을 cm 단위로 단순화해도 시공 결과는 같다는 비유로 풀어봅니다.

Lumen 사이드 6편 – 양자화, 32비트를 8비트로 줄여도 답이 같은 이유 게시물 읽기"

위로 스크롤