[하린다이어리] 2025년 5월 2주차: 콧물이 한 줄 잦아들고 무릎이 한 호흡 올라온 주
하린이의 2025년 5월 2주차 어린이집 한 주, 아빠가 적은 성장 일기.
오늘 한국 시장의 진짜 주인공은 코스피가 아니라 코스닥이었다. 코스피는 +0.41%로 숨을 골랐고, 코스닥은 무려 +4.99% 급등하며 시장의 무게 중심을 통째로
🕐 일일 다이제스트 2026-05-22 08:50 · 총 58건 ▣ 뉴스 (총 26건) 📰 [IT] 연합뉴스TV (11건) 고기가 당기는 이유…"장이 음식
Lumen LLM 추론 컴파일러 6주 사이드 시리즈의 입구. 1~10편 안내, 도시 건축 비유 매핑 표, 어디부터 읽어야 하는지 추천 순서. 처음 시리즈 펴는 분에게 도움 되는 정리.
사이드 마지막 편. Lumen v0.1.0(첫 토큰 ‘안녕’)에서 v0.5.0(release-tagged)까지의 6주 작업을 시간 순으로 정리. 1~2주차 인프라, 3~4주차 큰 가속, 5~6주차 부정 누적과 진단. 단일 스레드 10.3배 가속, ggml 대비 +13% 빠른 의외 결과.
사이드 6주 동안 가설 11번 세웠는데 그중 8번이 측정으로 부정. 그 패턴이 어떤 모양이고 왜 그게 사이드의 본질인지. 50줄 마이크로벤치가 1주일 디버깅을 1시간으로 줄인 사례, prefill batching이 2.9배 회귀였던 충격까지.
8 코어 CPU에서 8 스레드 가속이 8배가 아닌 1.5배 정도밖에 안 나오는 이유. 메모리 대역폭이 코어 수와 무관한 하드웨어 한계라서. 한 우물에서 8명이 물 긷기 비유로 풀어봅니다. atomic counter 패턴이 mutex보다 빠른 이유까지.
1편에서 ‘도시 24개 동’으로 풀었던 그 한 동의 내부 동작. RMSNorm, Q/K/V, RoPE, Attention, FFN의 8단계가 어떻게 흐르는지. attention은 칵테일 파티에서 한 사람 말 듣기로 잠깐 풀고 다시 건축으로 돌아옵니다.
모델 weight를 32비트 float에서 8비트 정수로 압축하면 메모리 4배 줄어드는데 답이 거의 똑같은 게 어떻게 가능한지. Q8과 Q4의 차이, fused matmul, VNNI 명령어까지. mm 단위 청사진을 cm 단위로 단순화해도 시공 결과는 같다는 비유로 풀어봅니다.