Archive
Tous les posts.
Tout ce que j'ai testé, tuné, benché ou découvert. Du plus récent au plus ancien.
-
Qwen3.6-27B sur llama.cpp upstream : +123 % gratuits avec MTP, zéro fork à maintenir
MTP arrive enfin dans llama.cpp upstream (PR #22673 par am17an, 4 mai). Bench sur Olares One RTX 5090M sm_120 : 78 t/s avec un GGUF MTP-enabled, +123% vs baseline. Pas de Lucebox, pas de Genesis, pas de fork custom permanent.
Lire → -
Lucebox sur Olares One — Épisode 9 : la PR qui annonçait +57 % et qui livre +0,2 %
Hier soir, Lucebox passait à 88,5 t/s sur Olares One et devenait le nouveau champion. Ce matin la PR #94 annonce +57 % sur RTX 4090. Si ça scale, on tape 120 t/s. Spoiler : 88,7 t/s. Sweep DDTree complet, trois hypothèses, la leçon honnête sur les benchs upstream qui ne se reproduisent pas.
Lire → -
Lucebox sur Olares One — Épisode 8 : sept jours d'attente, une lib swappée à la main, 88,5 t/s
Sept jours après ma PR #188 chez HAMi-core, toujours pas de review. La saga avait son cliffhanger — j'attendais quelqu'un d'autre. Et puis une idée stupide : compiler ma lib patchée et la swap moi-même. Trois bugs nouveaux, une nuit, et au bout du chemin Lucebox tape 88,5 t/s. Premier path llama.cpp à passer devant vLLM Turbo sur ce hardware.
Lire → -
Ma market Olares perso — 28 apps tunées pour l'Olares One, à un clic
Une market Olares custom hand-tunée pour le RTX 5090M de l'Olares One. 28 apps prêtes-à-l'emploi : llama.cpp, vLLM, DFlash, Voxtral ASR/TTS, vision, music. Comment l'ajouter à votre device en 30 secondes.
Lire → -
DFlash débloqué sur 24 Go consumer Blackwell — 80 t/s, 4 jours après le post « impossible »
Il y a quatre jours j'écrivais que DFlash sur 24 Go consumer Blackwell ne tenait pas. Le 28 avril, un dev publie un drafter quantizé. Le 30 avril, je build, je teste, je tape 0,97 t/s. Le 1er mai, après mon issue, le dev fixe en 24h. Ce soir : 80 t/s. L'histoire d'une thèse qui a tenu 72 heures.
Lire → -
Lucebox sur Olares One — Épisode 7 : six hooks HAMi corrigés upstream d'un coup
Le bug est identifié : 6 hooks dans HAMi-core ignorent le return de cuCtxGetDevice. Le fix tient en 50 lignes. Mais pour qu'il bénéficie à toute la communauté HAMi, il faut le pousser upstream. Voilà comment ça s'est passé.
Lire →