airelien.dev

airelien.devL'IA pour les devs : Claude, agents, MCP, et inférence locale sur Olares One. Ce que je teste, ce que je découvre, sans hype.https://airelien.dev/Lucebox sur Olares One — Épisode 7 : Issue #187, PR #188, et 6 hooks corrigés d'un couphttps://airelien.dev/posts/lucebox-saga-07-pr-upstream/https://airelien.dev/posts/lucebox-saga-07-pr-upstream/Le bug est identifié : 6 hooks dans HAMi-core ignorent le return de cuCtxGetDevice. Le fix tient en 50 lignes. Mais pour qu'il bénéficie à toute la communauté HAMi, il faut le pousser upstream. Voilà comment ça s'est passé.Tue, 28 Apr 2026 14:00:00 GMTLucebox sur Olares One — Épisode 6 : On lit le code source de HAMi-core et on trouve 6 bugshttps://airelien.dev/posts/lucebox-saga-06-hami-source-dive/https://airelien.dev/posts/lucebox-saga-06-hami-source-dive/NO_VMM ne fix rien. Le bug `Illegal device id` revient à chaque run. Il faut lire le code de HAMi-core. Et ce qu'on trouve, c'est pas un bug — c'est un pattern systémique présent dans 6 hooks différents.Tue, 28 Apr 2026 13:30:00 GMTLucebox sur Olares One — Épisode 5 : Le runtime nous claque la porte avec un device id négatifhttps://airelien.dev/posts/lucebox-saga-05-illegal-device-id/https://airelien.dev/posts/lucebox-saga-05-illegal-device-id/Image push, pod déployé, modèles téléchargés. Tout est prêt. Et puis HAMi vGPU me balance `Illegal device id: -644371744` à chaque boot, avec un nombre random qui change à chaque run. Ça pue l'uninitialized stack à plein nez.Tue, 28 Apr 2026 13:00:00 GMTLucebox sur Olares One — Épisode 4 : Le sous-module llama-server vous remet ça 1h plus tardhttps://airelien.dev/posts/lucebox-saga-04-llama-server-rpath/https://airelien.dev/posts/lucebox-saga-04-llama-server-rpath/test_dflash compile, super. Mais pour servir en HTTP il me faut llama-server, qui se compile depuis le sous-module. Et le sous-module a sa propre invocation cmake — où j'ai oublié de remettre le -rpath-link. Et boom, rebelote 1h plus tard.Tue, 28 Apr 2026 12:30:00 GMTLucebox sur Olares One — Épisode 3 : LIBRARY_PATH n'est pas ce que vous croyezhttps://airelien.dev/posts/lucebox-saga-03-rpath-link/https://airelien.dev/posts/lucebox-saga-03-rpath-link/On a ajouté LIBRARY_PATH et un symlink libcuda.so.1, on relance 2h de compile, et ld nous balance la même erreur. Pourquoi ? Parce que LIBRARY_PATH ne résout pas les indirect dependencies. Vous avez besoin de -Wl,-rpath-link.Tue, 28 Apr 2026 12:00:00 GMTLucebox sur Olares One — Épisode 2 : 2h de compile CUDA pour 11 undefined referenceshttps://airelien.dev/posts/lucebox-saga-02-libcuda-stub/https://airelien.dev/posts/lucebox-saga-02-libcuda-stub/Premier build Docker. 2h13 de compile CUDA pour sm_120, et au moment du link, ld vous balance 11 undefined references vers cuMemCreate, cuMemMap, cuMemAddressReserve. Pourquoi ? Parce que libcuda.so.1 n'est pas là où il devrait être.Tue, 28 Apr 2026 11:30:00 GMTLucebox sur Olares One — Épisode 1 : 134 t/s sur RTX 3090, et chez moi ?https://airelien.dev/posts/lucebox-saga-01-decouverte/https://airelien.dev/posts/lucebox-saga-01-decouverte/Vous traînez sur r/LocalLLaMA et vous tombez sur un post qui annonce 134 t/s sur Qwen3.6-27B en RTX 3090 grâce à Lucebox. Évidemment, vous voulez tester sur votre Olares One. Spoiler : ça va prendre 12h de compile et 6 builds Docker. Premier épisode.Tue, 28 Apr 2026 11:00:00 GMTPourquoi j'ai pris un Olares One pour faire tourner mes LLMshttps://airelien.dev/posts/why-olares-one/https://airelien.dev/posts/why-olares-one/Le choix de la machine, en vrai. Pourquoi pas un Mac Studio, pourquoi pas un PC GPU custom, et pourquoi un Olares One a fini par gagner — vu d'un papa qui a aussi un boulot.Tue, 28 Apr 2026 10:00:00 GMTPourquoi DFlash sur Qwen3.6-27B ne tient pas sur 24 Go single GPUhttps://airelien.dev/posts/dflash-27b-24gb-impossible/https://airelien.dev/posts/dflash-27b-24gb-impossible/Trois paths testés (z-lab BF16, AEON-7 NVFP4, Lucebox). Tous demandent ≥26 Go. Math VRAM, négatifs honnêtes, ce qu'attendre pour le 24 Go.Tue, 28 Apr 2026 06:30:00 GMTGenesis sur Blackwell consumer — TurboQuant débloqué pour Qwen3.6-27B sur 24 Gohttps://airelien.dev/posts/genesis-blackwell-qwen36-turbo/https://airelien.dev/posts/genesis-blackwell-qwen36-turbo/Patches Sandermage Genesis validés sur RTX 5090M (sm_120). TurboQuant 4-bit + MTP n=3 sur Qwen3.6-27B → 60 t/s, 100K contexte, 177K tokens KV.Tue, 28 Apr 2026 06:00:00 GMTQwen3.6-27B à 85-100 t/s sur un RTX 5090 Laptop 24 Gohttps://airelien.dev/posts/qwen36-27b-blackwell-mobile/https://airelien.dev/posts/qwen36-27b-blackwell-mobile/J'ai adapté les recettes desktop 32 Go et Ampere 24 Go à un GPU Blackwell mobile 24 Go (sm_120). Image vLLM custom, AutoRound INT4, MTP n=3 — 85-100 t/s soutenus avec 75K de contexte.Sun, 26 Apr 2026 18:00:00 GMT