<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"><channel><title>airelien.dev</title><description>L&apos;IA pour les devs : Claude, agents, MCP, et inférence locale sur Olares One. Ce que je teste, ce que je découvre, sans hype.</description><link>https://airelien.dev/</link><item><title>Lucebox sur Olares One — Épisode 7 : Issue #187, PR #188, et 6 hooks corrigés d&apos;un coup</title><link>https://airelien.dev/posts/lucebox-saga-07-pr-upstream/</link><guid isPermaLink="true">https://airelien.dev/posts/lucebox-saga-07-pr-upstream/</guid><description>Le bug est identifié : 6 hooks dans HAMi-core ignorent le return de cuCtxGetDevice. Le fix tient en 50 lignes. Mais pour qu&apos;il bénéficie à toute la communauté HAMi, il faut le pousser upstream. Voilà comment ça s&apos;est passé.</description><pubDate>Tue, 28 Apr 2026 14:00:00 GMT</pubDate></item><item><title>Lucebox sur Olares One — Épisode 6 : On lit le code source de HAMi-core et on trouve 6 bugs</title><link>https://airelien.dev/posts/lucebox-saga-06-hami-source-dive/</link><guid isPermaLink="true">https://airelien.dev/posts/lucebox-saga-06-hami-source-dive/</guid><description>NO_VMM ne fix rien. Le bug `Illegal device id` revient à chaque run. Il faut lire le code de HAMi-core. Et ce qu&apos;on trouve, c&apos;est pas un bug — c&apos;est un pattern systémique présent dans 6 hooks différents.</description><pubDate>Tue, 28 Apr 2026 13:30:00 GMT</pubDate></item><item><title>Lucebox sur Olares One — Épisode 5 : Le runtime nous claque la porte avec un device id négatif</title><link>https://airelien.dev/posts/lucebox-saga-05-illegal-device-id/</link><guid isPermaLink="true">https://airelien.dev/posts/lucebox-saga-05-illegal-device-id/</guid><description>Image push, pod déployé, modèles téléchargés. Tout est prêt. Et puis HAMi vGPU me balance `Illegal device id: -644371744` à chaque boot, avec un nombre random qui change à chaque run. Ça pue l&apos;uninitialized stack à plein nez.</description><pubDate>Tue, 28 Apr 2026 13:00:00 GMT</pubDate></item><item><title>Lucebox sur Olares One — Épisode 4 : Le sous-module llama-server vous remet ça 1h plus tard</title><link>https://airelien.dev/posts/lucebox-saga-04-llama-server-rpath/</link><guid isPermaLink="true">https://airelien.dev/posts/lucebox-saga-04-llama-server-rpath/</guid><description>test_dflash compile, super. Mais pour servir en HTTP il me faut llama-server, qui se compile depuis le sous-module. Et le sous-module a sa propre invocation cmake — où j&apos;ai oublié de remettre le -rpath-link. Et boom, rebelote 1h plus tard.</description><pubDate>Tue, 28 Apr 2026 12:30:00 GMT</pubDate></item><item><title>Lucebox sur Olares One — Épisode 3 : LIBRARY_PATH n&apos;est pas ce que vous croyez</title><link>https://airelien.dev/posts/lucebox-saga-03-rpath-link/</link><guid isPermaLink="true">https://airelien.dev/posts/lucebox-saga-03-rpath-link/</guid><description>On a ajouté LIBRARY_PATH et un symlink libcuda.so.1, on relance 2h de compile, et ld nous balance la même erreur. Pourquoi ? Parce que LIBRARY_PATH ne résout pas les indirect dependencies. Vous avez besoin de -Wl,-rpath-link.</description><pubDate>Tue, 28 Apr 2026 12:00:00 GMT</pubDate></item><item><title>Lucebox sur Olares One — Épisode 2 : 2h de compile CUDA pour 11 undefined references</title><link>https://airelien.dev/posts/lucebox-saga-02-libcuda-stub/</link><guid isPermaLink="true">https://airelien.dev/posts/lucebox-saga-02-libcuda-stub/</guid><description>Premier build Docker. 2h13 de compile CUDA pour sm_120, et au moment du link, ld vous balance 11 undefined references vers cuMemCreate, cuMemMap, cuMemAddressReserve. Pourquoi ? Parce que libcuda.so.1 n&apos;est pas là où il devrait être.</description><pubDate>Tue, 28 Apr 2026 11:30:00 GMT</pubDate></item><item><title>Lucebox sur Olares One — Épisode 1 : 134 t/s sur RTX 3090, et chez moi ?</title><link>https://airelien.dev/posts/lucebox-saga-01-decouverte/</link><guid isPermaLink="true">https://airelien.dev/posts/lucebox-saga-01-decouverte/</guid><description>Vous traînez sur r/LocalLLaMA et vous tombez sur un post qui annonce 134 t/s sur Qwen3.6-27B en RTX 3090 grâce à Lucebox. Évidemment, vous voulez tester sur votre Olares One. Spoiler : ça va prendre 12h de compile et 6 builds Docker. Premier épisode.</description><pubDate>Tue, 28 Apr 2026 11:00:00 GMT</pubDate></item><item><title>Pourquoi j&apos;ai pris un Olares One pour faire tourner mes LLMs</title><link>https://airelien.dev/posts/why-olares-one/</link><guid isPermaLink="true">https://airelien.dev/posts/why-olares-one/</guid><description>Le choix de la machine, en vrai. Pourquoi pas un Mac Studio, pourquoi pas un PC GPU custom, et pourquoi un Olares One a fini par gagner — vu d&apos;un papa qui a aussi un boulot.</description><pubDate>Tue, 28 Apr 2026 10:00:00 GMT</pubDate></item><item><title>Pourquoi DFlash sur Qwen3.6-27B ne tient pas sur 24 Go single GPU</title><link>https://airelien.dev/posts/dflash-27b-24gb-impossible/</link><guid isPermaLink="true">https://airelien.dev/posts/dflash-27b-24gb-impossible/</guid><description>Trois paths testés (z-lab BF16, AEON-7 NVFP4, Lucebox). Tous demandent ≥26 Go. Math VRAM, négatifs honnêtes, ce qu&apos;attendre pour le 24 Go.</description><pubDate>Tue, 28 Apr 2026 06:30:00 GMT</pubDate></item><item><title>Genesis sur Blackwell consumer — TurboQuant débloqué pour Qwen3.6-27B sur 24 Go</title><link>https://airelien.dev/posts/genesis-blackwell-qwen36-turbo/</link><guid isPermaLink="true">https://airelien.dev/posts/genesis-blackwell-qwen36-turbo/</guid><description>Patches Sandermage Genesis validés sur RTX 5090M (sm_120). TurboQuant 4-bit + MTP n=3 sur Qwen3.6-27B → 60 t/s, 100K contexte, 177K tokens KV.</description><pubDate>Tue, 28 Apr 2026 06:00:00 GMT</pubDate></item><item><title>Qwen3.6-27B à 85-100 t/s sur un RTX 5090 Laptop 24 Go</title><link>https://airelien.dev/posts/qwen36-27b-blackwell-mobile/</link><guid isPermaLink="true">https://airelien.dev/posts/qwen36-27b-blackwell-mobile/</guid><description>J&apos;ai adapté les recettes desktop 32 Go et Ampere 24 Go à un GPU Blackwell mobile 24 Go (sm_120). Image vLLM custom, AutoRound INT4, MTP n=3 — 85-100 t/s soutenus avec 75K de contexte.</description><pubDate>Sun, 26 Apr 2026 18:00:00 GMT</pubDate></item></channel></rss>