Skip to content
/ airelien.dev
Go back
Aurélien AMSELLEM

Ma market Olares perso — 28 apps tunées pour l'Olares One, à un clic

Une market Olares custom hand-tunée pour le RTX 5090M de l'Olares One. 28 apps prêtes-à-l'emploi : llama.cpp, vLLM, DFlash, Voxtral ASR/TTS, vision, music. Comment l'ajouter à votre device en 30 secondes.

Salut les amis !

Vous venez d’avoir votre Olares One (ou vous y pensez), et vous vous demandez pourquoi je passe mes soirées à publier des chiffres « 88 t/s », « 184 t/s », « 80 t/s avec DFlash » sur ce blog. Eh bien, toutes ces configs vivent dans une market Olares perso que vous pouvez ajouter à votre device en 30 secondes. Aujourd’hui je vous montre comment, et je vous présente les 28 apps qui sont dedans.

C’est quoi cette market

L’Olares Market officielle, c’est beclab/apps — le catalogue par défaut intégré à votre device, plein d’apps génériques pour tous les Olares.

Sauf que le One a un GPU pas comme les autres : RTX 5090 Laptop, 24 Go GDDR7, sm_120 Blackwell consumer. Et toutes les apps génériques laissent énormément de perf sur la table parce qu’elles ciblent du Ampere ou du Ada par défaut.

Du coup j’ai fait la mienne : orales-one-market. C’est aussi un market source officiel d’Olares (même API, même protocole), mais chaque app a été hand-tunée pour le 5090M : Hadamard rotation (TurboQuant), KV cache q4_0 pour doubler le contexte, sm_120 native, NO_VMM quand HAMi cogne, vLLM avec speculative decoding configuré. Bref, ce que je publie sur le blog tourne en prod chez moi avec ces apps-là.

Comment l’ajouter

Trois étapes, vraiment :

  1. Ouvrez Olares Market sur votre device
  2. Allez dans Settings → Add Source
  3. Collez cette URL :
https://orales-one-market.aamsellem.workers.dev

C’est tout. La market sync toutes les 5 minutes ; les apps apparaissent dans le store à côté du catalogue officiel. Vous installez celles que vous voulez, elles tournent dans votre cluster Kubernetes Olares isolé du reste, et c’est terminé.

Les 28 apps en un coup d’œil

Inférence LLM via llama.cpp (texte)

Toutes en b8667 + TurboQuant (Hadamard rotation) + KV cache q4_0 :

Vision via llama.cpp

DFlash speculative decoding

Inférence LLM via vLLM

EXL3 / TabbyAPI

Voice / Audio (ASR + TTS)

Créatif / Music

Pourquoi je tiens un fork plutôt que de pusher tout upstream

Parce que la market officielle vise tous les Olares (mini, pro, One). Les configs y sont nécessairement génériques. Sur le One, ça laisse 30-50 % de t/s sur la table par rapport à un tuning sm_120-spécifique. Je tiens donc ma market en parallèle pour ceux qui veulent le max, et je continue à contribuer upstream sur beclab/apps quand c’est pertinent (je suis d’ailleurs le seul contributeur externe sur ce repo).

TL;DR

URL à ajouter dans Olares Market → Settings → Add Source :

https://orales-one-market.aamsellem.workers.dev

28 apps prêtes-à-l’emploi, hand-tunées pour le 5090M de l’Olares One. Sync toutes les 5 min, mises à jour quand je tune une nouvelle config. Si ça vous fait gagner un week-end de bench, mission accomplie.

À très vite !


Disclosure — Si vous n’avez pas encore d’Olares One et que ce que vous voyez ici vous donne envie, commander via ce lien de parrainage vous donne 400 $ de réduction (3 599 $ au lieu de 3 999 $) et me rapporte 200 $. Je le mentionne par transparence — et oui, accessoirement, ça aide à faire vivre le blog (hébergement, domaine, et le temps que je passe à écrire ici). Lien valable jusqu’à fin juin 2026 environ.

Share this post on:

Commentaires