Open-source AI bereikt een keerpunt
In 2026 is de drempel voor state-of-the-art AI ingestort. Open-source modellen bestrijken nu elk domein: tekstgeneratie, beeldcreatie, audio, programmeren en meer. Wat ooit alleen beschikbaar was via dure technische koppelingen van OpenAI of Google, is nu gratis te downloaden en op je eigen computer te draaien (Bron: MuleAI — Open-Source Models 2026).
De drie grote families die het landschap domineren: Meta’s Llama, Mistral AI en DeepSeek.
📖 Voor wie is dit artikel? Voor professionals, techneuten en nieuwsgierige lezers die willen weten welke open-source AI-modellen er bestaan en wat de verschillen zijn. Ik ga hier iets dieper op techniek dan in onze gewone nieuws-artikelen — “tokens”, “parameters” en “quantisatie” komen voor, maar elke term leg ik bij eerste gebruik uit. Ben je helemaal nieuw met AI? Begin dan met ChatGPT voor beginners voordat je je op open-source stort.
💡 Beginner-tip: “Open-source” betekent dat de modelgewichten (het “brein” van de AI) vrij beschikbaar zijn om te downloaden. Je kunt ze op je eigen computer draaien, aanpassen, en in je producten inbouwen — vaak zonder kosten.
De grote drie
Meta’s Llama 3 — De standaard
Meta’s Llama-familie is de meest gebruikte open-source LLM ter wereld. Llama 3 levert prestaties op GPT-3.5-niveau en werd getraind op circa 15 biljoen tokens — een enorme sprong ten opzichte van eerdere versies (Bron: O-mega.ai Top 10 Open Source LLMs).
| Model | Parameters | Grootte (Q4) | RAM nodig | Sterke punt |
|---|---|---|---|---|
| Llama 3 8B | 8B | ~4,7 GB | 8 GB | Beste instapmodel |
| Llama 3.1 70B | 70B | ~40 GB | 64 GB | Beste overall kwaliteit |
| Llama 3.1 405B | 405B | ~230 GB | 256+ GB | Grootste open model |
| Llama 3.3 8B | 8B | ~4,7 GB | 8 GB | Nieuwste compact model |
Licentie: Meta Llama License — commercieel gebruik toegestaan, maar met beperkingen op misbruik. Geen volledig open-source (Apache/MIT), maar breed genoeg voor de meeste toepassingen.
# Direct draaien via Ollama
ollama run llama3.3:8b # Compact, voor 8GB+ RAM
ollama run llama3.1:70b # Krachtigst, voor 64GB+ RAM
⚡ Gevorderden: De 405B-variant is beschikbaar via research partnerships en cloud platforms. Op Apple Silicon met 192 GB RAM (M2 Ultra) kun je deze draaien met Q4 quantisatie. Voor de meeste productietoepassingen is de 70B in Q4/Q5 de sweet spot.
Mistral AI — De Europese uitdager
Het Franse Mistral AI combineert open-source modellen met commerciële producten. Hun Mistral Small 3 (24B) levert prestaties vergelijkbaar met 70B-modellen — maar 3x sneller (Bron: O-mega.ai / Simon Willison Analysis). Zelf test ik Mistral graag op Europese teksten — de taalbeheersing in Frans en Duits voel ik duidelijk beter dan bij veel Amerikaanse varianten, wat op zich logisch is gezien de herkomst.
| Model | Parameters | Architectuur | Licentie | Sterke punt |
|---|---|---|---|---|
| Mistral 7B v0.3 | 7B | Dense | Apache 2.0 | Snelheid, laagdrempelig |
| Mistral Small 3 | 24B | Dense | Apache 2.0 | 70B-prestaties, 3x sneller |
| Mixtral 8x22B | 141B (39B actief) | MoE | Research | MoE-architectuur |
| Mistral Large | 123B | Dense | Commercieel | Vlaggenschip |
Opvallend: Mistral Small 3 is Apache 2.0 gelicenseerd — volledig vrij voor commercieel gebruik, aanpassen en distribueren. Dit was een bewuste stap na eerdere restrictievere licenties.
ollama run mistral # 7B - snel en compact
ollama run mistral-small:24b # 24B - beste prijs-kwaliteit
💡 Beginner-tip: Mistral is een Frans bedrijf — een zeldzaamheid in het door Amerika gedomineerde AI-landschap. Hun modellen zijn populair in Europa, mede doordat ze bewust kiezen voor open licenties die bedrijven rechtszekerheid geven.
DeepSeek — De Chinese disruptor
DeepSeek verraste de AI-wereld met hun Mixture-of-Experts (MoE) aanpak: modellen met honderden miljarden parameters die slechts een fractie activeren per token (Bron: Hivelocity — Llama vs Mistral vs DeepSeek).
| Model | Totaal parameters | Actief per token | Sterke punt |
|---|---|---|---|
| DeepSeek V3 | 671B | 37B | Extreme efficiëntie |
| DeepSeek R1 | Vergelijkbaar | ~37B | Redeneren (reasoning) |
Het innovatieve: DeepSeek V3 activeert slechts 37B parameters per token — minder dan de helft van een dense Llama 70B — ondanks dat het 10x groter is in totaal. De Multi-Head Latent Attention (MLA) techniek comprimeert het geheugengebruik met 93,3%.
De tradeoff: je hebt 256–512 GB RAM nodig om het model te laden. Dit maakt het onpraktisch voor lokaal gebruik, maar uitermate efficiënt op servers. Wie zelf wil hosten kan kijken naar GPU-cloud voor zelf hosten — onze vergelijking laat zien welke providers DeepSeek-formaten aankunnen en tegen welke uurprijzen.
⚡ Gevorderden: DeepSeek R1 (de reasoning-variant) trok bijzondere aandacht door prestaties op wiskundige redenering die GPT-4 benaderden. De MoE-architectuur maakt het theoretisch 2x sneller dan een dense 70B model bij inference, ondanks de 10x grotere totale grootte.
Meer open modellen om in de gaten te houden
| Model | Ontwikkelaar | Parameters | Licentie | Niche |
|---|---|---|---|---|
| Phi-4 14B | Microsoft | 14B | MIT | Beste kwaliteit voor grootte |
| Qwen 2.5 | Alibaba | 7B–72B | Apache 2.0 | Meertalig + code |
| Gemma 2 9B | 9B | Open | Research & creatief | |
| CodeLlama | Meta | 7B–70B | Llama License | Programmeren |
| Stable Diffusion 3 | Stability AI | N.v.t. | Open | Beeldgeneratie |
Open-source vs. closed-source in 2026
| Aspect | Open-source (Llama, Mistral) | Closed-source (GPT-5, Claude) |
|---|---|---|
| Kosten | Gratis (hardware nodig) | $0,05–$15/1M tokens |
| Privacy | ✅ Data blijft lokaal | ⚠️ Data naar cloud |
| Kwaliteit | ~GPT-4 niveau | GPT-5/Claude 4.6 niveau |
| Aanpasbaarheid | ✅ Fine-tuning, LoRA | ❌ Alleen prompting |
| Context window | 8K–128K tokens | 128K–1M tokens |
| Multimodaal | Beperkt | ✅ Volledig |
| Ondersteuning | Community | Enterprise SLA |
Waarom het ertoe doet
Open-source AI is cruciaal om drie redenen:
- Democratisering: Bedrijven en onderzoekers hoeven niet afhankelijk te zijn van twee of drie Amerikaanse aanbieders. Ook in Nederland groeit het ecosysteem — van chipmaker Axelera AI tot nieuwe LLM-startups: Nederlandse AI-startups in 2026 geeft een actueel beeld van wie er meedoet
- Data-soevereiniteit: Essentieel voor Europese bedrijven onder GDPR en de EU AI Act
- Innovatie: De open-source community bouwt sneller dan welk bedrijf ook — LoRA, quantisatie, MoE-optimalisaties en open-source modellen voor RAG komen grotendeels uit de community
💡 Beginner-tip: Wil je beginnen met open-source AI? Installeer Ollama (zie onze tutorial) en draai
ollama run llama3.3:8b. Binnen 5 minuten heb je een volledig lokale AI-assistent die vergelijkbaar is met ChatGPT van twee jaar geleden — gratis en volledig privé.