Verdieping21 februari 2026Bijgewerkt 3 juli 20268 minGevorderd

De staat van open-source AI in 2026: Llama, Mistral, DeepSeek en meer

Overzicht van open-source AI in 2026: Llama 4, Mistral, DeepSeek V3.2 en V4. Vergelijking, licenties en hardware-eisen, met de stand van mei 2026.

doorCirsten Kot · Oprichter & hoofdredacteur, Het Laatste AI Nieuws21 februari 2026

ℹ️ Update 3 juli 2026: Het huidige closed-source Claude-vlaggenschip is Opus 4.8 (sinds 28 mei 2026); dit stuk noemde eerder Opus 4.7.

Open-source AI bereikt een keerpunt

In 2026 is de drempel voor state-of-the-art AI ingestort. Open-source modellen bestrijken nu elk domein: tekstgeneratie, beeldcreatie, audio, programmeren en meer. Wat ooit alleen beschikbaar was via dure technische koppelingen van OpenAI of Google, is nu gratis te downloaden en op je eigen computer te draaien — bijvoorbeeld met Ollama (Bron: MuleAI — Open-Source Models 2026).

De drie grote families die het landschap domineren: Meta’s Llama, Mistral AI en DeepSeek.

Voor wie is dit artikel?Voor professionals, techneuten en nieuwsgierige lezers die willen weten welke open-source AI-modellen er bestaan en wat de verschillen zijn. Ik ga hier iets dieper op techniek dan in onze gewone nieuws-artikelen — “tokens”, “parameters” en “quantisatie” komen voor, maar elke term leg ik bij eerste gebruik uit. Ben je helemaal nieuw met AI? Begin dan metChatGPT voor beginnersvoordat je je op open-source stort.

Let op:dit artikel is laatst bijgewerkt op 20 mei 2026. Het landschap beweegt razendsnel — sinds de oorspronkelijke versie van februari heeft DeepSeekV3.2(eind 2025, 94,2% MMLU) enV4(Compressed Sparse Attention, KV-cache 10% van V3.2 bij 1M tokens) uitgebracht, en Meta is metLlama 4(Scout + Maverick) — multimodaal en MoE — gekomen. De grote thema’s en architectuur-uitleg in dit stuk blijven van toepassing.

Beginner-tip:“Open-source” betekent strikt gezien dat naast de modelgewichten ook trainingscode en -data open zijn. In de praktijk noemen veel mensen — en wij in dit artikel ook — modellen als Llama “open-source” terwijl ze technisch “open weight” zijn (gewichten vrij downloadbaar, code en data niet). Het belangrijkste verschil met closed-source: je kunt het model op je eigen computer draaien, fine-tunen, en in je producten inbouwen — vaak zonder kosten. De nieuwste toevoeging aan deze categorie isMiniMax M3— gelanceerd op 1 juni 2026 als eerste open-weights model dat frontier-coding, 1M context én native multimodaliteit combineert.

De grote drie

Meta’s Llama 4 — De multimodale standaard

Meta’s Llama-familie is de meest gebruikte open-weight LLM ter wereld — met meer dan 3 miljard gebruikers van afgeleide producten. Op 5 april 2025 introduceerde Meta de Llama 4 herd (Bron: Meta AI — Llama 4 announcement): de eerste natively multimodale, MoE-gebaseerde versies. Twee modellen kwamen direct uit; een derde (Behemoth) was als teacher-model in training. Per mei 2026 zijn Behemoth-gewichten nog niet publiek uitgebracht.

Model	Totaal / actief	Experts	Context	RAM-richtwaarde	Sterke punt
Llama 4 Scout	109B / 17B actief	16	10M tokens	64 GB (Q4)	Lange context op consumer-hardware
Llama 4 Maverick	~400B / 17B actief	128	1M tokens	256+ GB	Vlaggenschip-MoE
Llama 4 Behemoth	~2T / 288B actief	16	—	Cloud-only	Nog in training (mei 2026)
Llama 3.3 8B	8B dense	—	128K	8 GB	Lichtgewicht klassieker

Licentie: Meta Llama License — commercieel gebruik toegestaan, met beperkingen op misbruik en op héél grote inzet (>700M gebruikers). Geen volledig open-source (Apache/MIT), maar breed genoeg voor de meeste mkb-toepassingen.

# Direct draaien via Ollama
ollama run llama3.3:8b      # Compact, voor 8GB+ RAM
ollama run llama4-scout     # MoE, 10M context, vanaf 64GB

Gevorderden:De Maverick-variant draait niet op consumer-hardware — reken op multi-GPU server-setups of cloud. Op Apple Silicon (M3 Ultra 256 GB) kun je Llama 4 Scout draaien met Q4 quantisatie en bijna alle context-window benutten. Voor productietoepassingen waar 1M context geen vereiste is, is Llama 3.3 70B in Q4/Q5 nog steeds een prima sweet spot.

Mistral AI — De Europese uitdager

Het Franse Mistral AI combineert open-source modellen met commerciële producten. Hun Mistral Small 3 (24B) levert prestaties vergelijkbaar met 70B-modellen — maar 3x sneller (Bron: O-mega.ai / Simon Willison Analysis). Zelf test ik Mistral graag op Europese teksten — de taalbeheersing in Frans en Duits voel ik duidelijk beter dan bij veel Amerikaanse varianten, wat op zich logisch is gezien de herkomst.

Model	Parameters	Architectuur	Licentie	Sterke punt
Mistral 7B v0.3	7B	Dense	Apache 2.0	Snelheid, laagdrempelig
Mistral Small 3	24B	Dense	Apache 2.0	70B-prestaties, 3x sneller
Mixtral 8x22B	141B (39B actief)	MoE	Research	MoE-architectuur
Mistral Large	123B	Dense	Commercieel	Vlaggenschip

Opvallend: Mistral Small 3 is Apache 2.0 gelicenseerd — volledig vrij voor commercieel gebruik, aanpassen en distribueren. Dit was een bewuste stap na eerdere restrictievere licenties.

ollama run mistral           # 7B - snel en compact
ollama run mistral-small:24b # 24B - beste prijs-kwaliteit

Beginner-tip:Mistral is een Frans bedrijf — een zeldzaamheid in het door Amerika gedomineerde AI-landschap. Hun modellen zijn populair in Europa, mede doordat ze bewust kiezen voor open licenties die bedrijven rechtszekerheid geven.

DeepSeek — De Chinese disruptor die de top haalde

DeepSeek verraste de AI-wereld met hun Mixture-of-Experts (MoE) aanpak: modellen met honderden miljarden parameters die slechts een fractie activeren per token. Sinds eind 2025 is DeepSeek de top-open-source geworden — V3.2 evenaart GPT-4o op MMLU (94,2%) en haalt voorbij 80% op SWE-bench Verified, een SWE-benchmark waar veel closed-source modellen niet eens komen.

Model	Totaal / actief	Architectuur	Sterke punt
DeepSeek V3	671B / 37B	MoE + MLA	Doorbraak eind 2024
DeepSeek R1	~671B / 37B	MoE + reasoning	Wiskundig redeneren, evenaart o1
DeepSeek R1-0528	~671B / 37B	Verbeterde reasoning	Mei 2025 — 2e op AIME na o3
DeepSeek V3.2	671B / 37B	MoE + MLA + verbeterde training	Huidige top: 94,2% MMLU, ~1421 LMArena Elo
DeepSeek V4	Nieuw	MoE + CSA + HCA	KV-cache cut naar 10% van V3.2 bij 1M tokens

Het innovatieve: V4 introduceerde Compressed Sparse Attention (CSA) en Heavily Compressed Attention (HCA) — technieken die het geheugengebruik bij ultra-lange context drastisch verkleinen. Waar V3.2 al efficiënt was met Multi-Head Latent Attention (MLA, geheugen -93,3%), brengt V4 dat naar nog een orde van grootte verder bij miljoen-token gesprekken. (Bron: Codersera Open-Source LLM Landscape 2026)

De tradeoff: je hebt 256–512 GB RAM nodig om het model te laden. Dit maakt het onpraktisch voor lokaal gebruik, maar uitermate efficiënt op servers. Wie zelf wil hosten kan kijken naar GPU-cloud voor zelf hosten — onze vergelijking laat zien welke providers DeepSeek-formaten aankunnen en tegen welke uurprijzen.

Gevorderden:DeepSeek-V3 zou getraind zijn voor circa $5,6 miljoen tegenover ~$100M voor een vergelijkbare GPT-4-training. Of die cijfers zuiver vergelijkbaar zijn is een discussie op zich, maar zelfs een orde-van-grootte sneller-en-goedkoper hertraining wijst op een ander economisch model — interessant voor wie de discussie overAI-subsidie en stroomnetvolgt.

Meer open modellen om in de gaten te houden

Model	Ontwikkelaar	Parameters	Licentie	Niche
Phi-4 14B	Microsoft	14B	MIT	Beste kwaliteit voor grootte
Qwen 2.5	Alibaba	7B–72B	Apache 2.0	Meertalig + code
Gemma 2 9B	Google	9B	Open	Research & creatief
CodeLlama	Meta	7B–70B	Llama License	Programmeren
Stable Diffusion 3	Stability AI	N.v.t.	Open	Beeldgeneratie

Google’s eigen open lijn ging in juni 2026 een stap verder: Gemma 4 12B is multimodaal (tekst, beeld én audio) en draait op een laptop met 16GB geheugen, onder een Apache 2.0-licentie.

Open-source vs. closed-source in 2026

Aspect	Open-source (Llama 4, Mistral, DeepSeek V3.2/V4)	Closed-source (GPT-5.5, Claude Opus 4.8)
Kosten	Gratis (hardware nodig)	$1,25–$30/1M tokens
Privacy	✅ Data blijft lokaal	⚠️ Data naar cloud
Kwaliteit	DeepSeek V3.2 ≈ GPT-4o; Llama 4 multimodaal	GPT-5.5 / Claude Opus 4.8 nog stevig voor
Aanpasbaarheid	✅ Fine-tuning, LoRA, distillation	❌ Alleen prompting
Context window	128K–10M (Llama 4 Scout)	128K–1M tokens
Multimodaal	✅ Llama 4 (native), DeepSeek beperkt	✅ Volledig (tekst/beeld/audio)
Ondersteuning	Community	Enterprise SLA

Waarom het ertoe doet

Open-source AI is cruciaal om drie redenen:

Democratisering: Bedrijven en onderzoekers hoeven niet afhankelijk te zijn van twee of drie Amerikaanse aanbieders. Ook in Nederland groeit het ecosysteem — van chipmaker Axelera AI tot nieuwe LLM-startups: Nederlandse AI-startups in 2026 geeft een actueel beeld van wie er meedoet
Data-soevereiniteit: Essentieel voor Europese bedrijven onder GDPR en de EU AI Act; het bredere plaatje staat in sovereign AI
Innovatie: De open-source community bouwt sneller dan welk bedrijf ook — LoRA, quantisatie, MoE-optimalisaties en open-source modellen voor RAG komen grotendeels uit de community

De meest recente toevoeging aan het open-weights landschap is GLM-5.2 van het Chinese ZhipuAI: ~750 miljard parameters, volledig MIT-gelicenseerd en uitgebracht op 13 juni 2026 — direct na het Amerikaanse exportbevel op Anthropic. Waarom de timing cruciaal is en wat het betekent voor de AI-handelsoorlog lees je in onze analyse.

Een concreet recent voorbeeld: DeepSeek maakte op 22 mei 2026 z’n 75%-korting op V4-Pro permanent, draaiend op eigen Huawei Ascend-chips — niet alleen een prijsstunt maar een structurele verschuiving in wat open-source op niet-Nvidia-hardware kost.

Beginner-tip:Wil je beginnen met open-source AI? Installeer Ollama (zie onze tutorial) en draaiollama run llama3.3:8b. Binnen 5 minuten heb je een volledig lokale AI-assistent die vergelijkbaar is met ChatGPT van twee jaar geleden — gratis en volledig privé.

Deel dit artikel

Volg ons in Google

Veelgestelde vragen

Wat is het beste open-source AI-model in 2026?

Voor algemene benchmarks: DeepSeek V3.2 (sinds eind 2025) is de huidige top met 94,2% MMLU. Voor lokaal draaien op laptop: Llama 4 Scout (17B actief, 109B totaal) of Mistral Small 3 (24B). Voor redeneren: DeepSeek R1 of R1-0528 (mei 2025) draaien dichtbij OpenAI o1/o3.

Kan ik open-source AI lokaal draaien?

Ja, met tools als Ollama kun je modellen als Mistral 7B of Llama 4 Scout draaien op een laptop met 8-16 GB RAM. Grotere modellen vereisen meer geheugen: 70B-tier modellen hebben 64 GB nodig, DeepSeek V3.2/V4 vraagt 256-512 GB en is daarmee servers-only.

Is open-source AI even goed als ChatGPT?

DeepSeek V3.2 evenaart GPT-4o op MMLU (94,2%) en duwt zelfs voorbij 80% op SWE-bench Verified. GPT-5.5 (apr 2026) en Claude Opus 4.8 zijn nog sterker, vooral in agentische taken en multimodaliteit. Het verschil wordt elk kwartaal kleiner — open-source loopt nu hoogstens een halve generatie achter.

MuleAI — Open-Source Models 2026muleai.io
Meta AI — Llama 4 announcementai.meta.com
O-mega.ai / Simon Willison Analysiso-mega.ai
Codersera Open-Source LLM Landscape 2026codersera.com
Hivelocity — Llama vs Mistral vs DeepSeekhivelocity.net

Open-source AI bereikt een keerpunt

De grote drie

Meta’s Llama 4 — De multimodale standaard

Mistral AI — De Europese uitdager

DeepSeek — De Chinese disruptor die de top haalde

Meer open modellen om in de gaten te houden

Open-source vs. closed-source in 2026

Waarom het ertoe doet

Veelgestelde vragen

Lees verder

Wat is Ollama? Lokale taalmodellen draaien op je eigen computer, uitgelegd

Hoe werkt een taalmodel van binnen? De bouwblokken van ChatGPT en Claude uitgelegd

Open AI-modellen in 2026: waarom bedrijven overstappen van ChatGPT

GPT-5 is er: wat je moet weten over OpenAI's krachtigste AI