[D66] Aandrang: Waarom de discussielijst niet in de context van een een LLM chat past

René Oudeweg roudeweg at gmail.com
Fri Dec 26 18:56:27 CET 2025


Deze lijst begon met AANDRANG:
http://www.tuxtown.net/pipermail/d66/1997-January/053990.html


Even een wc (word count) loslaten op het archief? Hoeveel tokens zou de 
totale lijst tot de INDEX cutoff date bevatten?



Categorie	Voorbeeld modellen	Contextlengte

Standaard commerciële LLM’s (top)	
GPT-4o, LLaMA 3.1	                  ~128 K tokens

High-end commerciële LLM’s	
Claude 4	                          ~200 K tokens

Ultra-lange context / enterprise	
Gemini 2.5 Pro, Qwen2.5 Turbo	          ~1 M–2 M tokens

Oudere/kleinere LLM’s	
GPT-3.5, LLaMA 2	                  ~4 K–32 K tokens




Tokens → woorden (gemiddeld)

Vuistregel (gemiddelde):

     1 token ≈ 0,75 woord
     1 woord ≈ 1,3–1,4 tokens


More information about the D66 mailing list