Wat is WebSailor?
Op 11 juli heeft Alibaba’s Tongyi Lab WebSailor gelanceerd, een open-sourceplatform dat de grenzen verlegt van wat AI-agenten online kunnen doen. In een ruimte die lange tijd werd gedomineerd door gesloten systemen als DeepResearch en Doubao, laat WebSailor zien dat open source kan concurreren (en zelfs voorop kan lopen) als het gaat om geavanceerde webredeneringen.
In de basis helpt WebSailor AI-agenten iets heel moeilijks te doen: rommelige, dubbelzinnige en onzekere informatie van internet begrijpen. Om agenten voor deze uitdaging op te leiden, heeft het team taken gemaakt die de complexiteit uit de echte wereld simuleren, waarbij gestructureerde steekproeven, slimme informatieversluiering en een aangepaste leermethode voor versterking worden gecombineerd, genaamd DUPO (Duplicate Sampling Policy Optimization). Het resultaat zijn agenten die strategischer denken, efficiënter zoeken en problemen oplossen die zelfs ervaren mensen zouden overrompelen.
Hoe verhoudt WebSailor zich?
De modellen van WebSailor, variërend van 3B tot 72B parameters, hebben uitzonderlijk goed gepresteerd op moeilijke benchmarks zoals BrowseComp-en/zh. Sterker nog, de grootste WebSailor-modellen concurreert nu met de beste propriëtaire systemen of verslaan deze zelfs. Dat is van groot belang voor iedereen die AI-tools bouwt die verder moeten gaan dan het beantwoorden van fundamentele vragen. Namelijk richting het terrein van diepgaand onderzoek, synthese en besluitvorming in de echte wereld.

Nog indrukwekkender is dat WebSailor niet alleen goed is in moeilijke taken. Het houdt ook stand op eenvoudigere benchmarks. Dit bewijst dat de trainingsaanpak algemene vaardigheden opbouwt, en niet alleen trucs voor specifieke tests.
Voor onderzoekers, ontwikkelaars en bedrijven die geïnteresseerd zijn in het bouwen van capabele en transparante AI-systemen, biedt WebSailor een krachtige en gratis beschikbare basis. Je kan dieper in de materia duiken met de recente paper over arXiv, of het project verkennen op GitHub: Alibaba-NLP/WebAgent.