
Kun je AI vertrouwen voor juridisch werk?
ICTRecht onderzocht vier bekende AI-systemen in zowel hun gratis als betaalde versies: ChatGPT, Claude, Copilot en Gemini.
Je kunt AI-systemen vertrouwen voor verkennend juridisch werk.
Het onderzoek laat zien dat AI (in de betaalde versie van de onderzochte diensten) uitstekend kan functioneren als eerste verkenning van een rechtsvraag of bij het structureren van juridische informatie - denk aan het opstellen van een checklist voor due diligence of het categoriseren van contractbepalingen. Inzet vraagt wel om strikte kaders: élke bronverwijzing moet worden geverifieerd, niet steekproefsgewijs maar systematisch. AI-gebruik moet worden ingebed in bredere werkprocessen met expliciete controlemomenten.
Claude en ChatGPT gaan aan kop bij juridische AI, maar alleen in hun betaalde versies.
Het betaalde model Claude 3.5 Sonnet komt als beste uit de test, direct gevolgd door ChatGPT 4o Plus. De gratis versies blijven daar ver bij achter. Waar de beide koplopers consistent hoge scores behalen bij complexe vragen, zien we bij Copilot en Gemini grote schommelingen in kwaliteit.
[....]