Hoe EntrD zijn gegevensextractieproces optimaliseerde met LLM

Ontdek hoe EntrD tijd bespaart en niet alleen nauwkeuriger, maar ook verschillende soorten gegevens gelijktijdig kan extraheren, waardoor hun gegevensanonimiseringproces wordt verbeterd.

dn entrd logo
EntrD is een IT-bedrijf dat zich specialiseert in gegevensbeveiliging en privacyoplossingen, met name in de technologiesector. Hun expertise ligt in het ontwikkelen van software die een evenwicht behoudt tussen de representativiteit en betrouwbaarheid van data, terwijl tegelijkertijd wordt voldaan aan privacyvoorschriften.
Werknemers
11-50

Over EntrD

dn header entrd
EntrD, opgericht in 2014 en gevestigd in Heerenveen, Friesland, is een IT-bedrijf dat zich richt op gegevensbeveiliging en privacyoplossingen, met name in de technologiesector.
EntrD’s expertise ligt in het ontwikkelen van software die een evenwicht behoudt tussen de representativiteit en betrouwbaarheid van gegevens, terwijl het tegelijkertijd voldoet aan privacyvoorschriften.

EntrD’s Softwareoplossingen: FileFactory & DataFactory

FileFactory is EntrD’s uitgebreide Software as a Service (SaaS) platform, ontworpen om de controle van organisaties over hun documenten en bestanden te revolutioneren. Het vereenvoudigt het gegevensbeheer in bedrijven door de doorzoekbaarheid van documenten te verbeteren, het maskeren of verwijderen van gevoelige inhoud mogelijk te maken, en de juiste documentclassificatie te automatiseren. Deze functies maken FileFactory een essentieel hulpmiddel voor organisaties die efficiënte omgang met digitale documenten vereisen, zoals het vervagen van tekst in documenten, het beheren van digitale archieven en het beantwoorden van dataverzoeken door overbodige informatie te verwijderen.
DataFactory vult FileFactory aan als een geautomatiseerd gegevensmaskeringsinstrument dat persoonlijke gegevens binnen databases of applicaties snel en veilig anonimiseert. Deze oplossing is speciaal gericht op de behoefte aan GDPR-naleving en beschermt de privacy door gevoelige gegevens, zoals persoonlijke klantinformatie die aan blootstelling in een datalek kan worden onderworpen, te verbergen. Het primaire gebruik is het creëren van veilige, niet-reversibele testdatasets voor training, onderzoek en analytische doeleinden.

Het belang van Gegevensmaskering en Anonimisering

Gegevensmaskering speelt een cruciale rol bij het transformeren van gevoelige gegevens in een formaat dat bruikbaar is voor testen en analyse, zonder de privacy in gevaar te brengen. Deze methodologie zorgt ervoor dat gevoelige gegevens worden beschermd tegen ongeautoriseerde toegang, terwijl de integriteit voor praktische toepassingen behouden blijft.

De belangrijkste kenmerken van gegevensmaskering zijn:

  • Bescherming van Gevoelige Gegevens: Door echte gegevens te vervangen door fictieve maar realistische gegevens, wordt ervoor gezorgd dat gevoelige informatie niet wordt blootgesteld.
  • Gebruiksvriendelijkheid: De gemaskerde gegevens blijven functioneel en kunnen worden gebruikt voor ontwikkelings-, test- en trainingsdoeleinden zonder de veiligheid in gevaar te brengen.
  • Compliance: Helpt organisaties te voldoen aan de gegevensbeschermingsvoorschriften door ervoor te zorgen dat gevoelige gegevens niet ongepast worden gebruikt.

Documentmaskering

Documentmaskering is de praktijk van het verbergen van vertrouwelijke informatie binnen documenten om de privacy van individuen te beschermen en risico’s zoals datalekken te minimaliseren.

Deze techniek houdt in dat gevoelige details worden vervangen door fictieve of tijdelijke gegevens, waarmee de naleving van privacyvoorschriften wordt gewaarborgd en de algehele structuur en bruikbaarheid van de documenten voor samenwerking en analyse behouden blijft.

Overcoming Challenges with Innovate Solutions

dn body image entrd
EntrD heeft een belangrijke uitdaging gevonden in het proces van gegevensextractie: de beperkingen van Named Entity Recognition (NER)-technologie bij het nauwkeurig identificeren en anonimiseren van verschillende soorten gevoelige gegevens
"Onze samenwerking met DataNorth heeft geleid tot een snelle en pragmatische realisatie van een AI-classificatiesysteem. Dit stelt onze klanten in staat om sneller en gemakkelijker toegang te krijgen tot hun waardevolle gegevens."
eric entrd
Eric Hoefman
Managing Partner EntrD

Om deze uitdaging aan te pakken, is EntrD een strategisch partnerschap aangegaan met DataNorth AI om hun capaciteiten op het gebied van gegevensanonimisering en documentmaskering te verbeteren.

DataNorth AI heeft een innovatieve oplossing gecreëerd met behulp van een groot taalmodel (LLM) om de nauwkeurigheid van entiteitsextractie te verbeteren. Deze benadering omvatte een meerstapsproces:

  • OCR-technologie: Aanvankelijk converteert optische tekenherkenning (OCR)-technologie digitale documenttekst in een machineleesbaar formaat.
  • Voorbewerking: De geëxtraheerde gegevens worden vervolgens voorbewerkt om veelvoorkomende fouten te corrigeren en geschikt te formatteren voor LLM-analyse.
  • LLM-toepassing: De voorbewerkte gegevens worden geanalyseerd met behulp van LLM om persoonlijke en financiële informatie nauwkeurig te identificeren en te extraheren.
  • Nazorg: Deze fase omvat het kruisvergelijken van de door LLM-geëxtraheerde gegevens met de oorspronkelijke OCR-resultaten om consistentie en nauwkeurigheid te waarborgen.
  • Resultaatlevering: Uiteindelijk ontvangt EntrD de verwerkte gegevens, klaar voor anonimisering en verder gebruik in hun oplossingen.

Innoveren van de LLM oplossing

De verbeteringen die zijn gerealiseerd door deze samenwerking en de integratie van geavanceerde LLM-technologie stellen EntrD in staat om zijn processen voor anonimisering en documentmaskering aanzienlijk te verbeteren. Deze vooruitgang versterkt de positie van EntrD als aanbieder van geavanceerde en betrouwbare gegevensbeveiligingsoplossingen binnen de technologie-industrie.  

"Met DataNorth's resultaat gerichte aanpak, 
hebben we geavanceerde integratie van AI in korte tijd kunnen realiseren."
hielke de jong entrd
Hielke de Jong
Managing Partner EntrD

EntrD zal deelnemen aan de veertiende editie van CorporatiePlein 2024 op 12 september in Expo Houten, een evenement dat gewijd is aan de digitale transformatie van woningcorporaties. Daar krijgen ze de kans om de resultaten van de implementatie van de LLM-oplossing te presenteren.

Call me Back Form (NL)