
Metadata labeling
Metadata – or in other words the data that describes the data – plays a crucial role in the accessibility and thus the retrieval of accurate and relevant data. The better the files, document types and content are classified, the faster and more accessible they are. By uniform and unambiguous metadata labeling, data can be retrieved easily, not only within an organization but also within a chain or between chains if so desired.
Manual metadata labeling of old and new data is in fact an expensive and time-consuming process. Although traditional technical aids are at hand, such as (intelligent) OCR techniques, these are of little comfort in practice. It remains, for the most part, human work.
By applying innovative language technology Content2Context has succeeded in finding a solution that can automatically carry out metadata labeling with a minimum reliability of 80%: a revolution in the area of automated metadata labeling.
Characteristics C2C solution:
- Does not look at separate words, but to the context and the interdependence between the words.
- Can give extensive feedback about why a classification is applicable, and with which degree of reliability one or more classifications are chosen.
- Has the ability to learn, allowing the classification to improve through use.
- Is flexible and can thus be revised at all times. You can put it to use immediately and benefit from all the advantages right away
Nieuwe versie C2C Anonimiseren
De nieuwe versie van de C2C-tool Anonimiseren is gereed. De grondslag voor Anonimiseren ligt in de mogelijkheid om rollen die personen spelen binnen een tekst te herkennen. Door geautomatiseerd te anonimiseren kan de privacy van natuurlijke personen beschermd worden.
Toepassing C2C-tool Anonimiseren binnen de juridische sector
Met de C2C-tool Anonimiseren is het mogelijk om in juridische teksten persoonsgegevens van natuurlijke personen als getuigen, verdachten en slachtoffers geautomatiseerd te herkennen. Vervolgens kunnen deze persoonsgegevens geanonimiseerd worden door deze te vervangen door neutrale aanduidingen als "verdachte-1" en "getuige-2". Ook is het mogelijk om de persoonsgegevens geautomatiseerd te vervangen door een pseudoniem of door de specifieke initialen van de natuurlijke persoon.
Deze specifieke juridische toepassing wordt in samenwerking met ThinkLegal onder de naam Jurisource op de markt gebracht.
Voordelen geautomatiseerd anonimiseren
- Hogere mate van efficiëntie en betrouwbaarheid in tegenstelling tot handmatig anonimiseren
- Grote hoeveelheden tekst kunnen snel geanonimiseerd worden
- Lagere kosten in vergelijking met handmatig anonimiseren
Voorbeelden uit andere sectoren
De C2C-tool Anonimiseren kan ook goed toegepast worden bij sollicitatieprocedures om gelijke uitgangspunten voor alle sollicitanten te bevorderen. Ook is er interesse vanuit de gezondheidszorg, om patiëntengegevens te anonimiseren, en op deze wijze ter beschikking te stellen voor wetenschappelijk onderzoek.
Functionaliteiten Anonimiseren
- Herkennen van persoonsnamen
- Herkennen van aan een persoon gerelateerde gegevens, zoals paspoortnummer, kenteken, etc.
- Toewijzen van een rol van deze persoon binnen de context
- Instelbaar welke rollen al dan niet dienen te worden geanonimiseerd
- Vervangen van de naam door een pseudoniem, initialen of omschrijving van de rol



