Textminingstructuring unstructured data

Textmining beidt u de mogelijkheid om snel door heel veel gigabytes aan documenten te scannen en automatisch informatie uit deze teksten te halen. Deze 'features' kunnen worden gebruikt bij het classificeren van documenten, of hoe een document lijkt op andere documenten. Dit gebeurt meestal aan de hand van een aantal voorbeelden die handmatig van een label zijn voorzien. Maar het is ook mogelijk het systeem te laten leren welk document in welke klasse hoort (denk aan uw spam filter dat 95% van uw mail als spam klassificeert en u maar 5% van de email die aan u wordt gestuurd daadwerkelijk laat lezen in uw inbox). 

Textmining kan ook worden gebruikt om automatisch te analyseren waar een document/blog/tweet over gaat. Op basis daarvan kunt u efficienter beslissingen nemen wat u met een document moet/kunt doen. Dit type textmining wordt intensief gebruikt in social media analytics en competitive intelligence

Webmining; op het web zijn ontelbaar veel bronnen van tekst en andere ongestructureerde content te vinden. Deze gegevens worden steeds meer gezien als interesante bronnen voor Competitive en Collective Intelligence.

Er zijn oneindig veel toepassingsmogelijkheden! Wilt u daar eens over praten? Dat kan! Neem contact op met onze textmining expert Hugo Koopmans [m] 06 43106780 [e] hugo.koopmans@dikw.com