El CEO y fundador de Nymiz, Óscar Villanueva, explica que han desarrollado un ‘software’ que lo que hace es encontrar información personal en datos no estructurados como documentos Word, PDF, TXT, Excel, CSV… lo que no son bases de datos. También puede localizar esta información en bases de datos con datos estructurados y, en breve, también podremos analizar datos semiestructurados”.
Las empresas, por tanto, están adquiriendo conciencia de la importancia de proteger los datos personales de sus clientes. Sin embargo, en algunas ocasiones, uno de los principales problemas a los que se enfrentan las compañías de menor tamaño y recursos es localizar dentro de sus servidores todos los datos que puedan hacer referencia a sus clientes y que no estén ordenados, estructurados o agrupados en bases de datos. Hablamos de documentos que pueden contener información tan sensible como nombres y apellidos vinculados a números de cuentas corrientes, teléfonos o direcciones.
A la hora de buscar ese tipo de datos, la solución de Nymiz emplea herramientas de Inteligencia Artificial. “Nuestro ‘software’ encuentra ese dato, hay Inteligencia Artificial detrás entrenada para encontrar este tipo de información en diferentes contextos e idiomas. Una vez localizada la información lo que hace nuestra solución es anonimizar el dato, es decir, lo borra o lo suprime completamente con una línea negra o con asteriscos. Otra opción es la pseudoanonimización que sustituye el dato por un código aleatorio, un pseudónimo o un token. Esto permite muchas cosas: por una parte, cumplir con la Ley de Protección de Datos ya que estos documentos, una vez anonimizados, no contienen datos personales. De esta manera, la empresa puede hacer analítica de datos y ‘big data’ con la seguridad de que cuando sea atacada por un hacker, los datos que pueda sustraer no contendrán ningún tipo de información personal”, aclara Villanueva.
Además del hecho de anonimizar la información, una de las claves de la solución de Nymiz radica en que la Inteligencia Artificial es capaz de detectar de forma autónoma si una información concreta de un documento es un dato personal. Para ello utilizan herramientas de Procesamiento de Lenguaje Natural que son capaces de “enfocar esa búsqueda de datos personales como lo haría un ser humano”, según el CEO de Nymiz. “Por ejemplo, cuando el algoritmo detecta que hay dos palabras seguidas en mayúsculas, estima que es posible que se trate de un nombre y un apellido, y anonimiza esa parte. La fiabilidad o el estado del arte en este ámbito no llega al 100%, ya que hablamos de tecnologías incipientes. Con todo, el Procesamiento del Lenguaje Natural se viene utilizando desde hace tiempo y está evolucionando, por lo que el porcentaje de fallo cada vez es menor”.
Una de las claves para mejorar estos algoritmos de inteligencia artificial radica en alimentar de datos a estos sistemas y, por tanto, tener acceso a los ‘datasets’. En este sentido, desde Nymiz anuncian que han llegado “a un acuerdo con Osakidetza (la Sanidad vasca) para la anonimización de informes e historiales clínicos. Se trata de datos que no se pueden conseguir de otra manera y que nos servirán para mejorar mucho el modelo. Nosotros nunca almacenamos ningún dato personal, sino que trabajamos con un flujo de información. Trabajamos con la información, pero no la almacenamos”.
Otro hito de la solución de Nymiz es que está adaptada a diferentes idiomas, en principio castellano e inglés, pero también se emplea con muchos idiomas centroeuropeos: “Funciona muy bien con idiomas con raíces románicas, como el castellano, porque la estructura gramatical es parecida. Es posible que haya que hacer cierto refinamiento en estos idiomas para llegar al nivel del castellano e inglés. También estamos trabajando para ofrecer esta solución en euskera”.
La crisis generada por la pandemia del coronavirus ha tenido dos vertientes en la actividad de la empresa bilbaína. Por una parte, sus clientes iniciales eran todo tipo de empresas, pymes y autónomos; sin embargo, según reconoce Villanueva, “debido a la situación económica, para las pymes, ahora mismo, su prioridad no es cumplir con la Ley de Protección de Datos y anonimizar, sino sobrevivir”.
Por otro lado, Nymiz ha nacido en plena pandemia, algo que ha resultado positivo, según recalca su fundador: “Dedicándonos al ‘software’, para nosotros ha sido positivo porque desde nuestras casas hemos podido desarrollar el producto, hemos trabajado en remoto, todo ‘online’, y ahora seguimos trabajando igual. Es un paradigma diferente que ha cambiado de un año en adelante. Trabajar de esta manera te permite ser más flexible, tener menos costes y ser más productivos”.
De cara al futuro, esta ‘startup’ que ya forma parte del ecosistema del Basque Cybersecurity Centre impulsado por la Agencia vasca de desarrollo empresarial (SPRI), se marca como retos aprovechar todas las oportunidades que van a suponer las ayudas europeas, nacionales y regionales para incentivar medidas para la protección de datos de las empresas y las administraciones, es decir, apuntan al Plan de Recuperación, Transición y Resiliencia de Moncloa.
El Gobierno vasco impulsa la ciberseguridad en las empresas vascas a través de la generación de un tejido económico sobre a esta materia, articulado en torno al Basque Cibersecurity Center.