Tecnolecto es un grupo de lingüistas computacionales de Argentina que trabaja en el campo del Procesamiento del Lenguaje Natural, con proyectos orientados hacia el español, el inglés y el portugués. Uno de ellos es SentiLecto, el módulo de Natural Language Understanding (NLU) con capacidades de full-parsing, anaphora resolution, negation scope, NERC, co-reference chains, passive/active voice transformation, modality treatment y otras features lingüísticas que permiten el tratamiento exhaustivo y granular de enormes volúmenes de información basados en textos complejos (documentos en general, noticias, comentarios, tweets, etcétera).

Durante la Media Party 2014, SentiLecto ganó el premio de HacksLabs Challenge y, gracias a ello, podrá consolidar el proyecto con un subsidio de USD 10.000, mentoreo y armado de un producto para el ámbito del periodismo digital. Para conocer más acerca de SentiLecto, Red Innova entrevistó a Fernando Balbachan, Founder de Grupo Tecnolecto.

-¿Qué significa para la compañía que SentiLecto haya ganado el premio de HacksLabs Challenge en la Media Party 2014? ¿Qué podrán desarrollar a partir de él?

-Para nosotros, fue muy importante haber recibido el premio de HacksLabs Challenge en la Media Party 2014, donde presentamos la herramienta en un workshop dirigido a periodistas digitales. Esta presentación y el reconocimiento del premio nos permitieron validar nuestro proyecto, demostrando que la piedra filosofal del entendimiento automático de textos es viable mediante algoritmos poderosos que reproducen las operaciones cognitivas de los hablantes de una lengua para comprender texto.

GrupoTecnolecto

-¿Cómo nace SentiLecto? ¿Qué buscaban resolver y cómo podrían explicarlo a alguien sin conocimiento en el área?

SentiLecto es el primer proyecto de entendimiento exhaustivo de textos en español. Se trata del primer proyecto que encaramos a nivel comercial en el Grupo Tecnolecto. Nuestra motivación fue sistematizar las operaciones cognitivas que realizamos los lectores para entender lenguaje natural en uso: desde la representación sintáctica global de texto hasta incluso la unificación de referencias a una misma persona bajo diversas formas de presentación (nombres propios diversos, utilización de pronombres él/ella, etcétera). Una vez que logramos que la máquina entienda completamente el texto, entonces podríamos aprovechar ese entendimiento para estructurar diversas salidas, en pos de un análisis exhaustivo para el tipo de tareas que cotidianamente realizan los hablantes mediante lenguaje: identificar y analizar opiniones, hechos y más.

-¿Ya tienen un modelo de negocio definido? ¿Cuáles son sus principales clientes-usuarios?

-Nuestro modelo de negocio es ofrecer el análisis exhaustivo y totalmente automático de voluminosas fuentes de información textual a potenciales clientes: periodistas digitales, agencias de marketing digital, empresas, etcétera. Cualquiera que estuviera interesado en un reporte instantáneo de las opiniones y hechos involucrados en enormes volúmenes de información (Twitter, Facebook, noticias o incluso documentos judiciales), podría ser nuestro potencial cliente.

-¿Cuáles son los próximos pasos de SentiLecto? 

-A corto plazo, planeamos mejorar las capacidades analíticas de SentiLecto para robustecer el enfoque. También pensamos incorporar un front-end de visualización de la información que permita apreciar el trabajo de Natural Language Understanding (NLU) a través de un mapa conceptual de hechos, opiniones y entidades en juego. Más a mediano plazo, planeamos trabajar en las versiones en inglés y portugués de SentiLecto.

Fuente imagen: www.flickr.com/ramirochanes