Noticias de la UAM Cuajimalpa

Aarón Ramírez de la Cruz, alumno de la Unidad Cuajimalpa desarrolló programa para la detección de plagio en código fuente


Publicada en: 2015-02-15

Aarón Ramírez de la Cruz, alumno del Departamento de Tecnologías de la Información de la Unidad Cuajimalpa de la Universidad Autónoma Metropolitana, con la colaboración de la maestra Adriana Gabriela Ramírez de la Rosa y del doctor Christian Sánchez, desarrolló un programa para detectar plagio en código fuente.
 
Dicho programa consiste en identificar similitudes tanto en bloques de código como en el código completo, para poder determinar si éste ha sido reutilizado o no. En caso de encontrarla entre un programa y otro, se reporta y se le da un grado a ésta, como puede ser un nivel moderado de parecido hasta similitud en su totalidad.
 
“Lo que hicimos fue una combinación de varios aspectos que veíamos en los códigos fuentes, hicimos un método que inmediatamente identificara cuáles eran estas similitudes” comentó la maestra Ramírez de la Rosa sobre el proceso de desarrollo.
 
Este programa beneficia a los profesores de universidades que tienen materias relacionadas a la programación y posteriormente podría ayudar a la industria, donde en determinado momento se puede identificar si alguien está utilizando el código de algún software.
 
Aarón participó principalmente en la codificación del mismo con apoyo de sus profesores y participó en el concurso SOCO (SOurce COde), certamen realizado en la India y en el que el proyecto fue representado por el doctor Esaú Villatoro Tello, profesor investigador del Departamento de Tecnologías de la Información y actual responsable del Cuerpo Académico y Grupo de Investigación llamado Lenguaje y Razonamiento. Dicho concurso nace a partir del interés en detectar este tipo de fenómeno con un grupo de investigación de la Universidad Politécnica de Valencia; es la primera que se genera en este contexto y de alguna forma proporciona recursos y estándares para evaluar sistemas de este tipo.
 
El programa codificado por Aarón, surge a partir del Grupo de Investigación de Lenguaje y Razonamiento, en el cual se definen líneas como: Procesamiento Automático de Textos (PAT), en el que se estudia la extracción de la terminología de un dominio, la selección de términos para representación de textos, así como la categorización, agrupamiento, y extracción de relaciones léxico semánticas a partir de colección de textos; Representación de Conocimiento (RC), a partir del análisis de la representación por ternas SVO, OWL, o lógicas modales (epistémicas, doxásticas o temporales) se realizan aplicaciones en modelación e implementación de sistemas multiagente. De éstas se ha desarrollado principalmente PAT. Es importante señalar que PAT es parte de lo conocido como Procesamiento del Lenguaje Natural que, a su vez se considera parte del tema Big Data.