Proyectos

Estos han sido algunos de los proyectos en los que he participado, si quieres colaborar contáctame…

Activos

Cenzontle

Cenzontle es una librería para identificación forense de hablantes en español, está basada en nuestro trabajo 'Triplet loss based embeddings for forensic speaker identification in Spanish', pretendemos que dicha librería permita la identificación forense de hablantes a cualquier persona en el mundo, además de brindar una plataforma estable en la cúal investigadores puedan experimentar o que directamente pueda ser usada en el marco legal.
Adicional a esto se trabaja parelelamente en la creación de un corpus basado en el Atlas Lingüístico de Lope Blanch

Rosa Espino: An Anthology of False Poetry

Vicente Riva Palacio, fue un escritor del siglo XIX que, bajo su alter ego Rosa Espino dejo algunos textos que mostraban el pensar y sentir de la sociedad mexicana de aquella época, sin embargo dada su poca relevancia en el contexto poético mexicano buscamos revalorizar a Rosa Espino reuniendo sus textos y poemas para generar nuevo poemas inéditos mediante el modelo de lenguaje GTP-2, creando así una antología de poemas falsos de un poeta falso.

Generación de Arte Artificial con GAN’s

Las redes generativas adversarias (GANs) son una técnica relativamente nueva la cuál tiene como finalidad generar nuevos datos a raíz de sus datos de entrenamiento los cuales generalmente son imágenes. Una utilidad en tendencia ha sido el llamado arte artificial siendo sus creadores los artistas digitales, artistas contemporáneos que se enfocan en la generación de nuevas obras artísticas a través de éste tipo de técnicas. ¿Cómo sería una nueva obra de Rembrandt? o ¿Cuál sería el resultado sí combináramos el estilo de arte de Monet y Frida Kahlo?. Con un aproximado podemos responder a estas preguntas alimentando el generador de una GAN con obras de Rembrandt o de Monet y Frida Kahlo y dando salida a imágenes nuevas a raíz de las iniciales.

Concluidos

Triplet loss based embeddings for forensic speaker identification in Spanish

En este trabajo, exploramos el uso de 'embeddings' de voz obtenidas al entrenar una CNN usando 'triplet loss'. Proponemos extraer los 'embeddings' de muestras de espectrogramas de voz, luego exploramos varias configuraciones de dichos espectrogramas y de la propia CNN, finalmente mostramos que 'triplet loss' es es una buena alternativa para crear 'embeddings' de voz para la identificación forense del hablante.

Mejora de la conducta ‘ask’ para perfeccionar la interacción humano-robot en el robot de servicio Golem-III

'Ask' es una conducta básica del robot de servicio Golem-III, está permite la interlocución entre un usuario y el robot, sin embargo al estar poco optimizada era inestable y lograba una mala interacción con el usuario, en este proyecto se mejoro, dando lugar a niveles de interacción donde el robot verifica la presencia humana o buscaba una presencia cercana, tiene un identificador visual de voz y usa en medida de lo posible los sentidos mas básicos de lenguaje corporal.

Adaptación del framework OpenPose en Windows 10 y adecuación a Kinect v2.0

OpenPose es un framework para identificación de personas y/o objetos, la construcción más sencilla del mismo se suele hacer en Linux, sin embargo dado el hardware del robot de servicio Golem-III requería hacerlo en Windows 10 creando la infraestructura de software necesaria para poder construir OpenPose y posteriormente ser implementado en Kinect v2.0

David Emmanuel Maqueda Bojorquez

Proyectos

Activos

Concluidos