Generación de datos sintéticos usando Redes Generativas Adversariales para la minería de datos respetuosa de la privacidad

dc.contributor.advisorAlatrista Salas, Hugo
dc.contributor.authorMontalvo García, Peter Jonathan
dc.date.accessioned2021-05-28T20:55:54Z
dc.date.available2021-05-28T20:55:54Z
dc.date.created2021
dc.date.issued2021-05-28
dc.description.abstractLa minería de datos permite conocer patrones en grandes volúmenes de datos; pero dentro de estos datos puede haber información sensible que compromete la privacidad. En tal sentido, se han desarrollado técnicas para la minería de datos respetuosa de la privacidad, siendo la más utilizada la privacidad diferencial debido a las propiedades que otorga a los datos resultantes, de la mano de técnicas de aprendizaje profundo. Estas técnicas se han utilizado en conjuntos de datos de números escritos e imágenes, pero no en datos de georreferenciación. El presente trabajo tiene como objetivo medir la eficacia de los datos sintéticos generados a través redes generativas adversariales y privacidad diferencial en datos de georreferenciación. La generación de estos datos se hace a través de selección de datos, sanitización para la obtención de la base de datos sintéticos y evaluación a través de modelos de movilidad a partir de las trazas que sirven para medir la pérdida de información y el riesgo de divulgación. En líneas generales, los resultados demuestran que la aplicación de estas técnicas sobre datos de georreferencia da como producto un conjunto de datos sintéticos con una pérdida de información y riesgo de divulgación bajos, y se concluye que estos conjuntos de datos obtenido se puede realizar una minería de datos similar a la que se haría con los datos originales y sin comprometer información sensible.es_ES
dc.identifier.urihttp://hdl.handle.net/20.500.12404/19255
dc.language.isospaes_ES
dc.publisherPontificia Universidad Católica del Perúes_ES
dc.publisher.countryPEes_ES
dc.rightsinfo:eu-repo/semantics/closedAccesses_ES
dc.subjectMinería de datoses_ES
dc.subjectRedes neuronales (Computación)es_ES
dc.subjectProtección de datoses_ES
dc.subject.ocdehttp://purl.org/pe-repo/ocde/ford#1.02.00es_ES
dc.titleGeneración de datos sintéticos usando Redes Generativas Adversariales para la minería de datos respetuosa de la privacidades_ES
dc.typeinfo:eu-repo/semantics/masterThesises_ES
dc.type.otherTesis de maestría
renati.advisor.dni23976103
renati.advisor.orcidhttps://orcid.org/0000-0001-5252-4728es_ES
renati.author.dni70550542
renati.discipline611087es_ES
renati.jurorMaldonado Cadenillas, Rodrigo Ricardo
renati.jurorAlatrista Salas, Hugo
renati.jurorGomez Montoya, Hector Erasmo
renati.levelhttps://purl.org/pe-repo/renati/level#maestroes_ES
renati.typehttp://purl.org/pe-repo/renati/type#trabajoDeInvestigaciones_ES
thesis.degree.disciplineInformática con mención en Ciencias de la Computaciónes_ES
thesis.degree.grantorPontificia Universidad Católica del Perú. Escuela de Posgrado.es_ES
thesis.degree.levelMaestríaes_ES
thesis.degree.nameMaestro en Informática con mención en Ciencias de la Computaciónes_ES

Archivos