Recursos de colección

Universidad Nacional de La Plata (75.269 recursos)

Este servicio se brinda en el marco del Proyecto de Enlace de Bibliotecas (PrEBi) y significa una novedosa iniciativa en pos de la difusión a través de Internet, dentro y fuera del ámbito de la Universidad, de los conocimientos que en ella se generan para servir como vehículo de promoción y jerarquización. Los objetivos que se han planteados para SeDiCI son sumamente ambiciosos e incluyen la difusion electrónica de tesis, tesinas y disertaciones pero también de otros tipos de creaciones intelectuales, pretendiendo abarcar la ciencia, la tecnología y el arte buscando modos de presentación no solo de objetos en forma de documentos de texto sino también otros medios multimediales aptos para creaciones no documentales.

Simposio Argentino de GRANdes DAtos (AGRANDA 2016)

Mostrando recursos 1 - 14 de 14

  1. Selección de variables mediante regresiones penalizadas en grandes volúmenes de datos

    Kovalevski, Leandro
    Uno de los retos más importantes del análisis estadístico en esos grandes volúmenes de datos es detectar cuál es la información valiosa. Las regresiones regularizadas, tales como Lasso o SCAD son alternativas usua-les cuando los métodos usuales de selección de variables en los modelos linea-les resultan no apropiados o no aplicables. El objetivo de este trabajo es comparar el desempeño de las regresiones Lasso y SCAD en escenarios donde el número de variables importantes esté próximo al número de observaciones. Se simularon distintos conjuntos de datos en los cuales las variables respuestas son funciones lineales de varios predictores independientes y errores que se...

  2. Towards an architecture for real-time event processing

    Pampliega, Juan Martín
    The purpose of this paper is to illustrate how and why we have evolved our data processing systems; from an initial version that relied on traditional RDBMSs and batch processing towards a system that processes a constant stream of data.

  3. Buenas prácticas para la protección de datos personales en ambientes de big data

    González Allonca, Juan Cruz; Ruiz Martínez, Esteban; Pollo Cattaneo, María Florencia
    El modelo de procesamiento de grandes volúmenes de datos o Big Data ofrece múl-tiples ventajas, tanto técnicas como económicas para las empresas y organismos que deciden implementarlo. Este modelo, sin embargo, requiere tener consideraciones de carácter legal y de cumplimiento normativo desde el inicio del proyecto. El presente estudio se propone recorrer la normativa argentina relativa a la protección de datos personales y su relación con este modelo de cómputo, brindando un panorama sobre el cuerpo normativo vigente que debe ser aplicado a servicios de Big Data. A su vez, identifica los riesgos asociados a estos servicios que deben ser...

  4. Sampling RTB transactions in an online machine learning setting

    Pita, Carlos
    We (the machine learning team at Jampp) strive to predict click-through rates (CTR) and conversion rates (CVR) for the real-time bidding (RTB) online advertising market by means of an in-house online machine learning platform based on a state-of-the-art stochastic gradient descent estimator. Our estimation framework has already been covered in a previous paper, so here we want to focus on some peripheral aspects of our platform that, in spite of being of a somewhat ancillary nature, nevertheless tend to dominate development efforts and overall system complexity; namely, in order to feed the learning system we first need to sample a...

  5. Mate Marote: a BigData platform for massive scale educational interventions

    Belloli, Laouen; Miguel, Martín A.; Goldin, Andrea P.; Fernandez Slezak, Diego
    In this paper we present Mate Marote, a web platform for massive scale educational interventions. We focus on the scaling requirements needed on these kind of deployments. We show the designed architecture, how these decisions solve the imposed requirements and the implementation. To test this development, we performed a small pilot intervention where the whole system was evaluated. We conclude that Mate Marote is ready for production deployment and enabled to middleto- massive scale interventions. For this purpose, we have deployed this platform in CEIBAL program at Uruguay with more than 100K potential users.

  6. Inference of Socioeconomic Status in a Communication Graph

    Fixman, Martín; Berenstein, Ariel; Brea, Jorge; Minnoni, Martín; Sarraute, Carlos
    In this work, we examine the socio-economic correlations present among users in a mobile phone network in Mexico. First, we find that the distribution of income for a subset of users –for which we have income information given by a large bank in Mexico– follows closely, but not exactly, the income distribution for the whole population of Mexico. We also show the existence of a strong socio-economic homophily in the mobile phone network, where users linked in the network are more likely to have similar income. The main contribution of this work is that we leverage this homophily in order to...

  7. Uncovering the Spread of an Infectious Disease with Mobile Phone Data

    Monasterio, Juan de; Salles, Alejo; Lang, Carolina; Weinberg, Diego; Minnoni, Martín; Travizano, Matías; Sarraute, Carlos
    We use mobile phone records for the analysis of mobility patterns and the detection of possible risk zones of Chagas disease in two Latin American countries. We show that geolocalized call records are rich in social and individual information, which can be used to infer whether an individual has lived in an endemic area. We present two case studies, in Argentina and in Mexico, using data provided by mobile phone companies from each country. The risk maps that we generate can be used by health campaign managers to target specific areas and allocate resources more effectively. Finally, we show the...

  8. Palenque: plataforma de grandes datos para el agro

    Bazzano, Agustina; Chiarle, Lautaro; Mislej, E.; Lizarralde, Carlos; Higgs, Nicolás
    Palenque es una plataforma y un ecosistema de aplicaciones que brindar án soluciones tecnol ógicas basadas en grandes datos a los productores agropecuarios, así como al sector p úblico y otros actores del sistema productivo y científi co. En este trabajo describiremos la arquitectura de la plataforma de datos.

  9. Propuesta para una infraestructura de datos agropecuarios del Instituto Nacional de Tecnología Agropecuaria (INTA)

    Bellini Saibene, Yanina
    Se propuso desarrollar La Infraestructura de Datos Agropecuarios (IDA) del INTA cuya visión es generar La más amplia colección de datos técnicos del INTA archivada, catalogada y accesible al mayor número posible de usuarios

  10. Cómo encontrar la causa del cáncer: la aguja entre 3000 millones de datos

    Llera, Andrea Sabina; Sendoya, Juan Martín; Merino, Gabriel; Podhajcer, Osvaldo; Fernández, Elmer Andrés
    En la actualidad es posible obtener y “leer” la secuencia de bases presentes en cualquier molécula de ADN y así obtener la información heredita-ria contenida en cada organismo. Este procedimiento se denomina “secuencia-ción”. Actualmente, las tecnologías disponibles (Next Generation Sequencing o NGS) permiten evaluar millones de secuencias a la vez, en un período corto de tiempo. En esta presentación se resume el flujo típico de trabajo de análisis de variantes durante una secuenciación NGS. Se muestran las características que tiene cada etapa, las herramientas informáticas que se requieren y las dificulta-des a las que el usuario se enfrenta actualmente.

  11. Big data para el análisis de tormentas severas

    Banchero, Santiago; Soria, Marcelo A.; Mezher, Romina
    Se presenta para discusión los primeros resultados del trabajo de una tesis de maestría en minería de datos y descubrimiento de conocimiento que tiene el objetivo de evaluar cuál es la capacidad de predicción de ocurrencia de granizo de un conjunto de índices de inestabilidad utilizando técnicas de aprendizaje automático en un entorno de Big Data. Además deja constancia de los procesos de ETL para la integración de un conjunto de fuentes heterogéneas con variedad de escalas de relevamiento y los primeros resultados del análisis multivariado sobre algunos eventos destacados. Una tormenta severa es un fenómeno atmosférico con capacidades destructivas, como...

  12. Estimación de origen-destino de usos en colectivo en base a datos registrados por el sistema SUBE

    Sidoni, Guido
    Los Sistemas de Recolección Automática de Datos (ADCS) se han vuelto muy populares para sistemas de transpor-te de todo el mundo. Aunque generalmente los ADCS fueron di-señados con el objetivo de ser funcionales en el cobro de tarifas, la información recolectada tiene un amplio rango de utilización. Esta tesis ilustra el potencial del ADCS de SUBE para proveer in-formación novedosa a las agencias de transporte de Argentina, a bajos costos marginales, y con bajo tiempo de respuesta en comparación con métodos más convencionales como las en-cuestas. Para esto fue necesario el procesamiento de los datos del ADCS de SUBE ,...

  13. Point Process Models for Distribution of Cell Phone Antennas

    Fattori, Ezequiel; Groisman, Pablo; Sarraute, Carlos
    We introduce a model for the spatial distribution of cell phone antennas in the city of Buenos Aires (CABA). After showing that the complete spatial randomness (homogeneous Poisson distribution) hy- pothesis does not hold, we propose a model in which each point is dis- tributed according to a bivariate Gaussian variable with mean given by the barycenter of its neighbors in the Delaunay triangulation. We show that this model is suitable, and can be used to generate a synthetic dis- tribution of antennas. The generated distribution contains no sensitive or proprietary information, and can thus be freely shared with research...

  14. Map-Reduce for Processing GPS Data from Public Transport in Montevideo, Uruguay

    Massobrio, Renzo; Pías, Andrés; Vázquez, Nicolás; Nesmachnow, Sergio
    This article addresses the problem of processing large volumes of historical GPS data from buses to compute quality-of-service metrics for urban transportation systems. We designed and implemented a solution to distribute the data processing on multiple processing units in a distributed computing infrastructure. For the experimental analysis we used historical data from Montevideo, Uruguay. The proposed solution scales properly when processing large volumes of input data, achieving a speedup of up to 22× when using 24 computing resources. As case studies, we used the historical data to compute the average speed of bus lines in Montevideo and identify troublesome locations, according...

Aviso de cookies: Usamos cookies propias y de terceros para mejorar nuestros servicios, para análisis estadístico y para mostrarle publicidad. Si continua navegando consideramos que acepta su uso en los términos establecidos en la Política de cookies.