Bienvenido a BigData by tecnalia

Especialista en la creación de complejos y novedosos algoritmos orientados a crear productos y soluciones inteligentes, incorporando para ello capacidades de análisis de información, ayuda a la toma de decisiones y aprendizaje.

Primer Workshop en Bilbao sobre “Data Science”

Primer Workshop en Bilbao sobre “Data Science”

19 y 20 Diciembre de 2016

La Ciencia de datos es un campo interdisciplinario que involucra a los procesos y sistemas para extraer conocimiento o un mejor entendimiento de grandes volúmenes de datos en sus diferentes formas.

Podríamos decir que las personas que se dedican a la ciencia de datos se les conocen como científicos de datos, como una mezcla de estadísticos, expertos en ciencias de la computación y pensadores creativos, con las siguientes habilidades:

  • Recopilar, procesar y extraer valor de las diversas y extensas bases de datos.
  • Imaginación para comprender, visualizar y comunicar sus conclusiones a los no científicos de datos.
  • Capacidad para crear soluciones basadas en datos que aumentan los beneficios, reducen los costos.
  • Los científicos de datos trabajan en todas las industrias y hacen frente a los grandes proyectos de datos en todos los niveles.

El proceso para comprender mejor a los datos comienza con una serie de números y el objetivo de responder preguntas sobre los datos, en cada fase del proceso (adquirir, analizar, filtrar, extraer, representar, refinar e interactuar), se requiere de diferentes enfoques especializados que aporten a una mejor comprensión de los datos. Entre estos  enfoques se encuentran: ingenieros en sistemas, matemáticos, estadísticos, diseñadores gráficos, especialistas en visualización de la información y especialistas en interacciones hombre-máquina.

Por todo ello, se organiza BiDAS (Bilbao DAta Science), el primer workshop organizado por BCAM cuyo objetivo es atraer investigadores en variedad de campos relacionadas con la investigación de  Data Science  y Big Data, dos áreas en las que se ven envueltas las matemáticas, la estadística y la informática.

Los Keynote speakers son:

Humberto BUSTINCE (Universidad Pública de Navarra, Spain) João GAMA (Universidade do Porto, Portugal) Iñaki INZA (UPV/EHU, Spain) Yvan SAEYS (University of Ghent, Belgium) Javier del SER (Tecnalia/BCAM, Spain) Jacobo de UÑA (Universidad de Vigo, Spain).

 

“A Probabilistic Sample Matchmaking Strategy for Imbalanced Data Streams with Concept Drift” en la Conferencia Internacional Intelligent Distributed Computing, IDC`2016.

“A Probabilistic Sample Matchmaking Strategy for Imbalanced Data Streams with Concept Drift” en la Conferencia Internacional Intelligent Distributed Computing, IDC`2016.

Jesus L. Lobo, Javier Del Ser, Iban Laña de TECNALIA, Miren Nekane de UPV/ EHE y S.Salcedo de la Universidad de Alcalá presentan su trabajo de investigación en el IDC 2016, 10th INTERNATIONAL SYMPOSIUM ON INTELLIGENT DISTRIBUTED COMPUTING.

En los últimos años ha aumentado la necesidad y crecido el interés por los modelos adaptativos para entornos no estacionarios, especialmente para aquellas aplicaciones predictivas que reciben los datos en forma de “streams” y que trabajan en modo “Big Data”. Uno de los desafíos más destacados para estas aplicaciones que tienen que trabajar en estos entornos es lidiar con la obsolescencia de sus modelos, es decir, cómo saber cuándo sus modelos están obsoletos y deben actualizarse (re-entrenarse) para seguir siendo precisos. Lo primero es saber que los datos pueden sufrir cambios inesperados en su distribución (el denominado “concept drift”), y saber cuándo se produce este cambio o conocer cómo los modelos deben adaptarse a este cambio es la clave de la solución.

El trabajo presentado por Jesús López Lobo en la conferencia internacional Intelligent Distributed Computing celebrada en París, nos acerca a una solución en la que no es necesario conocer el momento del drift, y en la que el modelo se adapta al cambio de una forma inteligente: el modelo es entrenado con la información actual pero también con la información del pasado más relevante y “parecida” para el momento actual (en forma de centroides extraídos de los modelos pasados). Este “parecido” se basa en una métrica que contempla la similaridad de los datos del pasado y del presente en términos de desbalanceo de la clase y del AUC.

Esta técnica ha sido testeada en un entorno específico de datos sintéticos, y el futuro de esta investigación pasa por realizar más pruebas con datos sintéticos y también de entornos reales.

 

TECNALIA presenta una propuesta de valor apoyada en la analítica avanzada, en la Jornada de Transporte 4.0.

El próximo 26 de Octubre en la sede de Ibermática en Donosti se celebrará la jornada“Transporte 4.0, herramientas de productividad imprescindibles para empresas de transporte y logística.”

 La Transformación Digital está en todas partes. El acceso inmediato a la información, la conectividad, el avance del comercio electrónico, la nube, las redes sociales y los dispositivos móviles presentan un nuevo entorno a las empresas de transporte y logística, que tienen que afrontar nuevos retos y oportunidades.

camion_microsoft

En el marco de la jornada organizada por Ibermática “Transporte 4.0, herramientas de productividad imprescindibles para empresas de transporte y logística, en el que se ofrecerán las claves para transformar a las empresas en organizaciones dinámicas y que extraigan el valor de la transformación digital.

Las posibilidades de los vehículos autónomos/e-mobility, la regulación automática del tráfico o el potencial de la economía compartida empiezan a ser vislumbrados en el sector como fuerzas transformadoras.

En este sentido Iñaki Etxebarria de TECNALIA presentará “Una arquitectura para el despliegue rápido de servicios de ayuda a la decisión en el dominio de la Movilidad y Logística”.

El despliegue de tecnologías de carácter disruptivo en el ámbito de la movilidad y la logística está dando oportunidad al desarrollo de soluciones de alto valor añadido para la ayuda a la decisión en tiempo real en los negocios.

No obstante, la complejidad de este tipo de soluciones requiere para su desarrollo, puesta en marcha y mantenimiento, la utilización de componentes que faciliten la gestión de todo el ciclo de vida de éstas.

En TECNALIA estamos desarrollando un conjunto de componentes analíticos que permita a los desarrolladores de soluciones finales incorporar una algoritmia de alto valor en el ámbito de la movilidad y la logística, tales como la eficiencia en conducción, seguridad vial, process mining o planificadores multi- modales.

leer más…

TECNALIA participa en el máster Big Data de la Universidad de Málaga

TECNALIA participa en el máster Big Data de la Universidad de Málaga

El grupo de investigación de Big Data en Tecnalia y el grupo Khaos de la UMA forman a profesionales competentes en análisis de datos.

El Máster en Advanced Analytics on Big Data es un máster propio de la Universidad de Málaga organizado por el grupo de Investigación Khaos y TECNALIA en colaboración con empresas con amplia experiencia en el ámbito del análisis de datos en aplicaciones Big Data.

Los contenidos de máster incluyen una importante carga en tecnologías actuales relacionada con Big Data, como las plataformas Hadoop y Spark, bases de datos tanto SQL como NoSQL, herramientas de visualización de datos, técnicas de análisis predictivo, y la aplicación de todas ellas a tres casos de estudio de corte real. También se abordarán temas avanzados, como Internet de las Cosas, Cloud Computing y aspectos relacionados con la seguridad.

Dirigido por el catedrático José Aldana, responsable del grupo Khaos, especializado en Big data, la plantilla docente se nutre en gran medida de personal del Departamento de Lenguajes y Ciencias de la Computación.

Javier Del Ser, Iñaki Olabarrieta, Itziar LandaSergio Campos de Tecnalia abordaran temas relacionados con la movilidad individual, la modelización predictiva, experiencias relacionadas con las Smart Grids y trastornos de sueño entre otros.

leer más…

Algoritmos que simulan el comportamiento de las luciérnagas y las hormigas desarrollados por el GEI de Big Data se presentan en Canada

Algoritmos que simulan el comportamiento de las luciérnagas y las hormigas desarrollados por el GEI de Big Data se presentan en Canada

Jesus L. Lobo y Esther Villar Rodriguez presentan dos trabajos de investigación en el principal evento sobre inteligencia computacional, IEEE WORLD CONGRESS ON COMPUTATIONAL INTELLIGENCE celebrado del 24 al 29 de Julio en Canada.

En este evento se dieron cita los principales intelectuales de todo el mundo para presentar los resultados de la investigación sobre inteligencia computacional en los ámbitos de Redes Neuronales, Sistemas Difusos y Computación Evolutiva.

El trabajo de investigación “Community Detection in Graphs based on Surprise Maximization using Firefly Heuristics”, elaborado por  Javier Del Ser, Jesus L. Lobo y Esther Villar-Rodriguez de TECNALIA y  Miren Nekane Bilbao y Cristina Perfecto  de la UPV/EHU, explica como la necesidad de detectar comunidades en grafos es habitual encontrarla trabajando con datos de redes sociales, o distribuyendo recursos de radio para redes wireless, o analizando la colaboración científica a través de las citas, o prediciendo las funciones de las proteínas, etc.

Uno de los problemas clásicos en la detección de comunidades en grafos es el llamado “resolution limit“, que hace que determinados algoritmos sean incapaces de detectar comunidades  por debajo de un determinado tamaño. Por otro lado, no existe un algoritmo lo suficientemente universal y competitivo como para detectar comunidades de tipologías y tamaños diferentes. leer más…

El artículo elaborado conjuntamente por Tecnalia y aDeNu “Recomendaciones a través del uso de técnicas de analítica de datos aplicadas sobre indicadores colaborativos” se publica en la revista Expert Systems.

Con el auge de las plataformas educativas online y de los cursos abiertos (MOOC), surge la necesidad de automatizar determinadas tareas ante el desafío que se le presenta al tutor/profesor de tratar con tantos alumnos y en plazos de tiempo tan reducidos. Esta automatización pasa por disponer de plataformas que sepan adaptar sus recursos y su camino formativo al perfil de los estudiantes de forma personalizada. Una parte importante de estas plataformas educativas reside en el uso de los foros como medio de intercambio de información y aprendizaje entre estudiantes de un mismo grupo, y es aquí donde el grupo de expertos Jesús L.Lobo y Javier Del Ser de Tecnalia junto a Jesús G.Boticario y Olga C.Santos de aDeNu centran sus esfuerzos  modelando las interacciones que en estos foros se suceden para identificar recomendaciones personalizadas al estudiante.

coverConcretamente, el artículo “Identifying recommendation opportunities for computer-supported collaborative environments “ publicado por la revista Expert Systems Journal , especializada en artículos relacionados con todos los aspectos de la ingeniería del conocimiento, tales como la inteligencia artificial, ingeniería del conocimiento, sistemas expertos, el procesamiento del lenguaje natural, visión artificial, etc., centra sus esfuerzos en el modelado de recomendaciones a través del uso de técnicas de analítica de datos aplicadas sobre indicadores colaborativos, que son extraídos de datos cuantitativos de los foros y de sus mensajes, de Social Network Analytics, además de la  información afectiva. Estas técnicas permiten identificar  situaciones de aislamiento de estudiantes dentro de un grupo, valorar qué estudiantes tienen más probabilidad de resolver una determinada tarea y establecer quienes desempeñan un rol de “asistente” que facilita la comprensión de la tarea a realizar por el resto del grupo.

Todas las recomendaciones extraídas de este trabajo son transferibles a cualquier entorno de aprendizaje.