Laboratorio Big Data

Responsabile: Prof.ssa Sonia Bergamaschi (sonia.bergamaschi@unimore.it)

Nodo del Laboratorio Big Data del CINI.

Membro dell’Hub sui Big Data costituito dalla Regione Emilia Romagna. Partecipa al Centro Interdipartimentale Softech-ICT.

Area competenza 1

Referente

Prof. Sonia Bergamaschi (sonia.bergamaschi@unimore.it)

Composizione

Componenti Strutturati
  • Domenico Beneventano, professore associato ING-INF/05
  • Maurizio Vincini, professore associato ING-INF/05
  • Francesco Guerra, professore associato ING-INF/05
  • Laura Po, ricercatrice ING-INF/05
Componenti non Strutturati
  • Giovanni Simonini, post-doc
  • Fabio Benedetti, post-doc
  • Song Zhu, dottorando

Tema: Big Data Analytics and Keyword Search on Structured Data Sources

Descrizione

Progettazione di algoritmi e prototipi per l’analisi dei dati aziendali. In particolare saranno studiate delle metodologie che combinino tecniche di network analysis, sentiment analysis, analisi semantica data mining e ricerca per keyword su dati strutturati. L’analisi terrà in considerazione sia dati generati internamente dalle aziende sia coscienza estratta da sorgenti esterne quali social network, (linked) open data. Un caso d’uso particolare potrebbe essere inerente l’analisi delle vendite in-store correlata alle abitudini dei clienti.

Ragione della rilevanza per il tema "Big Data"

La proposta riguarda grandi quantitativi di dati che saranno analizzati secondo diverse prospettivi tipiche della big data analysis. Si vedono anche interconnessioni con l’Azione COST IC1302.

Sito del gruppo di ricerca

http://www.dbgroup.unimo.it

Tema: Big Data Integration of heterogeneous data sources: Entity Resolution, Profiling, Schema Mapping, Data Provenance, Automatic Annotation

Descrizione

“Big Data Integration and Analtycs ”: studio e sviluppo di tecnologie software di integrazione e analisi dati, basate sulla
semantica, al fine di integrare e inferire conoscenza in modo automatico/semiautomatico da sorgenti di dati eterogenei  (dati
strutturati, semistrutturati, testuali, open, multimedia, etc.) garantendo la scalabilità a fronte di un
numero elevato di un elevato numero di sorgenti dati di dimensione elevata. L’attività prevede
l’analisi e la progettazione di nuovi strumenti di Business Analytics e intelligence (BA e BI). Verranno studiate e sviluppate che integrino i dati strutturati prodotti dalle tecnologie BI tradizionali con dati IoT e da social networks per raccogliere,  modellare, analizzare e visualizzare quantità di dati potenzialmente di tipo Big Data da cui estrarre
informazioni utili. Verranno affrontati i problemi di veridicità, varietà e velocità. [S.Bergamaschi]

Ragione della rilevanza per il tema "Big Data"

I big data necessitano di tecniche sempre più complesse per poter essere analizzati e gestiti.

Sito del gruppo di ricerca

http://www.dbgroup.unimo.it


Area competenza 2

Composizione

Componenti Strutturati
  • Franco Zambonelli, professore ordinario ING-INF/05
  • Giacomo Cabri, professore associato ING-INF/05
  • Marco Mamei, professore associato ING-INF/05
  • Nicola Bicocchi, ricercatore ING-INF/05
Componenti non Strutturati
  • Emanuel Federico Alsina - dottorando
  • Alket Cecaj - dottorando

Tema: Big data in Socio-Technical Systems

Descrizione

Socio-Technical Systems are in general systems that involve people and technology and describe the interaction between them. In particular, we are interested in system composed of a potentially large number of humans and devices, which are mobile in different contexts such as cities and companies. Data collected from devices can be analyzed to recognize recurrent patterns, anomalous events, and emergent behaviors and to provide useful suggestions to people involved in the systems and to the manager of the context.

I sistemi socio-tecnici sono in generale sistemi che coinvolgono persone, sistemi tecnologici e studiano l’interazione tra di loro. In particolare, siamo interessati a sistemi potenzialmente composti da un grande numero di persone e dispositivi, che si muovono in contesti differenti come città e aziende. I dati raccolti dai dispositivi possono essere analizzati per riconoscere schemi ricorrenti, eventi anomali e comportamenti emergenti e per fornire utili suggerimenti alle persone coinvolte nel sistema e al gestore del contesto.

Ragione della rilevanza per il tema “Big Data”

Socio-Technical Systems produce a lot of data that must be managed and analyzed in order to identify and understand recurrent patterns, anomalous events and emerging behaviors.

I sistemi socio-tecnici producono una grande quantità di dati che devono essere gestiti e analizzati per identificare e capire schemi ricorrenti, eventi anomali e comportamenti emergenti.

Sito del gruppo di ricerca

http://www.agentgroup.unimore.it/


Area competenza 3

Composizione

Componenti Strutturati
  • Mauro Leoncini, professore ordinario INF/01

Tema: Algoritmi per analisi di dati prodotti dai sequenziatori DNA.

Descrizione

I dati di sequenziamento sono una preziosa fonte di informazioni per studi di biologia molecolare. Fra i problemi più rilevanti affrontati rientrano lo studio delle interazioni DNA-proteine per l'individuazione dei loci di interazione di fattori di trascrizione e lo studio delle variazioni strutturali nel genoma umano; entrambi sono campi di indagine di grandissimo interesse applicativo per la comprensione della genesi di molte malattie (in particolare tumori).

Ragione della rilevanza per il tema “Big Data”

Si tratta di un settore applicativo che necessita di algoritmi di analisi e strutture di memorizzazione e recupero di dati/informazioni di grandissime dimensioni (e in continuo aumento).


Area competenza 4

Composizione

Componenti Strutturati
  • Rita Cucchiara, professore ordinario ing-inf/05
  • Costantino Grana, professore associato ing-inf/05
  • Roberto Vezzani, ricercatore inf/01
  • Simone Calderara, ricercatore ing-inf/05
  • Giuseppe Serra, ricercatore TD ing-inf/05
Componenti non Strutturati
  • Francesco Solera, Dottorando
  • Patrizia Varini, Dottorando
  • Stefano Alletto, Dottorando
  • Lorenzo Baraldi, Dottorando
  • Fabrizio Balducci, Dottorando
  • Guido Borghi, Dottorando

Tema: Multimedia Big Data: Visual computing and multimedia processing

Descrizione

Sono disponibili competenze in: elaborazione di immagini, video, dati 3D e dati audio-text-video-grafici per la comprensione del contenuto, l’annotazione semantica, il mining, i processi di search e il retrieval bassato su contenuto; metodologie di machine learning, computer vision, pattern recognition per l’ elaborazione automatica, la compressione semantica, l’analisi dell’ human behavior dai dati visuali, la sommarizzazione e per la fruizione con modelli HCI di interfaccia naturale.

Ragione della rilevanza per il tema "Big Data"

I dati multimediali sono stati recentemente definiti i “biggest big data” per la quantità dei dati ora disponibili e per la complessità nella loro elaborazione. L’interesse non e’ solo per i dati sul web ma anche per i dati proprietari di industrie, di aziende nel terziario ed enti pubblici.

Sito del gruppo di ricerca

http://imagelab.ing.unimore.it


Area competenza 5

Composizione

Componenti strutturati
  • Michele Colajanni, professore ordinario ing-inf/05
  • Mauro Andreolini, ricercatore inf/01
Componenti non strutturati
  • Mirco Marchetti, Assegnista
  • Andrea Balboni, Assegnista
  • Luca Ferretti, Assegnista
  • Francesca Mazzoni, Assegnista
  • Fabio Pierazzi, Dottorando
  • Alessandro Guido, Dottorando

Tema: Security intelligence for large sets of continuously fed events gathered from structured and unstructured sources.

Descrizione

L'attuale disponibilita' di molteplici sorgenti informative da sorgenti eterogenee strutturate e non strutturate consente di svolgere ricerche innovative in ambito sicurezza (informatica e fisica) per nuovi approcci preventivi in ambiti aziendali, sociali e politici.

Ragione della rilevanza per il tema "Big Data"

L'acquisizione di grandi insiemi di dati, la loro storicizzazione e la necessaria integrazione con flussi di dati in streaming richiedono soluzioni altamente scalabili sia a livello infrastrutturale sia a livello di soluzioni algoritmiche al fine di ottenere risposte affidabili ed entro tempi predefiniti.

Tema: Big data security analytics for personalized anomaly detection, and real-time predictability analysis

Descrizione

Le soluzioni di sicurezza informatica basate sugli approcci tradizionali, sebbene applicate, non sono più efficaci per contrastare le moderne tipologie di attacchi. Servono nuovi modelli piu' affinati, personalizzati e continuamente adattabili al fine di individuare anomalie comportamentali degli host fissi e mobili che sono indizi di compromissione.

Ragione della rilevanza per il tema "Big Data"

Il raggiungimento degli obiettivi descritti in precedenza richiedono acquisizioni e analisi di un numero di eventi che, anche in una media organizzazione, può raggiungere le decine o centinaia di milioni al giorno.