And synopses for all: A synopses data engine for extreme scale analytics-as-a-service

Kontaxakis, Antonios; Giatrakos, Nikos; Sacharidis, Dimitris; Deligiannakis, Antonios

doi:doi/10.1016/j.is.2023.102221

Citer

And synopses for all: A synopses data engine for extreme scale analytics-as-a-service

;Giatrakos, Nikos ;Sacharidis, Dimitris ;Deligiannakis, Antonios
Référence Information systems, 116, page (102221)
Publication Publié, 2023-06-01

Article révisé par les pairs

Résumé :

In this work, we detail the design and structure of a Synopses Data Engine (SDE) which combines the virtues of parallel processing and stream summarization towards delivering interactive analytics at extreme scale. Our SDE is built on top of Apache Flink and implements a novel synopses-as-a-service paradigm. In that, it achieves (i) concurrently maintaining thousands of synopses of various types for thousands of streams, on demand, (ii) reusing synopses that are common across various concurrent workflows, (iii) providing data summarization facilities even for cross-(Big Data) platform workflows, (iv) pluggability of new synopses on-the-fly, (v) increased potential for workflow execution optimization. The proposed SDE-as-a-service provides interactive analytics at scale by enabling 3 types of scalability: (i) enhanced horizontal scalability, i.e., not only scaling out the computation to a number of processing units available in a computer cluster, but also harnessing the processing load assigned to each by operating on carefully-crafted data summaries, (ii) vertical scalability, i.e., scaling the computation to very high numbers of processed streams and (iii) federated scalability i.e., scaling across geo-distributed clusters and clouds by controlling the communication required to answer global queries.

Référencement	Visibilité	Pérennité	Facilité
Les publications encodées constituent la bibliographie académique de l'Université.	Les documents déposés sont indexés par les moteurs de recherche (Google Scholar,…).	Les documents déposés en open-access sont archivés au sein du réseau de préservation SAFE-PLN (www.safepln.org).	Les listes de publications sont compatibles avec le CV-ULB, le FNRS et accessibles sur le web.

And synopses for all: A synopses data engine for extreme scale analytics-as-a-service

Documents en relation

DI-fusion