345 research outputs found

    Advanced learning methods for anomaly detection in multivariate datastreams and point clouds

    Get PDF
    DOTTORATOIl rilevamento di anomalie è un problema importante in vari domini applicativi, dal controllo della qualità nell’industria agli attacchi crittografici. Nella letteratura sono stati proposti diversi modelli statistici e di deep learning per il rilevamento di anomalie, ciascuno basato su specifiche ipotesi sui dati da analizzare. Questa tesi presenta nuove soluzioni al problema del rilevamento di anomalie in due diversi scenari. Inizialmente abbiamo supposto che, in condizioni normali, i dati siano realizzazioni di un vettore aleatorio, e abbiamo affrontato il problema del rilevamento di cambiamenti, il cui scopo è individuare cambiamenti permanenti nella distribuzione dei dati analizzando una sequenza di dati acquisiti nel tempo. Abbiamo sviluppato QuantTree Exponentially Weighted Moving Average (QT-EWMA), un algoritmo per il rilevamento di cambiamenti che opera online e in maniera non parametrica su sequenze di dati multivariati. QT-EWMA può essere inoltre configurato fissando l’Average Run Length (ARL0), ovvero il tempo atteso prima di un falso allarme. Abbiamo poi esteso questo lavoro alllo scenario del rilevamento di concept drift, in cui i dati sono oggetto di un problema di classificazione. Abbiamo proposto Class Distribution Monitoring (CDM), un algoritmo in cui utilizziamo diverse istanze di QT-EWMA per individuare cambiamenti nella distribuzione condizionata alle classi in sequenze di dati etichettati. Infine, come nuova applicazione del rilevamento di cambiamenti, abbiamo affrontato il problema del rilevamento degli errori in attacchi crittografici side-channel sequenziali. Tali attacchi ricostruiscono una chiave privata un bit alla volta utilizzando un discriminatore basato, ad esempio, sul consumo di potenza del dispositivo sotto attacco. Abbiamo proposto una procedura per il rilevamento e la correzione automatica degli errori che applica un algoritmo standard per il rilevamento di cambiamenti alla sequenza univariata formata dai valori del discriminatore. Successivamente, abbiamo affrontato il rilevamento di anomalie nelle nuvole di punti, ovvero liste di coordinate dei punti che descrivono, ad esempio, la superficie di un oggetto 3D. Lo scopo è stabilire se una nuvola di punti appartiene a una certa classe normale oppure no. La difficoltà maggiore di operare su nuvole di punti è la mancanza di una struttura a griglia, fatto che impedisce l’uso di Convolutional Neural Network (CNN). Abbiamo proposto il composite layer, un operatore efficace e flessibile per processare le nuvole di punti all’interno di Deep Neural Network (DNN). Abbiamo utilizzato il composite layer per implementare CompositeNet, che sono DNN per la classificazione di nuvole di punti. Inoltre, siamo stati tra i primi ad affrontare il rilevamento di anomalie nelle nuvole di punti addestrando CompositeNet in maniera self-supervised. Come applicazione del rilevamento di anomalie, abbiamo poi analizzato le Wafer Defect Map (WDM), ovvero le liste di coordinate 2D dei difetti sui wafer di silicio prodotti da STMicroelectronics. Abbiamo affrontato il rilevamento di anomalie come un problema di open-set recognition, il cui scopo è classificare correttamente i pattern di difettosità conosciuti e individuare pattern anomali nelle WDM. Le coordinate contenute nelle WDM appartengono a una griglia di dimensioni enormi, fatto che impedisce l’uso di CNN. Per processare in maniera efficiente le WDM nella loro risoluzione originale, abbiamo addestrato una Submanifold Sparse Convolutional Network (SSCN) sulle classi note. Poi, per rilevare i pattern anomali, abbiamo applicato un algoritmo per il rilevamento di outlier basato su un Gaussian Mixture Model (GMM) alla rappresentazione latente della SSCN.Anomaly detection is a challenging problem in several application domains, ranging from industrial quality control to cryptographic attacks. In the literature, several statistical and deep learning models for anomaly detection have been proposed, each underpinning specific assumptions on the nature of the data to be analyzed. This thesis presents new solutions for the anomaly-detection problem in two different settings. First, we assume that, in normal conditions, data samples are realizations of a random vector. We focus on a change-detection problem, where the goal is to detect permanent changes in the data-generating process by analyzing a datastream acquired over time. We develop QuantTree Exponentially Weighted Moving Average (QT-EWMA), an online and nonparametric change-detection algorithm for multivariate datastreams that can be configured to maintain the target Average Run Length (ARL0), namely the expected time before a false alarm. We extend our work to the concept-drift scenario, where the data samples are the object of a classification problem. We propose Class Distribution Monitoring (CDM), where we employ multiple instances of QT-EWMA to detect changes in the class-conditional distributions of annotated datastreams. As a new change-detection application, we address the problem of detecting errors in sequential cryptographic side-channel attacks. These attacks reconstruct a private key one bit at a time by using a distinguisher involving, e.g., the power consumption of the target device. We propose an error-detection and correction procedure based on a standard change-detection algorithm applied to the univariate datastream formed by distinguisher values. Then, we address anomaly detection in point clouds, namely lists of the coordinates of points describing, for instance, the surface of a 3D object. We aim to assess whether individual point clouds belong to a certain normal class. The main challenge of handling point clouds is their lack of a grid structure, which prevents the use of traditional Convolutional Neural Networks (CNNs). We propose the composite layer, an effective and flexible operator for point cloud processing in Deep Neural Networks (DNNs). We use our composite layers to implement CompositeNets, which are DNNs for point cloud classification. Most remarkably, we are among the first to address anomaly detection in point clouds by training our CompositeNets in a self-supervised fashion. As an anomaly-detection application, we analyze Wafer Defect Maps (WDMs), i.e., the lists of the 2D coordinates of defects on silicon wafers manufactured by STMicroelectronics. We cast anomaly detection as an open-set recognition problem, where the goal is to correctly classify known defect patterns and detect anomalous patterns in WDMs. The coordinates in WDMs lie on a huge grid, which prevents the use of CNNs. To efficiently process WDMs at full resolution, we train a Submanifold Sparse Convolutional Network (SSCN) on known classes. To detect anomalous patterns, we apply an outlier detector based on a Gaussian Mixture Model (GMM) to the latent representation of the SSCN.DIPARTIMENTO DI ELETTRONICA, INFORMAZIONE E BIOINGEGNERIAComputer Science and Engineering34GATTI, NICOLAPIRODDI, LUIG

    Increased risk of second malignancy in pancreatic intraductal papillary mucinous tumors: Review of the literature.

    Get PDF
    AIM: To analyze the available evidence about the risk of extrapancreatic malignancies and pancreatic ductal adenocarcinoma associated to pancreatic intraductal papillary mucinous tumors (IPMNs). METHODS: A systematic search of literature was undertaken using MEDLINE, EMBASE, Cochrane and Web-of-Science libraries. No limitations for year of publication were considered; preference was given to English papers. All references in selected articles were further screened for additional publications. Both clinical series and Literature reviews were selected. For all eligible studies, a standard data extraction form was filled in and the following data were extracted: study design, number of patients, prevalence of pancreatic cancer and extrapancreatic malignancies in IPMN patients and control groups, if available. RESULTS: A total of 805 abstracts were selected and read; 25 articles were considered pertinent and 17 were chosen for the present systematic review. Eleven monocentric series, 1 multicentric series, 1 case-control study, 1 population-based study and 3 case report were included. A total of 2881 patients were globally analyzed as study group, and the incidence of pancreatic cancer and/or extrapancreatic malignancies ranged from 5% to 52%, with a mean of 28.71%. When a control group was analyzed (6 papers), the same incidence was as low as 9.4%. CONCLUSION: The available Literature is unanimous in claiming IPMNs to be strongly associated with pancreatic and extrapancreatic malignancies. The consequences in IPMNs management are herein discussed

    Nonparametric and Online Change Detection in Multivariate Datastreams Using QuantTree

    Get PDF
    We address the problem of online change detection in multivariate datastreams, and we introduce QuantTree Exponentially Weighted Moving Average (QT-EWMA), a nonparametric change-detection algorithm that can control the expected time before a false alarm, yielding a desired Average Run Length (ARL 0 ). Controlling false alarms is crucial in many applications and is rarely guaranteed by online change-detection algorithms that can monitor multivariate datastreams without knowing the data distribution. Like many change-detection algorithms, QT-EWMA builds a model of the data distribution, in our case a QuantTree histogram, from a stationary training set. To monitor datastreams even when the training set is extremely small, we propose QT-EWMA-update, which incrementally updates the QuantTree histogram during monitoring, always keeping the ARL0 under control. Our experiments, performed on synthetic and real-world datastreams, demonstrate that QT-EWMA and QT-EWMA-update control the ARL0 and the false alarm rate better than state-of-the-art methods operating in similar conditions, achieving lower or comparable detection delays

    Class Distribution Monitoring for Concept Drift Detection

    Get PDF
    We introduce Class Distribution Monitoring (CDM), an effective concept-drift detection scheme that monitors the class-conditional distributions of a datastream. In particular, our solution leverages multiple instances of an online and nonparametric change-detection algorithm based on QuantTree. CDM reports a concept drift after detecting a distribution change in any class, thus identifying which classes are affected by the concept drift. This can be precious information for diagnostics and adaptation. Our experiments on synthetic and real-world datastreams show that when the concept drift affects a few classes, CDM outperforms algorithms monitoring the overall data distribution, while achieving similar detection delays when the drift affects all the classes. Moreover, CDM outperforms comparable approaches that monitor the classification error, particularly when the change is not very apparent. Finally, we demonstrate that CDM inherits the properties of the underlying change detector, yielding an effective control over the expected time before a false alarm, or Average Run Length (ARL0)

    Endocytic reawakening of motility in jammed epithelia.

    Get PDF
    Dynamics of epithelial monolayers has recently been interpreted in terms of a jamming or rigidity transition. How cells control such phase transitions is, however, unknown. Here we show that RAB5A, a key endocytic protein, is sufficient to induce large-scale, coordinated motility over tens of cells, and ballistic motion in otherwise kinetically arrested monolayers. This is linked to increased traction forces and to the extension of cell protrusions, which align with local velocity. Molecularly, impairing endocytosis, macropinocytosis or increasing fluid efflux abrogates RAB5A-induced collective motility. A simple model based on mechanical junctional tension and an active cell reorientation mechanism for the velocity of self-propelled cells identifies regimes of monolayer dynamics that explain endocytic reawakening of locomotion in terms of a combination of large-scale directed migration and local unjamming. These changes in multicellular dynamics enable collectives to migrate under physical constraints and may be exploited by tumours for interstitial dissemination

    Mechanisms through which Sos-1 coordinates the activation of Ras and Rac

    Get PDF
    Signaling from receptor tyrosine kinases (RTKs)* requires the sequential activation of the small GTPases Ras and Rac. Son of sevenless (Sos-1), a bifunctional guanine nucleotide exchange factor (GEF), activates Ras in vivo and displays Rac-GEF activity in vitro, when engaged in a tricomplex with Eps8 and E3b1–Abi-1, a RTK substrate and an adaptor protein, respectively. A mechanistic understanding of how Sos-1 coordinates Ras and Rac activity is, however, still missing. Here, we demonstrate that (a) Sos-1, E3b1, and Eps8 assemble into a tricomplex in vivo under physiological conditions; (b) Grb2 and E3b1 bind through their SH3 domains to the same binding site on Sos-1, thus determining the formation of either a Sos-1–Grb2 (S/G) or a Sos-1–E3b1–Eps8 (S/E/E8) complex, endowed with Ras- and Rac-specific GEF activities, respectively; (c) the Sos-1–Grb2 complex is disrupted upon RTKs activation, whereas the S/E/E8 complex is not; and (d) in keeping with the previous result, the activation of Ras by growth factors is short-lived, whereas the activation of Rac is sustained. Thus, the involvement of Sos-1 at two distinct and differentially regulated steps of the signaling cascade allows for coordinated activation of Ras and Rac and different duration of their signaling within the cell

    Rural informal Cairo. Operazioni di ridisegno dell'interfaccia tra spazi agricoli e urbani

    Get PDF
    LAUREA MAGISTRALEIl lavoro di tesi sperimenta modalità operative progettuali applicabili nel contesto informale della città del Cairo, strettamente a contatto con la preesistente realità agricola. L’ipotesi avanzata fa riferimento alle interzone di connessione tra i tessuti agricolo e informale, prevedendo il movimento di suolo come strumento utile a limitare l’eccessiva edificazione e a garantire una varietà di luoghi collettivi, dal carattere sociale e resiliente. L’indagine sui principi insediativi ha posto l’attenzione sul fenomeno di saturazione, che genera differenti relazioni tra lo spazio urbano in crescita e le aree verdi residuali inglobate e al confine. Il progetto cerca di gestire entrambe le situazioni, collocandosi in questi vuoti urbani con l’intento di preservarli e trasformarli in luoghi per la socialità. Per meglio rispondere alla varietà degli scenari riscontrati, l’intervento si articola in cinque operazioni, strategie progettuali aventi diversi ruoli e finalità a seconda del contesto a cui fanno riferimento. Scegliendo come strumenti il movimento di suolo e il lavoro sulla variazione della dimensione del campo agricolo, la progettazione e la rappresentazione vengono elaborate attraverso la sezione: il metodo permette l’identificazione di una serie di operatori, indicatori di azioni in grado di plasmare il suolo e dar vita a diversi spazi e scenari di paesaggio. Questo approccio viene supportato dall’approfondimento di operazioni ecologiche, fondamentali per rendere sostenibile e attuabile le ipotesi di intervento. Il quadrante sviluppato alla scala architettonica si caratterizza per l’interessante rapporto tra la scala urbana e il tessuto rurale, reinterpretato a livello progettuale con il mantenimento di un varco agricolo esistente, che al contempo si traduce nella possibilità di accogliere uno nuovo spazio collettivo. Un mercato a chilometro zero si fa portatore di piazze, terrazze e percorsi lasciando all’agricoltura il principale ruolo di connessione fisica e sociale. Il risultato vuole essere l’esempio di un possibile ridisegno dell’interfaccia tra spazi agricoli e urbani, in cui l’architettura diventa l’occasione per delineare nuovi paesaggi
    corecore