26 research outputs found
Determination of gold and palladium in rocks and ores by atomic absorption spectrometry using two-stage probe atomization
© 2017, Pleiades Publishing, Ltd.The efficiency of two-stage probe atomization for the determination of gold and palladium in geological samples by electrothermal atomic absorption spectrometry is studied. The effects of temperature–time program and the position of the probe in an atomizer on the fractionation of sample components and the magnitude of the analytical signal are studied. It is demonstrated that gold and palladium can be quantitatively determined by atomic absorption spectrometry in rocks and ores, using a two-stage probe atomization with the limits of detection for gold and palladium 0.01 and 0.04 g/t, respectively
Apprentissage profond pour prédire les réseaux d'interactions protéine-protéine au sein, à travers et entre les espèces à l'échelle du génome
Bioinformatics is rapidly emerging as a crucial discipline, integrating biological data with computational methods to unravel complex biological systems. Among the most significant challenges in this field is understanding protein-protein interactions (PPIs), which are central to various cellular processes, such as signal transduction, metabolic pathways, or immune system responses. Predicting these interactions is essential for both fundamental biological research and applied areas like drug discovery and disease treatment. However, experimental methods for mapping PPIs are resource-intensive and not easily scalable, leading to a growing focus on computational approaches. Predicting PPIs from amino acid sequences alone offers several advantages, including the ability to process large datasets rapidly and the flexibility to analyze proteins even in organisms with limited experimental data. Sequence-based PPI prediction methods provide a cost-effective alternative that enables the study of proteomes at the genome-wide scale. These computational techniques are particularly beneficial for exploring interactions in non-model organisms or in contexts where high-throughput experimental data are unavailable, enabling discoveries across a broad range of species and biological systems. This thesis presents results from the development of SENSE-PPI, a sequence-based deep learning model designed to predict PPIs. This model leverages advanced protein language models, which capture the rich information embedded in protein sequences, and recurrent neural networks to distinguish specific interactions within vast protein datasets. SENSE-PPI demonstrates high predictive accuracy while also exhibiting versatility in cross-species predictions, making it applicable to a wide range of biological systems, including interactions between human and viral proteins. Its ability to generalize across species, albeit with slightly reduced accuracy in phylogenetically distant organisms, underscores the critical role of protein language models for identifying interaction signals. Building upon these achievements, SENSE-PPI2 is introduced as an evolution of the original model. This improved version adopts a siamese neural network architecture similar to its predecessor; however, it incorporates a newly designed transformer-based decoder to extract richer information from the embeddings. SENSE-PPI2 was trained on an extensive dataset of binary physical protein-protein interactions across more than 10,000 species and offers improved generalization capabilities, exhibiting lower accuracy decay across the evolutionary tree. This results in better predictions even for phylogenetically distant organisms. Both models are capable of analyzing thousands of protein pairs in a relatively short period, making them well-suited for genome-wide predictions. They perform efficiently on large-scale datasets and can explore protein interactions at an unprecedented scale, contributing to the understanding of PPI networks across species. The improved generalization and predictive accuracy of SENSE-PPI, combined with its capacity to perform large-scale genome-wide screening, demonstrate its value as a tool for uncovering new molecular interactions and elucidating biological functions across species. These contributions not only enhance understanding of protein interactions but also pave the way for future developments in proteomics and systems biology.La bio-informatique s'impose rapidement comme une discipline cruciale, intégrant des données biologiques avec des méthodes informatiques pour démêler les systèmes biologiques complexes. Parmi les défis les plus importants dans ce domaine figure la compréhension des interactions protéine-protéine (IPP), qui sont au cœur de divers processus cellulaires tels que la transduction des signaux, les voies métaboliques ou les réponses du système immunitaire. Prédire ces interactions est essentiel tant pour la recherche biologique fondamentale que pour des domaines appliqués comme la découverte de médicaments et le traitement des maladies. Cependant, les méthodes expérimentales pour cartographier les IPP sont coûteuses en ressources et difficilement extensibles, ce qui conduit à un intérêt croissant pour les approches computationnelles. Prédire les IPP à partir de simples séquences d'acides aminés offre plusieurs avantages, notamment la capacité à traiter rapidement de grands ensembles de données et la flexibilité d'analyser des protéines même dans des organismes pour lesquels les données expérimentales sont limitées. Les méthodes de prédiction d'IPP basées sur les séquences offrent une alternative économique qui permet l'étude des protéomes à l'échelle du génome. Ces techniques computationnelles sont particulièrement utiles pour explorer les interactions dans des organismes non-modèles ou dans des contextes où les données expérimentales à haut débit ne sont pas disponibles, ouvrant ainsi la voie à des découvertes dans une vaste gamme d'espèces et de systèmes biologiques. Cette thèse présente les résultats du développement de SENSE-PPI, un modèle d'apprentissage profond basé sur les séquences, conçu pour prédire les IPP. Ce modèle exploite des modèles de langage protéique avancés, qui capturent les riches informations contenues dans les séquences protéiques, ainsi que des réseaux de neurones récurrents pour distinguer des interactions spécifiques au sein de vastes ensembles de protéines. SENSE-PPI démontre une grande précision prédictive tout en étant polyvalent dans les prédictions inter-espèces, ce qui le rend applicable à une large gamme de systèmes biologiques, y compris les interactions entre protéines humaines et virales. Sa capacité à généraliser entre les espèces, bien que légèrement réduite chez les organismes phylogénétiquement éloignés, souligne le rôle critique des modèles de langage protéique dans l'identification des signaux d'interaction. S'appuyant sur ces réalisations, SENSE-PPI2 est introduit comme une évolution du modèle original. Cette version améliorée adopte une architecture de réseau de neurones siamois similaire à son prédécesseur, mais incorpore un décodeur basé sur un transformateur nouvellement conçu pour extraire des informations plus riches des embeddings. SENSE-PPI2 a été entraîné sur un vaste ensemble de données d'interactions physiques binaires entre protéines couvrant plus de 10 000 espèces et offre des capacités de généralisation améliorées, avec une diminution de précision moindre à travers l'arbre phylogénétique. Cela se traduit par de meilleures prédictions, même pour les organismes phylogénétiquement éloignés. Les deux modèles sont capables d'analyser des milliers de paires de protéines en un temps relativement court, ce qui les rend bien adaptés aux prédictions à l'échelle du génome. Ces contributions non seulement améliorent la compréhension des interactions protéiques, mais ouvrent également la voie à de futurs développements en protéomique et en biologie des systèmes
Apprentissage profond pour prédire les réseaux d'interactions protéine-protéine au sein, à travers et entre les espèces à l'échelle du génome
La bio-informatique s'impose rapidement comme une discipline cruciale, intégrant des données biologiques avec des méthodes informatiques pour démêler les systèmes biologiques complexes. Parmi les défis les plus importants dans ce domaine figure la compréhension des interactions protéine-protéine (IPP), qui sont au cœur de divers processus cellulaires tels que la transduction des signaux, les voies métaboliques ou les réponses du système immunitaire. Prédire ces interactions est essentiel tant pour la recherche biologique fondamentale que pour des domaines appliqués comme la découverte de médicaments et le traitement des maladies. Cependant, les méthodes expérimentales pour cartographier les IPP sont coûteuses en ressources et difficilement extensibles, ce qui conduit à un intérêt croissant pour les approches computationnelles. Prédire les IPP à partir de simples séquences d'acides aminés offre plusieurs avantages, notamment la capacité à traiter rapidement de grands ensembles de données et la flexibilité d'analyser des protéines même dans des organismes pour lesquels les données expérimentales sont limitées. Les méthodes de prédiction d'IPP basées sur les séquences offrent une alternative économique qui permet l'étude des protéomes à l'échelle du génome. Ces techniques computationnelles sont particulièrement utiles pour explorer les interactions dans des organismes non-modèles ou dans des contextes où les données expérimentales à haut débit ne sont pas disponibles, ouvrant ainsi la voie à des découvertes dans une vaste gamme d'espèces et de systèmes biologiques. Cette thèse présente les résultats du développement de SENSE-PPI, un modèle d'apprentissage profond basé sur les séquences, conçu pour prédire les IPP. Ce modèle exploite des modèles de langage protéique avancés, qui capturent les riches informations contenues dans les séquences protéiques, ainsi que des réseaux de neurones récurrents pour distinguer des interactions spécifiques au sein de vastes ensembles de protéines. SENSE-PPI démontre une grande précision prédictive tout en étant polyvalent dans les prédictions inter-espèces, ce qui le rend applicable à une large gamme de systèmes biologiques, y compris les interactions entre protéines humaines et virales. Sa capacité à généraliser entre les espèces, bien que légèrement réduite chez les organismes phylogénétiquement éloignés, souligne le rôle critique des modèles de langage protéique dans l'identification des signaux d'interaction. S'appuyant sur ces réalisations, SENSE-PPI2 est introduit comme une évolution du modèle original. Cette version améliorée adopte une architecture de réseau de neurones siamois similaire à son prédécesseur, mais incorpore un décodeur basé sur un transformateur nouvellement conçu pour extraire des informations plus riches des embeddings. SENSE-PPI2 a été entraîné sur un vaste ensemble de données d'interactions physiques binaires entre protéines couvrant plus de 10 000 espèces et offre des capacités de généralisation améliorées, avec une diminution de précision moindre à travers l'arbre phylogénétique. Cela se traduit par de meilleures prédictions, même pour les organismes phylogénétiquement éloignés. Les deux modèles sont capables d'analyser des milliers de paires de protéines en un temps relativement court, ce qui les rend bien adaptés aux prédictions à l'échelle du génome. Ces contributions non seulement améliorent la compréhension des interactions protéiques, mais ouvrent également la voie à de futurs développements en protéomique et en biologie des systèmes.Bioinformatics is rapidly emerging as a crucial discipline, integrating biological data with computational methods to unravel complex biological systems. Among the most significant challenges in this field is understanding protein-protein interactions (PPIs), which are central to various cellular processes, such as signal transduction, metabolic pathways, or immune system responses. Predicting these interactions is essential for both fundamental biological research and applied areas like drug discovery and disease treatment. However, experimental methods for mapping PPIs are resource-intensive and not easily scalable, leading to a growing focus on computational approaches. Predicting PPIs from amino acid sequences alone offers several advantages, including the ability to process large datasets rapidly and the flexibility to analyze proteins even in organisms with limited experimental data. Sequence-based PPI prediction methods provide a cost-effective alternative that enables the study of proteomes at the genome-wide scale. These computational techniques are particularly beneficial for exploring interactions in non-model organisms or in contexts where high-throughput experimental data are unavailable, enabling discoveries across a broad range of species and biological systems. This thesis presents results from the development of SENSE-PPI, a sequence-based deep learning model designed to predict PPIs. This model leverages advanced protein language models, which capture the rich information embedded in protein sequences, and recurrent neural networks to distinguish specific interactions within vast protein datasets. SENSE-PPI demonstrates high predictive accuracy while also exhibiting versatility in cross-species predictions, making it applicable to a wide range of biological systems, including interactions between human and viral proteins. Its ability to generalize across species, albeit with slightly reduced accuracy in phylogenetically distant organisms, underscores the critical role of protein language models for identifying interaction signals. Building upon these achievements, SENSE-PPI2 is introduced as an evolution of the original model. This improved version adopts a siamese neural network architecture similar to its predecessor; however, it incorporates a newly designed transformer-based decoder to extract richer information from the embeddings. SENSE-PPI2 was trained on an extensive dataset of binary physical protein-protein interactions across more than 10,000 species and offers improved generalization capabilities, exhibiting lower accuracy decay across the evolutionary tree. This results in better predictions even for phylogenetically distant organisms. Both models are capable of analyzing thousands of protein pairs in a relatively short period, making them well-suited for genome-wide predictions. They perform efficiently on large-scale datasets and can explore protein interactions at an unprecedented scale, contributing to the understanding of PPI networks across species. The improved generalization and predictive accuracy of SENSE-PPI, combined with its capacity to perform large-scale genome-wide screening, demonstrate its value as a tool for uncovering new molecular interactions and elucidating biological functions across species. These contributions not only enhance understanding of protein interactions but also pave the way for future developments in proteomics and systems biology
Multilevel Development of Cognitive Abilities in an Artificial Neural Network
AbstractSeveral neuronal mechanisms have been proposed to account for the formation of cognitive abilities through postnatal interactions with the physical and socio-cultural environment. Here, we introduce a three-level computational model of information processing and acquisition of cognitive abilities. We propose minimal architectural requirements to build these levels and how the parameters affect their performance and relationships. The first sensorimotor level handles local nonconscious processing, here during a visual classification task. The second level or cognitive level globally integrates the information from multiple local processors via long-ranged connections and synthesizes it in a global, but still nonconscious manner. The third and cognitively highest level handles the information globally and consciously. It is based on the Global Neuronal Workspace (GNW) theory and is referred to as conscious level. We use trace and delay conditioning tasks to, respectively, challenge the second and third levels. Results first highlight the necessity of epigenesis through selection and stabilization of synapses at both local and global scales to allow the network to solve the first two tasks. At the global scale, dopamine appears necessary to properly provide credit assignment despite the temporal delay between perception and reward. At the third level, the presence of interneurons becomes necessary to maintain a self-sustained representation within the GNW in the absence of sensory input. Finally, while balanced spontaneous intrinsic activity facilitates epigenesis at both local and global scales, the balanced excitatory-inhibitory ratio increases performance. Finally, we discuss the plausibility of the model in both neurodevelopmental and artificial intelligence terms.</jats:p
SENSE-PPI reconstructs interactomes within, across, and between species at the genome scale
Summary: Ab initio computational reconstructions of protein-protein interaction (PPI) networks will provide invaluable insights into cellular systems, enabling the discovery of novel molecular interactions and elucidating biological mechanisms within and between organisms. Leveraging the latest generation protein language models and recurrent neural networks, we present SENSE-PPI, a sequence-based deep learning model that efficiently reconstructs ab initio PPIs, distinguishing partners among tens of thousands of proteins and identifying specific interactions within functionally similar proteins. SENSE-PPI demonstrates high accuracy, limited training requirements, and versatility in cross-species predictions, even with non-model organisms and human-virus interactions. Its performance decreases for phylogenetically more distant model and non-model organisms, but signal alteration is very slow. In this regard, it demonstrates the important role of parameters in protein language models. SENSE-PPI is very fast and can test 10,000 proteins against themselves in a matter of hours, enabling the reconstruction of genome-wide proteomes
Multi-elemental analysis of high-purity molybdenum by electrothermal vaporization inductively coupled plasma mass spectrometry
High purity molybdenum and its compounds are used for the synthesis of ionizing radiation detectors for search for dark matter and double beta decay. Properties of these detectors largely depend on their trace composition. The new mass-spectrometry with inductively coupled plasma (ICP-MS) and electrothermal vaporization (ETV) method was developed for the analysis of high-purity molybdenum. The samples were introduced into the ICP using the ETV device. The vaporization curves of matrix element (molybdenum) and trace elements were studied in detail. The dependence of analytical signal and limits of detection (LODs) of analytes versus ETV-ICP-MS instrumental parameters (ICP power, transport flow, ion optics settings) was established. The proposed method of ETV-ICP-MS analysis allowed us to control the content of 28 trace elements in high-purity molybdenum with a purity of 6N (99.9999% wt.) and provided LODs from 0.3 to 200 ng g-1. Using of ETV for ICP-MS analysis of molybdenum led to decreasing of the LODs of trace elements from 3 to 200 times comparing with ICP-MS analysis with standard sample introduction system. The validation of proposed ETV-ICP-MS method was performed by spike experiment and by comparing the results of ETV-ICP-MS, ICP-MS, and atomic absorption spectrometry with electrothermal vaporization (GFAAS) analysis.</jats:p
Multilevel development of cognitive abilities in an artificial neural network
International audienceSeveral neuronal mechanisms have been proposed to account for the formation of cognitive abilities through postnatal interactions with the physical and sociocultural environment. Here, we introduce a three-level computational model of information processing and acquisition of cognitive abilities. We propose minimal architectural requirements to build these levels, and how the parameters affect their performance and relationships. The first sensorimotor level handles local nonconscious processing, here during a visual classification task. The second level or cognitive level globally integrates the information from multiple local processors via long-ranged connections and synthesizes it in a global, but still nonconscious, manner. The third and cognitively highest level handles the information globally and consciously. It is based on the global neuronal workspace (GNW) theory and is referred to as the conscious level. We use the trace and delay conditioning tasks to, respectively, challenge the second and third levels. Results first highlight the necessity of epigenesis through the selection and stabilization of synapses at both local and global scales to allow the network to solve the first two tasks. At the global scale, dopamine appears necessary to properly provide credit assignment despite the temporal delay between perception and reward. At the third level, the presence of interneurons becomes necessary to maintain a self-sustained representation within the GNW in the absence of sensory input. Finally, while balanced spontaneous intrinsic activity facilitates epigenesis at both local and global scales, the balanced excitatory/inhibitory ratio increases performance. We discuss the plausibility of the model in both neurodevelopmental and artificial intelligence terms
