Search CORE

24 research outputs found

Ask Your Distribution Shift if Pre-Training is Right for You

Author: Cohen-Wang Benjamin
Madry Aleksander
Vendrow Joshua
Publication venue
Publication date: 29/02/2024
Field of study

Pre-training is a widely used approach to develop models that are robust to distribution shifts. However, in practice, its effectiveness varies: fine-tuning a pre-trained model improves robustness significantly in some cases but not at all in others (compared to training from scratch). In this work, we seek to characterize the failure modes that pre-training can and cannot address. In particular, we focus on two possible failure modes of models under distribution shift: poor extrapolation (e.g., they cannot generalize to a different domain) and biases in the training data (e.g., they rely on spurious features). Our study suggests that, as a rule of thumb, pre-training can help mitigate poor extrapolation but not dataset biases. After providing theoretical motivation and empirical evidence for this finding, we explore two of its implications for developing robust models: (1) pre-training and interventions designed to prevent exploiting biases have complementary robustness benefits, and (2) fine-tuning on a (very) small, non-diverse but de-biased dataset can result in significantly more robust models than fine-tuning on a large and diverse but biased dataset. Code is available at https://github.com/MadryLab/pretraining-distribution-shift-robustness

arXiv.org e-Print Archive

Dataset Interfaces: Diagnosing Model Failures Using Controllable Counterfactual Generation

Author: Engstrom Logan
Jain Saachi
Madry Aleksander
Vendrow Joshua
Publication venue
Publication date: 15/02/2023
Field of study

Distribution shifts are a major source of failure of deployed machine learning models. However, evaluating a model's reliability under distribution shifts can be challenging, especially since it may be difficult to acquire counterfactual examples that exhibit a specified shift. In this work, we introduce dataset interfaces: a framework which allows users to scalably synthesize such counterfactual examples from a given dataset. Specifically, we represent each class from the input dataset as a custom token within the text space of a text-to-image diffusion model. By incorporating these tokens into natural language prompts, we can then generate instantiations of objects in that dataset under desired distribution shifts. We demonstrate how applying our framework to the ImageNet dataset enables us to study model behavior across a diverse array of shifts, including variations in background, lighting, and attributes of the objects themselves. Code available at https://github.com/MadryLab/dataset-interfaces

arXiv.org e-Print Archive

Learning low-rank latent mesoscale structures in networks

Author: Kureh Yacoub H.
Lyu Hanbaek
Porter Mason A.
Vendrow Joshua
Publication venue
Publication date: 25/07/2021
Field of study

It is common to use networks to encode the architecture of interactions between entities in complex systems in the physical, biological, social, and information sciences. Moreover, to study the large-scale behavior of complex systems, it is important to study mesoscale structures in networks as building blocks that influence such behavior. In this paper, we present a new approach for describing low-rank mesoscale structure in networks, and we illustrate our approach using several synthetic network models and empirical friendship, collaboration, and protein--protein interaction (PPI) networks. We find that these networks possess a relatively small number of `latent motifs' that together can successfully approximate most subnetworks at a fixed mesoscale. We use an algorithm that we call "network dictionary learning" (NDL), which combines a network sampling method and nonnegative matrix factorization, to learn the latent motifs of a given network. The ability to encode a network using a set of latent motifs has a wide range of applications to network-analysis tasks, such as comparison, denoising, and edge inference. Additionally, using our new network denoising and reconstruction (NDR) algorithm, we demonstrate how to denoise a corrupted network by using only the latent motifs that one learns directly from the corrupted networks.Comment: 55 pages, 14 figures, 1 tabl

arXiv.org e-Print Archive

Humanity's Last Exam

Author: Aaron Ashley
Abdoli Sherwin
Abramovitch Marcus
Achilleos Andrea
Agarwal Kanu Priya
Agnihotri Shashank
Agrawal Anish
Agu Chidozie
Alapont Xavier
Albani Guglielmo
Aldous David
Algaba Andres
Alley William
Ambay John Arnold
Anantheswaran Ujjwala
Anderson Daron
Anderson Earth
Andrew Favre D. O.
Andréoletti Jérémy
Ansarinejad Behzad
Antonenko Daniil S.
Apronti Archimedes
Ardito Cesare Giulio
Arkhipov Pavel
Arsene Pierrot
Aziz Muhammad Fayez
Bacho Aras
Bahaloo Mohsen
Balabanian George
Bari M Saiful
Barkan Shaul
Bartolo Max
Barzowski Stanislaw
Basler Luke
Bateman Greg
Ben-David Shalev
Berger Zachary
Berkani Mohammed
Bezzi Dario
Bogdanov Sergei
Bosio Carlo
Bradshaw Peter
Bran Andres M
Brown Ethan D. L.
Brown Zachary
Brüssel Lina
Bugas Daniel
Burns Noah
Bálint Biró
Cai Jiaqi
Cao Hangrui
Carauleanu Marc
Carmi Avishy
Carroll Micah
Cavalleri Stefano
Cavanagh Joseph M
Cheatom Antrell
Chen Evan
Chen Michael
Chen Qijia
Chen Yanxu
Chen Ziye
Cheng Zerui
Chern Steffi
Chidambaram Muthu
Choi Michael
Chopra Arnav
Ciobâcă Stefan
Clark Ronald
Clarke Don
Cohen Michael K.
Cohen Niv
Cojoc Doru
Coleman Shannon
Coppola Brian P
Creighton Scott
Crisostomi Donato
Crispino Nick
Crowson Sarah-Jane
Crozier Jonathan
Cunningham David M.
Daans Nicolas
Dasouqi Ali
de Witt Christian Schroeder
Dehghan Ali
Demian Christoph
den Houte Kelsey Van
Dhamane Omkar
Dias Felipe Meneguitti
Dieuleveut Aymeric
Dobarskyi Kostiantyn
Doroshenko Mikhail
Drori Jacob
Duc Emilien
Duclosel Darling
Duersch Joshua
Efremov Denis
Eicher Jonathan
Ekström Fredrik
EL-Wasif Zienab
Elgnainy Hossam
Elser Veit
Enyekwe Innocent
Eron Murat
Fan Honglu
Faraboschi Paolo
Farhidi Faraz
Feng Fiona
Feng Steven Y.
Finke Lennart
Firsching Moritz
Fish Sara
Fossum Carl J
Foster Michael
Fournier-Facio Francesco
Fraga Natanael Wildner
Friedrich Alena
Galal Abdallah
Galgon Geoff
Gangal Varun
Garretson Alexis C
Gatti Alice
Gehrunger Tim
Gerbicz Robert
Giboney Zachary
Gimenez Javier
Giordano Paolo
Giska Fabian
Givré Alan
Gloor Luk
Goertzen Tom
Goldfarb Alan
Golshani Bita
Gonzalez Daniel Espinosa
Goryachev Vladimir
Goshu Gashaw M.
Goswami Laxman Prasad
Green Sean R.
Gritsevskiy Andrew
Gross Jason
Guillod Julien
Gusev Ilya
Gustafsson Nils
Haffenden Hector
Hammon Angela
Han Ziwen
Harris Carter
Hartman Taylor D.
Hausenloy Jason
Hava Dan Bar
He Hao
Heidinger Haline
Heimonen JP
Held William
Hernández-Cámara Pablo
Heydari Nasser
Ho Andrew
Ho Linh
Hoerr Ryan G.
Hogg Tad
Holmes David
Hossain Zaki
Hu Josephina
Hu Yuzheng
Huy Tran Đuc
Imperial Joseph Marvin
Inlow Mark H
Iskra Oleg
Ivanov Alexander
Ivanov Sergey
Ivanov Stefan
Jackson Joseph W.
Jagota Milind
Jain Yashaswini
Jansen Thorben
Jeanplong Ferenc
Jin Alvin
Jin Jaehyeok
Jin Jun
Jones Adam
Joshi Prashant
Junior Benedito Alves de Oliveira
Kaddar Younesse
Kalinin Mikhail
Kamalov Firuz
Kamdoum Ariel Ghislain Kemogne
Kaparov Nurdin
Kassahun Haile
Kassani Peyman
Kazakov Mstyslav
Kazemi Fereshteh
Kazibwe Zakayo
Khoja Adam
Khoury Seri
Khánh Tran Quoc
Kim Dae Hyun
Kim Ryan
Kirchner Jan Hendrik
Klose Immo
Kolt Noam
Koppel James
Kopylov Alexei
Korbak Tomek
Krause Michael
Kreiman Tobias
Krenek Keith
Kretov Egor
Kuchkin Aleksey
Kuchkin Vladyslav
Kumar Pawan
Kvistad Lynna
Labrador Yan Carlos Leyva
Lackner Martin
Lai Jesyin
Lamparth Max
Lauer Pascal
Lauff Robert
Le Vinh-Kha
Lee Jaeho
Lee Sangwon
Lee Yongki
Lengler Johannes
Ler Dylan
Leser Julian Noah
Leventov Roman
Levin John-Clark
Lewark Lukas
Li Bikun
Li Daofeng
Li Jeffery
Li Lianghui
Li Nathaniel
Li Yuqi
Liang Kaiqu
Lim Derek
Ling John
Loader Jacob
Loiseau Gabriel
Looi Shi-Zhuo
Loume Gautier Abou
Luca G. Bruno De
Lukas Marco
Lynch Jayson
Ma Wenjie
Ma Ziqiao
Maar John
Magoulas Ilias
Maheshwari Rajat
Mahmood Mobeen
Makarychev Yury
Maksimov Andrey Pupasov
Malishev Dmitry
Manik Timothy
Manolescu Ciprian
Marion Pierre
Martin Freddie
Martinez Dakotah
Matos Jason O.
Mazeika Mantas
McAlister Isaac C.
McCarty Ben
Medley George
Meer Khalida
Menezes Aline
Menshawy Ahmed
Meril Eli
Merrill William
Mikov Aleksandar
Milbauer Jeremiah
Mishra Subrata
Moat Richard
Mofayezi Mohammadreza
Mohamed Mohanad
Mohammadzadeh Forough
Montgomery Kyle
Morak Wiktor
Mostaghimi Hamid
Motwani Sumeet
Moyano Alejandro José
Muennighoff Niklas
Munro Daniel
Muzhen Jiang
Myklebust Benjamin
Mündler Niels
Naiya Mohinder Maheshbhai
Nam Jungbae
Nandor Mark
Nevirkovets Volodymyr
Nguyen Jeremy
Nguyen Tung
Nie Yuzhou
Noever David
Oliveira Edson
Oller Martí
Olszewska Katarzyna
Orel Daniil
Ovchynnikov Maksym
Padlewski Piotr
Pageler Ben
Pan Jiayi
Pandey Rohan
Paradise Orr
Park Hyunwoo
Patel Arkil
Patel Oam
Patramanis Demosthenes
Perez Rayner Hernandez
Perrella David
Petersen Philipp
Peñaflor Madellene
Phan Long
Phillips Shaun
Piccardo Marco
Pinto Antonella
Piperski Alexander
Platnick Jacob
Pokutnyi Oleksandr
Popov Serguei
Poritski Vladislav
Poświata Rafał
Prabhu Ameya
Pradeep Ronak
Press Ori
Preu Thomas
Pyda Daniel
Qazi Usman
Radionov Maksim
Ramakrishnan Kalyan
Rao Arun
Rawal Kaivalya
Redenti Andrew
Remy Nicolas
Ren Qiuyu
Ren Richard
Reuel Anka
Riis Søren
Rissone Paolo
Roberts Jonathan
Robinson Joshua
Rodman Emma
Rodriguez Miguel Orbegozo
Rogers T. Ryan
Rossbach Vivien
Rosu Paul
Roth Marc
Rozhoň Václav
Sahu Anmol
Sakal Taom
Sakor Ahmad
Salazar Julian
Samuele Fortuna
Sanchez Alvaro
Sandlin Jennifer
Santens Tim
Santos Emily de Oliveira
Sauers Scott
Sayed Mohamed
Sayous Rafael
Schmitt Johannes
Schneider Keith
Schoelkopf Hailey
Schut Lisa
Schwaller Philippe
Semler Avi
Sen Archan
Senthilkuma Shaipranesh
Shaaban Mohamed
Shah Imad Ali
Shah Jainam
Shah Shailesh
Shah Tej
Shahrtash Hossein
Sharma Asankhaya
Shen Alexander
Shen Jiawei
Shenoy Adithya
Shi Jack Wei Lun
Shi Sean
Shukla Abhishek
Shukla Priti
Siddh Sheeshram
Sileo Damien
Singer Eric
Singh Ankit
Singh Mukhwinder
Singh Virendra
Singhal Raghav
Sivarajan Shankar
Sommerhage Frank
Soori Saeed
Soroko Ignat
Sparrow Claire
Sridhar Kaustubh
Stade Jack
Stambaugh Nate
Stander Dashiell
Stanley Richard
Stap David
Stehberger Martin
Steinerberger Stefan
Stendall Ryan
Stokes Alun Cennyth
Stump Christian
Sucholutsky Ilia
Sun Gongbo
Sun Kunyang
Sun Yewen
Sypt Lynn Van Der
Szlyk Hannah
Sztyber-Betley Anna
Taamazyan Vage
Tam Joanna
Tang Colin
Tang Henry
Tang Longke
Tang Ning
Tarver Tim
Taylor Edwin
Tee Allison
Terpin Antonio
Thaman Kunvar
Thaman Kushal
Thornley Elliott
Tkadlec Josef
Tomasiello Alessandro
Tordera Daniel
Tucker-Foltz Jamie
Twayana Moon
Uro Justine Leon
Usawasutsakorn Siranut
Utpala Saiteja
Uzhou Mikalai
Veith Johannes
Vendrow Edward
Vendrow Joshua
Verbeken Brecht
Verma Shreyas
Vilchis Tobias Garcia
Vilchis Victor Efren Guadarrama
Vincze Mátyás
Wang Chenguang
Wang Harrison K
Wang Jessica P.
Wang Jiaqi
Wang Michael
Wang Ting
Wang Zihan
Wang Zihao
Wang Zixuan
Wehr Dustin
Weller Orion
Wheeler Richard
Whitfill Parker
Willcocks Chris G.
Williamson Dominic
Wolff Hew
Wydallis John
Wydallis John B.
Wykowski Julian
Xavier Joan of Arc
Xian Ruicheng
Xu Hanmeng
Xu Jiangnan
Yacar Laila
Yang Jinzhou
Yang Tong
Yeadon Will
Yong Zheng-Xin
Yu Michael
Yuan Michelle X
Yuan Qiaochu
Zampese Jennifer
Zang Allen
Ze-An Ng
Zebaze Armel Randy
Zenitani Kengo
Zhang Anji
Zhang David K.
Zhang Gang
Zhang Hugh
Zhang Ling
Zhang Oliver
Zhang Robin
Zhang Wenjin
Zhao Bingchen
Zhao Haoran
Zhao Sandy
Zhelnov Pavel
Zheltonozhskii Evgenii
Zheng Eric
Zhidkovskaya Alina Borisovna
Zhou Kevin
Zhou Xiaoxiang
Zhu Kelin
Zou Andy
Zou Chelsea
Zu Yuexuan
Zvonkine Dimitri
Zweiger Adam
Ängquist Ivar
Publication venue
Publication date: 24/01/2025
Field of study

Benchmarks are important tools for tracking the rapid advancements in large language model (LLM) capabilities. However, benchmarks are not keeping pace in difficulty: LLMs now achieve over 90\% accuracy on popular benchmarks like MMLU, limiting informed measurement of state-of-the-art LLM capabilities. In response, we introduce Humanity's Last Exam (HLE), a multi-modal benchmark at the frontier of human knowledge, designed to be the final closed-ended academic benchmark of its kind with broad subject coverage. HLE consists of 3,000 questions across dozens of subjects, including mathematics, humanities, and the natural sciences. HLE is developed globally by subject-matter experts and consists of multiple-choice and short-answer questions suitable for automated grading. Each question has a known solution that is unambiguous and easily verifiable, but cannot be quickly answered via internet retrieval. State-of-the-art LLMs demonstrate low accuracy and calibration on HLE, highlighting a significant gap between current LLM capabilities and the expert human frontier on closed-ended academic questions. To inform research and policymaking upon a clear understanding of model capabilities, we publicly release HLE at https://lastexam.ai

The University of Manchester - Institutional Repository

Humanity's Last Exam

Author: Aaron Ashley
Abdoli Sherwin
Abramovitch Marcus
Achilleos Andrea
Adesanya Fatimah
Adoul Zahra
Agarwal Arunim
Agarwal Kanu Priya
Aggarwal Daattavya
Agnihotri Shashank
Agrawal Anish
Agu Chidozie
Akov Ido
Alapont Xavier
Alarab Ismail
Albani Guglielmo
Albanie Samuel
Aldous David
Algaba Andres
Ali Sam
Alley William
Aly Rami
Amaro Brian
Ambay John Arnold
Amit Alon
Anantheswaran Ujjwala
Anderson Daron
Anderson Earth
Andrew Favre D. O.
Andréoletti Jérémy
Ansarinejad Behzad
Antonenko Daniil S.
Apronti Archimedes
Ardito Cesare Giulio
Arkhipov Pavel
Arnaboldi Luca
Arsene Pierrot
Arthornthurasuk Siriphan
Askew Luke
Avagian David
Aziz Muhammad Fayez
Bacho Aras
Bacho Kaniuar
Bacho Renas
Bahaloo Mohsen
Balabanian George
Bari M Saiful
Barkan Shaul
Bartolo Max
Barzowski Stanislaw
Basler Luke
Bateman Greg
Battaglia Mike
Ben-David Shalev
Berger Zachary
Berkani Mohammed
Bezzi Dario
Bian Song
Bigi Filippo
Bodur Omer Faruk
Bogdanov Sergei
Borbás Benjámin
Boscá M. C.
Bosio Carlo
Bosio Ida
Bradshaw Peter
Bran Andres M
Brenner Michael P.
Brito-Santana Leonor
Brooks Matthew
Brown Ethan D. L.
Brown Zachary
Brüssel Lina
Bugas Daniel
Burdzy Krzysztof
Burns Noah
Bálint Biró
Caciolai Andrea
Cai Jiaqi
Cai Will
Campbell Russell
Cao Hangrui
Carauleanu Marc
Carmi Avishy
Carroll Micah
Cartwright Ashley
Cavalleri Stefano
Cavanagh Joseph M
Ceconello Chiara
Cheatom Antrell
Chen Evan
Chen Michael
Chen Qijia
Chen Yanxu
Chen Ziye
Cheng Vincent
Cheng Zerui
Chern Steffi
Chhablani Gunjan
Chidambaram Muthu
Choi Michael
Chopra Arnav
Chu Eric
Ciobâcă Stefan
Clark Ronald
Clarke Don
Clavier Pierre
Cohen Michael K.
Cohen Niv
Cojoc Doru
Cole Joshua
Coleman Shannon
Colino Jesus
Coppola Brian P
Cosma Adrian
Costa Mariana
Creighton Scott
Crisostomi Donato
Crispino Nick
Crowson Sarah-Jane
Crozier Jonathan
Cunningham David M.
Daans Nicolas
Dai Liangti
Dai Linjie
Dasouqi Ali
de Witt Christian Schroeder
Degorre Julien
Dehghan Ali
Delaney Ethan
Demian Christoph
Demir Gözdenur
den Houte Kelsey Van
Dendane Abdelkader
Dhamane Omkar
Dias Felipe Meneguitti
Dick Anna-Katharina
Dieuleveut Aymeric
Dobarskyi Kostiantyn
Doroshenko Mikhail
Douville Guillaume
Drori Jacob
Du Zhehang
Duc Emilien
Ducey Josh
Duclosel Darling
Duersch Joshua
Durand Stephane
Efremov Denis
Eicher Jonathan
Ekström Fredrik
EL-Wasif Zienab
Elgnainy Hossam
Elser Veit
Enyekwe Innocent
Eron Murat
Fan Honglu
Fan Jing
Fan Jingxuan
Fan Yiyang
Faraboschi Paolo
Farhidi Faraz
Farina Nicholas
Fasiludeen Arshad Anil
Feng Fiona
Feng Steven Y.
Ferreira Danyelle
Ferret Johan
Finke Lennart
Finocchio Ross
Firsching Moritz
Fish Sara
Fossum Carl J
Foster Michael
Fournier-Facio Francesco
Fraga Natanael Wildner
Franca Antonio
Friday Cary
Friedrich Alena
Fruhauff Tony
Galal Abdallah
Galgon Geoff
Gangal Varun
Garretson Alexis C
Gatti Alice
Gehrunger Tim
Gerbicz Robert
Giboney Zachary
Gimenez Javier
Ginis Vincent
Giordano Paolo
Giska Fabian
Givré Alan
Gloor Luk
Goertzen Tom
Goldfarb Alan
Golshani Bita
Gonzalez Daniel Espinosa
Gonzalez Juan
Gonzalez Juan Carlos
Gopi Sivakanth
Goryachev Vladimir
Goshu Gashaw M.
Goswami Laxman Prasad
Grabb Declan
Green Sean R.
Gritsevskiy Andrew
Gross Jason
Grover Rynaa
Guillod Julien
Gul Shreen
Gundlach Hans
Gupta Himanshu
Gurdogan Hubeyb
Gusev Ilya
Gustafsson Nils
Habibi Farzad
Haffenden Hector
Halasyamani Shiv
Hallman Eric
Hammon Angela
Han Ziwen
Handoko Indria
Harjadi Chris
Harris Carter
Hartman Taylor D.
Hausenloy Jason
Hausknecht Kaylie
Hava Dan Bar
He Hao
Heidinger Haline
Heimonen JP
Held William
Hendrycks Dan
Hernández-Cámara Pablo
Heydari Nasser
Ho Andrew
Ho Linh
Hoang Hieu
Hoback Sarah
Hoerr Ryan G.
Hogg Tad
Hollom Lawrence
Holmes David
Hoover Alex
Hossain Zaki
Hu Josephina
Hu Yuzheng
Huanxu
Hulbert Dave
Huy Tran Đuc
Häggström Olle
Imperial Joseph Marvin
Inlow Mark H
Iskra Oleg
Islam Murat
Ivanov Alexander
Ivanov Sergey
Ivanov Stefan
Iyer Krishnamurthy
Jackson Abram
Jackson Joseph W.
Jagota Milind
Jain Yashaswini
Jallon Antoine
Jansen Thorben
Jeanplong Ferenc
Jiang Tong
Jiang Xi
Jiang Yibo
Jin Alvin
Jin Jaehyeok
Jin Jun
Johnson Bryan
Jones Adam
Joshi Prashant
Junior Benedito Alves de Oliveira
Kaddar Younesse
Kalinin Mikhail
Kamalov Firuz
Kamdoum Ariel Ghislain Kemogne
Kaparov Nurdin
Karakoc Ali
Karim Loukmane
Kassahun Haile
Kassani Peyman
Kazakov Dmitry
Kazakov Mstyslav
Kazemi Fereshteh
Kazibwe Zakayo
Kelley Elizabeth
Khoja Adam
Khoury Seri
Khánh Tran Quoc
Kim Dae Hyun
Kim Evan
Kim Ryan
Kim Wanyoung
Kirchhof Michael
Kirchner Jan Hendrik
Kirtland Aaron
Klose Immo
Koech Alice
Kolt Noam
Koppel James
Kopylov Alexei
Korbak Tomek
Kratish Yosi
Krause Michael
Kreiman Tobias
Krenek Keith
Kretov Egor
Kuchkin Aleksey
Kuchkin Vladyslav
Kumar Harsh
Kumar Pawan
Kvistad Lynna
Labrador Yan Carlos Leyva
Lackner Martin
Lai Jesyin
Lai John
Lamparth Max
Lang Leon
Lauer Pascal
Lauff Robert
Laurendeau Julien
Le Vinh-Kha
Lee Jaeho
Lee Sangwon
Lee Yongki
Lengler Johannes
Ler Dylan
Leser Julian Noah
Leventov Roman
Levin John-Clark
Lewark Lukas
Li Bikun
Li Daofeng
Li Jeffery
Li Lianghui
Li Nathaniel
Li Wen-Ding
Li Xiuyu
Li Yuqi
Liakhovitskaia Anna
Lian Lu Yun
Liang Kaiqu
Lim Derek
Lindsey Jack
Ling John
Liu J.
Lo Eve J. Y.
Loader Jacob
Loh Kang Yong
Loiseau Gabriel
Long AC
Looi Shi-Zhuo
Lorena Ricardo
Loume Gautier Abou
Luca G. Bruno De
Lukas Marco
Lux Thomas C. H.
Lynch Jayson
Ma Wenjie
Ma Ziqiao
Maar John
Maayan Gabe
Maghsoudimehrabani Mohammad
Magoulas Ilias
Maheshwari Rajat
Mahmood Mobeen
Makarychev Yury
Maksapetyan Aleksandr
Maksimov Andrey Pupasov
Malina Stephen
Malishev Dmitry
Malod Guillaume
Manik Timothy
Manolescu Ciprian
Mao Mao
Mariji Hodjat
Marion Pierre
Martin Freddie
Martinez Dakotah
Martinson Sarah
Matos Jason O.
Mavroudis Vasilios
Mazeika Mantas
McAlister Isaac C.
McCarty Ben
McGowan Joseph
McInnis I. M. J.
Medley George
Meer Khalida
Mehkary Mustafa
Mendoza Sandra
Menezes Aline
Mensah Stephen
Menshawy Ahmed
Meril Eli
Merrill William
Mikov Aleksandar
Milbauer Jeremiah
Milliron Hsiaoyun
Minissi Ali M. R.
Mirabadi Ali Khajegili
Mishra Subrata
Moat Richard
Mofayezi Mohammadreza
Mohamed Mohanad
Mohammadzadeh Forough
Montecillo Roselynn Grace
Montgomery Kyle
Morak Wiktor
Mostaghimi Hamid
Motwani Sumeet
Mourrat Jean-Christophe
Moyano Alejandro José
Muennighoff Niklas
Munro Daniel
Muzhen Jiang
Myklebust Benjamin
Möller Sören
Mündler Niels
Naiya Mohinder Maheshbhai
Nam Jungbae
Nandor Mark
Narayan Himanshu
Nevirkovets Volodymyr
Nguyen Jeremy
Nguyen Tung
Ni Colin
Nie Yuzhou
Noever David
Obikoya Gbenga Daniel
Okutsu Kenchi
Oliveira Edson
Oller Martí
Olszewska Katarzyna
Orel Daniil
Outevsky David
Ovchynnikov Maksym
Padlewski Piotr
Pageler Ben
Pan Jiayi
Pandey Rohan
Paradise Orr
Park Haon
Park Hyunwoo
Patel Arkil
Patel Oam
Patil Deepakkumar
Patramanis Demosthenes
Patwardhan Tejal
Pena Rodrigo De Oliveira
Pereira Roberto
Perez Rayner Hernandez
Peristyy Anton
Perrella David
Perry Samuel
Peskoff Denis
Petersen Philipp
Peñaflor Madellene
Pham Diana T.
Phan Long
Phillips Shaun
Piccardo Marco
Pinto Antonella
Piperski Alexander
Platnick Jacob
Plecnik Rebeka
Pokutnyi Oleksandr
Popescu Mara
Popov Serguei
Poritski Vladislav
Portier Julien
Pottmaier Daphiny
Pouriamanesh Rasoul
Poświata Rafał
Prabhu Ameya
Pradeep Ronak
Press Ori
Preu Thomas
Pronin Alexey
Pyda Daniel
Qazi Usman
Qi Hao
Qin Juehang
Radhakrishnan Anil
Radionov Maksim
Ragoler Alon
Rai Aanchal
Ramakrishnan Kalyan
Ramirez-Trinidad Angel
Rank Ben
Rao Arun
Rawal Kaivalya
Raynor Brad
Recchia Gabriel
Redenti Andrew
Reidegeld Frank
Remy Nicolas
Ren Qiuyu
Ren Richard
Resman Nate
Reuel Anka
Riblet Robin
Riis Søren
Rissone Paolo
Roberts Jonathan
Robins Jules
Robinson Joshua
Robinson Joshua
Rodman Emma
Rodolà Emanuele
Rodriguez Miguel Orbegozo
Rodríguez Raúl Adrián Huerta
Rogers T. Ryan
Rosa Florencia de la
Rossbach Vivien
Rosu Paul
Roth Marc
Rozhoň Václav
Safdari Mohammad
Sahu Anmol
Sakal Taom
Sakor Ahmad
Salauddin Sk Md
Salazar Julian
Samuele Fortuna
Sanchez Alvaro
Sandlin Jennifer
Santens Tim
Santos Emily de Oliveira
Santos Tania C. B.
Sauers Scott
Saxena Prajvi
Sayed Mohamed
Sayous Rafael
Scaria Kevin Joseph
Schmitt Johannes
Schneider Keith
Schoelkopf Hailey
Schut Lisa
Schwaller Philippe
Scipio Eshawn Jessica
Segev Ben
Semler Avi
Sen Archan
Senthilkuma Shaipranesh
Shaaban Mohamed
Shah Imad Ali
Shah Jainam
Shah Shailesh
Shah Tej
Shahid Syed M.
Shahrtash Hossein
Shamseldeen Samir
Shapourian Hassan
Sharma Asankhaya
Shen Alexander
Shen Jiawei
Shenoy Adithya
Sherman Glen
Shi Jack Wei Lun
Shi Sean
Shinde D. P.
Shukla Abhishek
Shukla Priti
Shulga Nikita
Shumar Oleg
Siddh Sheeshram
Siddiqi Muhammad Rehan
Sidhu Jasdeep
Sileo Damien
Silva Gabriel Poesia Reis e
Sims Blake
Singer Eric
Singh Ankit
Singh Mukhwinder
Singh Virendra
Singhal Raghav
Sivarajan Shankar
Sommerhage Frank
Somrak Maja
Soori Saeed
Soroko Ignat
Souza Victor
Sparrow Claire
Sponselee Koen
Sridhar Kaustubh
Stade Jack
Stambaugh Nate
Stander Dashiell
Stanley Richard
Stap David
Stehberger Martin
Steinerberger Stefan
Stendall Ryan
Stepanic Stanley
Stokes Alun Cennyth
Stump Christian
Sucholutsky Ilia
Sun Gongbo
Sun Kunyang
Sun Yewen
Sypt Lynn Van Der
Szlyk Hannah
Sztyber-Betley Anna
Taamazyan Vage
Taheri Omid
Tam Joanna
Tan Justin
Tang Colin
Tang Henry
Tang Longke
Tang Ning
Tanwie Ngefor Mildred
Tarver Tim
Tawfeek Andrew R.
Taylor Edwin
Tee Allison
Terpin Antonio
Thaman Kunvar
Thaman Kushal
Thornley Elliott
Tiryakioglu Murat
Tkadlec Josef
Tomasiello Alessandro
Tordera Daniel
Tucker-Foltz Jamie
Twayana Moon
Uro Justine Leon
Usawasutsakorn Siranut
Utpala Saiteja
Uzhou Mikalai
Vajipey Vivek
Vargus Freddie
Vaz Warren S.
Veith Johannes
Vendrow Edward
Vendrow Joshua
Verbeken Brecht
Vergo Eric
Verkama Emil
Verma Shreyas
Vetoshkin Lavr
Vilchis Tobias Garcia
Vilchis Victor Efren Guadarrama
Vincze Mátyás
Vinnikov Vladimir
Votava Jacob
Wang Alexandr
Wang Chenguang
Wang Erik Y.
Wang Harrison K
Wang Jessica P.
Wang Jiaqi
Wang Michael
Wang Ting
Wang Yuzhou
Wang Zihan
Wang Zihao
Wang Zixuan
Weber Brian
Weber Simon
Wehr Dustin
Weller Orion
Wheeler Richard
White Colin
Whitfill Parker
Willcocks Chris G.
Williamson Dominic
Wolff Hew
Wu Wentao
Wydallis John
Wydallis John B.
Wykowski Julian
Xavier Joan of Arc
Xian Ruicheng
Xin Linwei
Xu Hanmeng
Xu Jiangnan
Xu Justin
Yacar Laila
Yakimchyk Alesia
Yalın Yiğit
Yan Minghao
Yang Jinzhou
Yang Tong
Yeadon Will
Yong Zheng-Xin
Yu Michael
Yuan Michelle X
Yuan Qiaochu
Yue Summer
Zampese Jennifer
Zang Allen
Ze-An Ng
Zebaze Armel Randy
Zekry Mohamed
Zenitani Kengo
Zhang Anji
Zhang David K.
Zhang Gang
Zhang Hugh
Zhang Ling
Zhang Lixin
Zhang Oliver
Zhang Robin
Zhang Wenjin
Zhang Xinyu
Zhao Bingchen
Zhao Haoran
Zhao Sandy
Zhelnov Pavel
Zheltonozhskii Evgenii
Zheng Eric
Zhidkovskaya Alina Borisovna
Zhou Kevin
Zhou Xiaoxiang
Zhou Yuchen Anna
Zhu Kelin
Zhuang Chao
Zou Andy
Zou Chelsea
Zu Yuexuan
Zvonkine Dimitri
Zweiger Adam
Ängquist Ivar
Łucki Jakub
Publication venue
Publication date: 24/01/2025
Field of study

The University of Manchester - Institutional Repository

On the Relation of Gene Essentiality to Intron Structure: A Computational and Deep Learning Approach

Author: Edward Vendrow
Elan Schonfeld
Ethan Schonfeld
Joshua Vendrow
Publication venue: Cold Spring Harbor Laboratory
Publication date: 01/04/2020
Field of study

AbstractIdentification and study of human-essential genes has become of practical importance with the realization that disruption or loss of nearby essential genes can introduce latent-vulnerabilities to cancer cells. Essential genes have been studied by copy-number-variants and deletion events, which are associated with introns. The premise of our work is that introns of essential genes have characteristic properties that are distinct from the introns of nonessential genes. We provide support for the existence of characteristic properties by training a deep learning model on introns of essential and nonessential genes and demonstrated that introns alone can be used to classify essential and nonessential genes with high accuracy (AUC of 0.846). We further demonstrated that the accuracy of the same deep-learning model limited to first introns will perform at an increased level, thereby demonstrating the critical importance of introns and particularly first introns in gene essentiality. Using a computational approach, we identified several novel properties of introns of essential genes, finding that their structure protects against deletion and intron-loss events, and that these traits are especially centered on the first intron. We showed that GC density is increased in the first introns of essential genes, allowing for increased enhancer activity, protection against deletions, and improved splice-site recognition. Furthermore, we found that first introns of essential genes are of remarkably smaller size than their nonessential counterparts, and to protect against common 3’ end deletion events, essential genes carry an increased number of (smaller) introns. To demonstrate the importance of the seven features we identified, we trained a feature–based model using only information from these features and achieved high accuracy (AUC of 0.787).</jats:p

Crossref