Bayessche virale Allelauswahl für die genomische SARS-CoV-2-Überwachung

In einer kürzlich veröffentlichten Studie bioRxiv* Preprint-Server bewerteten die Forscher die Selektionseffekte beim schweren akuten respiratorischen Syndrom Coronavirus 2 (SARS-CoV-2) mithilfe der Bayes’schen viralen Allelauswahl.

Verschiedene Studien haben über neuartige SARS-CoV-2-Mutationen berichtet, die mit einer erhöhten Übertragbarkeit, einer erhöhten Bindung an das Angiotensin-Converting-Enzym 2 (ACE2) und einer Antikörperumgehung in Verbindung gebracht wurden. Die funktionellen Konsequenzen solcher Mutationen und ihre Zusammenhänge mit der Fitness von SARS-CoV-2 sind jedoch noch unbekannt.

Studien: Ableitung von Selektionseffekten bei SARS-CoV-2 mit bayesianischer viraler Allel-Selektion. Bildnachweis: NIAID

Über das Studium

In der vorliegenden Studie entwickelten die Forscher die bayessche virale Allelauswahl, um die genetischen Faktoren zu bestimmen, die die unterschiedliche virale Fitness sowie die Wachstumsraten verschiedener SARS-CoV-2-Varianten beeinflussen.

Die vom Team entwickelte bayessche virale Allelauswahl (BVAS) ermöglichte die Berechnung der posterioren Einschlusswahrscheinlichkeit (PIP). Es wurde festgestellt, dass Allele mit hohen PIPs gute Kandidaten für die Beeinflussung der viralen Fitness sind. Das Team führte Vergleiche zwischen drei Methoden basierend auf der viralen Diffusion durch, darunter Mean Appearant Propagator (MAP), BVAS und Laplace.

Das Team bewertete die Empfindlichkeit von BVAS gegenüber Hyperparametern wie der Prioritätseinschlusswahrscheinlichkeit h und der vorherigen Genauigkeit τ. Der Wert von PIP in Bezug auf BVAS wurde auch durch Untersuchen der Sensitivität und Präzision auf Allelebene nachgewiesen, die beobachtet wurden, wenn die Allele mit PIPs von mehr als 0,1 als Treffer betrachtet wurden. Darüber hinaus schätzte das Team die relative virale Fitness aller SARS-CoV-2-Varianten, indem es das BVAS-Modell an die in verschiedenen Regionen gefundenen Allelhäufigkeiten anpasste.

Ergebnisse

Die Studienergebnisse zeigten, dass bei der Analyse der vier viralen Diffusionsmethoden die kausale Trefferquote mit der Anzahl der Regionen zunahm und mit der Anzahl der Allele abnahm. Die BVAS-Methoden zeigten die besten Trefferquoten unter den vier Methoden, während die Effizienz der MAP- und Laplace-Methoden bei Vorhandensein einer hohen Anzahl von Allelen signifikant gering war.

Die Empfindlichkeit von BVAS gegenüber τ betrug etwas mehr als vier Größenordnungen; jedoch nahm die Empfindlichkeit ab, wenn der Wert von τ sehr hoch war. Das Team beobachtete auch, dass der Wert der effektiven Populationsgröße (ν) eine entscheidende Rolle bei der BVAS-Empfindlichkeit spielte. Große Werte von ν zeigten an, dass Zuwächse in der Allelhäufigkeit von der deterministischen Drift abhängig waren. Andererseits deuteten kleine Werte von v darauf hin, dass die Allelfrequenzinkremente eine signifikante Variabilität aufwiesen, die in der deterministischen Drift vorherrschend war. Als das Team Allele mit PIPs über 0,1 als Treffer betrachtete, wurde eine hohe Präzision für BVAS beobachtet. Dies deutete darauf hin, dass Allele mit hohen PIP-Werten eher ursächlich mit der viralen Fitness in Verbindung stehen. Darüber hinaus wurde festgestellt, dass die effektive Populationsgröße um das 15-fache abnimmt, wenn die Stichprobenrate (ρ) von 64 % auf 1 % reduziert wird.

Die Abschätzung der Fitness von SARS-CoV-2-Linien zeigte, dass SARS-CoV-2 Omicron BA.2 die fitteste Linie war, gefolgt von Omicron BA.1, Delta, Alpha und der Wildtyp-Variante. Bemerkenswerterweise wiesen einige der phylogenetischen Zuordnungen benannter globaler Ausbruchslinien (PANGO) verschiedene Genotypen auf, die unterschiedlichen Wachstumsraten entsprachen. Das Team bemerkte auch, dass die Omicron-Variante in verschiedene Unterlinien zersplittert sei, deren Fitnessniveau sich im Laufe der Zeit verbessert habe. Die Omicron BA.2.12.2-Unterlinie erwies sich als die fitteste Linie, während andere BA.2-Unterlinien ebenfalls vergleichbare Fitnessniveaus aufweisen.

Positionen der Top-20-Spike-Hits, geordnet nach PIP, auf der Cryo-EM-Struktur eines Spike-Trimers, der an ACE2 (Magenta) gebunden ist, bei einer Auflösung von 3,9 Angström in der einzelnen RBD-„Up“-Konformation von (Zhou et al., 2020) B Vergrößerte Ansicht der RBD-ACE2-Schnittstelle, die die räumliche Nähe von S: R346, S: N339, S: N440, S: L452, S: S477, S: E484 und S: N501 zeigt.

Das Team fand auch rekombinante Abstammungslinien, die das Ergebnis von Rekombinationen zwischen BA.1 und BA.2 sowie Delta und BA.1 waren. Unter diesen waren XN und XT die geeignetsten Rekombinanten; Ihr Fitnessniveau war jedoch niedriger als das von BA.2 und höher als das von BA.1. Darüber hinaus deutete die Fitness bestehender Rekombinanten wie XA-XT darauf hin, dass die Fitness dieser rekombinanten Linien in naher Zukunft möglicherweise kein Anlass zur Sorge sein wird.

Die Analyse der SARS-CoV-2-Mutationen zeigte, dass das robusteste Selektionssignal im Spike (S)-Protein lag, mit der höchsten Signalkonzentration in der Rezeptorbindungsdomäne (RBD). Starke Selektionssignale wurden auch in der N-terminalen Domäne (NTD) sowie den Furin-Spaltstellen nachgewiesen. Unter Berücksichtigung der Effektstärke erwies sich die S:L452R-Mutation als der höchste Treffer und wurde in den Linien BA.4 / BA.5, B.1.427 und B.1.429 gefunden. Auch die Mutation S: L452Q hatte einen der höchsten Treffer und wurde in der Variante BA.2.12.2 gefunden.

Insgesamt zeigten die Studienergebnisse die Bedeutung der Bayes’schen viralen Allel-Selektionsmethode für das Verständnis der Selektionseffekte von SARS-CoV-2 und seinen aufkommenden Varianten.

* Wichtiger Hinweis

bioRxiv veröffentlicht vorläufige wissenschaftliche Berichte, die keinem Peer-Review unterzogen wurden und daher nicht als schlüssig angesehen werden sollten, die klinische Praxis / gesundheitsbezogenes Verhalten leiten oder als etablierte Informationen behandelt werden sollten.

.

Leave a Reply

Your email address will not be published.