Benutzer:Dirk123456/Baustellenbaustelle 001/Baustelle-3/Baustelle-3.27

Oberhalb des Artikels

Bearbeiten
Hintergrund
Bearbeiten

Im September 2021 sind im Artikel SARS-CoV-2 neue Angaben zur Systematik aufgetaucht, mit denen ich mich eingehender beschäftigen wollte. Das Ganze gestaltete sich recht kompliziert, weil es eine „alte“ Taxonomie gibt, die nur zur Virusart auflöst und unterhalb der Art nur von Kladen, Linien usw. die Rede ist. In Baustelle-D.42 habe ich mich seit Mitte Sep. 2021 mit einem Entwurf einer Diskussion zu einer Anfang Sep. 2021 eingestellten Abbildung befasst.

Sowohl bei der „äußeren“ als auch bei der „innere Systematik“ fehlen Erklärungen für die verwendeten Begriffe. Das sind z. B. Wörter, die pangolin und pango enthalten. Deshalb habe ich Ende Oktober danach gesucht. Der Ausdruck pangolin wird seit 2020 nicht nur für das Tier im Englischen (en:Pangolin), sondern als „Pangolin“, anstatt des richtigen Ausdrucks „Schuppentier“, auch zunehmend in deutschen Texten gefunden. Darüber hinaus gibt es die Software PANGOLIN und andere Wörter, die davon abgeleitet den Teilausdruck pango verwenden.

In der deutschen Wikipedia hat es Ende Oktober 2021 (z. Z. 29.10.'21) keinen „Nicht-Schuppentier-"pangolin"-Artikel“ gegeben. In der englischen Wikipedia habe ich mit dem Ausdruck pangolin neben dem Lemma für das Tier eine Begriffsklärungsseite (BKL) gefunden [ en:Pangolin_(disambiguation) ]. Von dort wird u. a. auf das Lemma en:Phylogenetic Assignment of Named Global Outbreak Lineages verwiesen, dass eine Software beinhaltet.

Der Teilausdruck pango wurde in der deutschen Wikipedia keinem Schuppentiere zugeordnet. Pango ist eine Software (und eine andere Bezeichnung für das Musikinstrument Bangwe); eine Begriffsklärungsseite gibt es nicht.

In der englischen Wikipedia führt pango zur Begriffsklärungsseite [ Pango_(disambiguation) ]. Dort ist Pango an erster Stelle eine Software-Bibliothek (ohne eigenes Lemma), hat aber alle möglichen Bedeutungen und unter „Siehe auch“ kommt an vorletzter Stelle der Eintrag für das Schuppentier (dort Link nach en:Pangolin, übersetzter Stichpunkt: „ein schuppiger Ameisenbär, der einem großen Gürteltier ähnelt“) und an letzter Stelle steht der Stichpunkt für die Software und das Nomklatursystem bezüglich SARS-CoV-2:

  • „Phylogenetic Assignment of Named Global Outbreak Lineages (PANGOLIN), a software tool to implement the PANGO nomenclature.“;
  • Übersetzung: „Phylogenetic Assignment of Named Global Outbreak Lineages (PANGOLIN), ein Softwaretool zur Implementierung der PANGO-Nomenklatur.“

Dieser unterste Eintrag ist zum englischen Artikel:

verknüpft. Der Artikel bildet erst einmal also erst einmal die einzige Grundlage innerhalb der Wikipedia, um sich der SARS-CoV-2-Varianten-Nomenklatur bezüglich der PANGO- und PANGOLIN-Ausdrücke zu nähern. Deshalb habe ich den Artikel hier übersetzt(Bearbeitungsversion vom 21.9.'21: oldid=1045663512) übersetzt.

--Baustelle-3.27, am 29.10.2021.

Bearbeiten

Verwendete Versiondes engl. Artikels: "19:23, 21 September 2021‎ Kaihsu talk contribs‎  10,641 bytes +2‎  →‎Creators and developers".

Erste Version des engl. Artikels: "18:14, 22 January 2021‎ Yadsalohcin talk contribs‎  3,378 bytes +3,378‎  Began article".

Zuordnung von Referenznummern und -namen
Bearbeiten

Im engl. Original gab es die Referenznummern 1. bis 12., die hier mit /1. / bis /12. / dargestellt werden. Die Referenzen wurden mit dem WP:VE (H:VE) „eingedeutscht“. Zuerst hatten die Referenzen im Wikitext Nummern (name=":0" bis name=":11"), die ich dann durch Namen ersetzt habe (name="RT-Epidem_2021-0117" bis name="Lineage-Assigner_2021-0210").

/1. / ":0" "RT-Epidem_2021-0117"
/2. / ":1" "Rambaut-etal2020_pmid-32669681"
/3. / ":2" "Pangolin-web-app_2021-0210"
/4. / ":3" "Rambaut-etal2021_pmid-33514928"
/5. / ":4" "Pipes-etal2021_pmid-33295605"
/6. / ":5" "preprint_Jacob-etal2020-1222"
/7. / ":6" "pangoLEARN_2021-0103"
/8. / ":7" "PANGO-lineages_2021-0228"
/9. / ":8" "scikit-learn_2021-0219"
/10. / ":9" "cov-lineages-pangolin_2021-0215"
/11. / ":10" "pangoLEARN-v2_2021-0302"
/12. / ":11" "Lineage-Assigner_2021-0210"
Referenzen am Start
Bearbeiten

Die zwölf Referenzen am Start dienen dazu, vor dem Textanfang des Artikelentwurf ein Verzeichnis zu haben, das alle Referenzen mit ihren jeweiligen Inhalt enthält (<ref> ... </ref>). Dadurch werden im Text ausschließlich die Kurzformen verwendet (<ref ... />).

/1. / Real-Time Epidemiology for COVID-19. https://web.archive.org/web/20210117212459/https:/www.pathogensurveillance.net/resources/articles/real-time-epidemiology-for-covid-19.html /;"RT-Epidem_2021-0117"[1]

/2. / PMID 32669681;"Rambaut-etal2020_pmid-32669681"[2]

/3. / Pangolin web application release. https://web.archive.org/web/20210210223250/https:/virological.org/t/pangolin-web-application-release/482 /;"Pangolin-web-app_2021-0210"[3]

/4. / PMID 33514928;"Rambaut-etal2021_pmid-33514928"[4]

/5. / PMID 33295605;"Pipes-etal2021_pmid-33295605"[5]

/6. / biorxiv=10.1101/2020.12.22.423920; 10.1101/2020.12.22.423920;"preprint_Jacob-etal2020-1222"[6]

/7. / pangoLEARN Store of the trained model for PANGOLIN to access. https://web.archive.org/web/20210103202912/https:/github.com/cov-lineages/pangoLEARN /;"pangoLEARN_2021-0103"[7]

/8. / PANGO lineages. https://web.archive.org/web/20210228182435/https:/cov-lineages.org/pangolin.html /;"PANGO-lineages_2021-0228"[8]

/9. / sklearn.tree.DecisionTreeClassifier. https://web.archive.org/web/20210219120920/https:/scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html /;"scikit-learn_2021-0219"[9]

/10. / cov-lineages/pangolin. https://web.archive.org/web/20210215054819/https:/github.com/cov-lineages/pangolin /;"cov-lineages-pangolin_2021-0215"[10]

/11. / pangoLEARN PANGOLIN 2.0: pangoLEARN description. https://web.archive.org/web/20210302051828/https:/cov-lineages.org/pangolin_docs/pangolearn.html /;"pangoLEARN-v2_2021-0302"[11]

/12. / Pangolin COVID-19 Lineage Assigner. https://web.archive.org/web/20210210104229/https:/pangolin.cog-uk.io/ /;"Lineage-Assigner_2021-0210"[12]

Artikelbereich von "Phylogenetic Assignment of Named Global Outbreak Lineages"

Bearbeiten
Maskierte Vorlagen am Anfang
Bearbeiten

Oberhalb der Einleitung wurden zwei Vorlagen (eine Kurzbeschreibung und eine Infobox) im englischen Artikel genutzt, die hier maskiert sind ({{ nach {+{+ und }} nach +}+})

{+{+Short description|SARS-CoV-2 lineage nomenclature+}+}

{+{+Infobox software

| logo = File:Pangolin logo.svg

| logo caption = PANGOLIN logo

| released = {+{+Start date and age|df=yes|2020|04|30+}+}

| latest release version = {+{+wikidata|property|reference|edit|P348+}+}

| latest release date = {+{+Start date and age|{+{+wikidata|qualifier|P348|P577+}+}+}+}

| repo = {+{+url|https://github.com/cov-lineages/pangolin+}+}

| programming language = Python

| license = GNU General Public License v3.0

+}+}

Einleitung des Artikels

Bearbeiten

Das Softwaretool mit dem Namen Phylogenetic Assignment of Named Global Outbreak Lineages (PANGOLIN) wurde von Mitgliedern des Labors um Andrew Rambaut entwickelt und enthält eine Webanwendung, die vom Center for Genomic Pathogen Surveillance in South Cambridgeshire entwickelt wurde. /1. /[1]

Sein Zweck besteht darin, eine dynamische Nomenklatur (bekannt als PANGO-Nomenklatur) zu implementieren, um genetische Abstammungslinien für SARS-CoV-2 , das Virus, das COVID-19 verursacht, zu klassifizieren. /2. /[2]

Ein Benutzer mit einer vollständigen Genomsequenz einer SARS-CoV-2-Probe kann das Tool verwenden, um diese Sequenz einzureichen, die dann mit anderen Genomsequenzen verglichen und der wahrscheinlichsten Abstammungslinie (PANGO-Linie) zugeordnet wird. /3. /[3]

Es sind einzelne oder mehrere Durchläufe möglich, und das Tool kann weitere Informationen zur bekannten Historie der zugewiesenen Abstammungslinie zurückgeben. /3. /[3]

Darüber hinaus ist es mit Microreact verbunden, um die Position innerhalb einer zeitlichen Abfolge von mehreren Ergebnissen zu den sequenzierten Proben derselben Abstammungslinie anzuzeigen. /3. /[3]

Diese letztere Funktion stützt sich auf öffentlich zugängliche Genome, die vom COVID-19 Genomics UK Consortium erhalten wurden und solche, die bei GISAID eingereicht wurden. /3. /[3]

Es ist nach dem Schuppentier benannt.

de-refs – en-orig / Introduction
Bearbeiten

The Phylogenetic Assignment of Named Global Outbreak Lineages (PANGOLIN) is a software tool developed by members of the laboratory of Andrew Rambaut, with an associated web application developed by the Centre for Genomic Pathogen Surveillance in South Cambridgeshire. /1. /[1]

Its purpose is to implement a dynamic nomenclature (known as the PANGO nomenclature) to classify genetic lineages for SARS-CoV-2, the virus that causes COVID-19. /2. /[2]

A user with a full genome sequence of a sample of SARS-CoV-2 can use the tool to submit that sequence, which is then compared with other genome sequences, and assigned the most likely lineage (PANGO lineage). /3. /[3]

Single or multiple runs are possible, and the tool can return further information regarding the known history of the assigned lineage. /3. /[3]

Additionally, it interfaces with Microreact, to show a time sequence of the location of reports of sequenced samples of the same lineage. /3. /[3]

This latter feature draws on publicly available genomes obtained from the COVID-19 Genomics UK Consortium and from those submitted to GISAID. /3. /[3]

It is named after the pangolin.

Hintergrund – „Kontext“ / Context

Bearbeiten

PANGOLIN ist eine Schlüsselkomponente, die das PANGO-Nomenklatursystem untermauert. /4. /[4]

Wie in Andrew Rambaut et al. (2020) beschrieben, /2. /[2] ist eine PANGO-Linie eine ein Cluster von Sequenzen, die mit einem epidemiologischen Ereignis verbunden sind, beispielsweise einer Einschleppung des Virus in ein bestimmtes geografisches Gebiet mit Hinweisen auf eine weitere Ausbreitung.

Die Abstammungslinien sollen die sich am Rand der Pandemie entwickelnden Ereignisse erfassen und haben eine feinkörnige Auflösung, die für die genomische epidemiologische Überwachung und die Untersuchung von Ausbrüchen geeignet ist .

Sowohl das Tool als auch das PANGOLIN-Nomenklatursystem wurden während der COVID-19-Pandemie ausgiebig genutzt. /2. /[2] /5. /[5] /6. /[6]

de-refs – en-orig / Context
Bearbeiten

PANGOLIN is a key component underpinning the PANGO nomenclature system. /4. /[4]

As described in Andrew Rambaut et al. (2020), /2. /[2] a PANGO Lineage is described as a cluster of sequences that are associated with a epidemiological event, for instance an introduction of the virus into a distinct geographic area with evidence of onward spread.

Lineages are designed to capture the emerging edge of the pandemic and are at a fine-grain resolution suitable to genomic epidemiological surveillance and outbreak investigation.

Both the tool and the PANGOLIN nomenclature system have been used extensively during the COVID-19 pandemic. /2. /[2] /5. /[5] /6. /[6]

Beschreibung – „Bezeichnung“ / Description

Bearbeiten

„Abstammungsbezeichnung“ / Lineage designation

Bearbeiten

Unabhängig von der Nutzung des PANGOLIN-Tools werden die Pango-Linien, basierend auf der aktuell weltweit zirkulierenden Vielfalt, regelmäßig manuell kuratiert.

Ein großer phylogenetischer Baum wird aus einem Alignment erstellt, das öffentlich verfügbare SARS-CoV-2-Genome enthält, und Sub-Cluster von Sequenzen in diesem Baum werden manuell untersucht und mit epidemiologischen Informationen verglichen, um neue Abstammungslinien zu bestimmen;

diese können von Datenproduzenten bestimmt werden, und Abstammungsvorschläge können über eine GitHub- Ausgabeanfrage an das Pango-Team gesendet werden. /7. /[7] /8. /[8]

{+{+explain|reason=genauere Details der Gebrauchsanweisung wären gut|date=März 2021+}+}

de-refs – en-orig/ Lineage designation
Bearbeiten

Distinct from the PANGOLIN tool, Pango lineages are regularly, manually curated based on the current globally circulating diversity.

A large phylogenetic tree is constructed from an alignment containing publicly available SARS-CoV-2 genomes, and sub-clusters of sequences in this tree are manually examined and cross-referenced against epidemiological information to designate new lineages;

these can be designated by data producers, and lineage suggestions can be submitted to the Pango team via a GitHub issue request. /7. /[7] /8. /[8]

{+{+explain|reason=more specific details of usage instructions would be good|date=March 2021+}+}

„Modelltraining“ / Model training

Bearbeiten

Diese manuell kuratierten Bezeichnungen der Abstammungslinien und die zugehörigen Genomsequenzen bilden die Eingabe für das Training eines Modells durch maschinelles Lernen.

Dieses Modell, sowohl das Training als auch die Zuordnung, hat den Namen „pangoLEARN“ erhalten.

Die aktuelle Version von pangoLEARN verwendet einen Klassifikationsbaum, der auf der Scikit-Learn-Implementierung /9. /[9] eines Entscheidungsbaum-Klassifikators basiert.

de-refs – en-orig/ Model training
Bearbeiten

These manually curated lineage designations, and the associated genome sequences, are the input into the machine learning model training.

This model, both the training and the assignment, has been termed 'pangoLEARN'.

The current version of pangoLEARN uses a classification tree, based on the scikit learn implementation /9. /[9] of a decision tree classifier.

„Abstammungszuweisung“ / Lineage assignation

Bearbeiten

Ursprünglich verwendete PANGOLIN einen auf Maximum-Likelihood-basierten Zuweisungsalgorithmus, um der Abfrage SARS-CoV-2 die wahrscheinlichste Abstammungssequenz zuzuweisen.

Seit der Veröffentlichung von Version 2.0 im Juli 2020 verwendet es jedoch den auf maschinellem Lernen basierenden Zuordnungsalgorithmus „pangoLEARN“, um Linien neuen SARS-CoV-2-Genomen zuzuordnen. /10. /[10]

Dieser Ansatz ist schnell und kann in relativ kurzer Zeit eine große Anzahl von SARS-CoV-2-Genomen zuordnen. /11. /[11]

de-refs – en-orig/ Lineage assignation
Bearbeiten

Originally, PANGOLIN used a maximum-likelihood-based assignment algorithm to assign query SARS-CoV-2 the most likely lineage sequence.

Since the release of Version 2.0 in July 2020, however, it has used the 'pangoLEARN' machine-learning-based assignment algorithm to assign lineages to new SARS-CoV-2 genomes. /10. /[10]

Dieser Ansatz ist schnell und kann in relativ kurzer Zeit eine große Anzahl von SARS-CoV-2-Genomen zuordnen. /11. /[11]

„Verfügbarkeit“ / Availability

Bearbeiten

PANGOLIN ist als Befehlszeilen -basierte Werkzeug, herunterladbare von Conda und aus einem GitHub Repository /10. /[10] und als Web-Anwendung /12. /[12] mit einer grafischen Drag-and-Drop-Benutzeroberfläche.

Die PANGOLIN-Webanwendung hat mit Stand Januar 2021 mehr als 512.000 eindeutige SARS-CoV-2-Sequenzen zugewiesen.

{+{+Zitat erforderlich|date=März 2021+}+}

de-refs – en-orig/ Availability
Bearbeiten

PANGOLIN is available as a command-line-based tool, downloadable from Conda and from a GitHub repository, /10. /[10] and as a web-application /12. /[12] with a drag-and-drop graphical user interface.

The PANGOLIN web application has assigned more that 512,000 unique SARS-CoV-2 sequences as of January 2021.

{+{+citation needed|date=March 2021+}+}

„Schöpfer und Entwickler“ / Creators and developers

Bearbeiten

PANGOLIN wurde von Áine O'Toole und dem Labor um Andrew Rambaut erstellt und am 5. April 2020 veröffentlicht.

Die Hauptentwickler von PANGOLIN sind Áine O'Toole und Emily Scher; viele andere haben zu verschiedenen Aspekten des Tools beigetragen, darunter Ben Jackson, JT McCrone, Verity Hill und Rachel Colquhoun vom Labor unter Andrew Rambaut. /3. /[3]

Die Webanwendung zu PANGOLIN wurde vom Center for Genomic Pathogen Surveillance, /12. /[12] entwickelt, namentlich von Anthony Underwood, Ben Taylor, Corin Yeats, Khali Abu-Dahab und David Aanensen. /3. /[3]

de-refs – en-orig/ Creators and developers
Bearbeiten

PANGOLIN was created by Áine O'Toole and the Rambaut lab and released on 5 April 2020.

The main developers of PANGOLIN are Áine O'Toole and Emily Scher; many others have contributed to various aspects of the tool, including Ben Jackson, J.T. McCrone, Verity Hill, and Rachel Colquhoun of the Rambaut Lab. /3. /[3]

The PANGOLIN web application was developed by the Centre for Genomic Pathogen Surveillance, /12. /[12] namely Anthony Underwood, Ben Taylor, Corin Yeats, Khali Abu-Dahab, and David Aanensen. /3. /[3]

„Siehe auch“ / See also

Bearbeiten
de-refs – en-orig/ See also
Bearbeiten

„Verweise“ / References

Bearbeiten

Der Platz für die Einzelnachweise ist unter der Überschrift „#Einzelnachweise“ unterhalb des Artikelentwurfs zu finden.

de-refs – en-orig/ See also
Bearbeiten

Unter der Überschrift wurde eine Vorlage im englischen Artikel genutzt, um die Referenzliste anzuzeigen, die hier maskiert ist ({{ nach {+{+ und }} nach +}+}).

{+{+Reflist+}+}

Bearbeiten
Bearbeiten

Unter der Überschrift wurden zwei Vorlagen im englischen Artikel genutzt, um externe Verknüpfungen zu ermöglichen, die hier maskiert sind ({{ nach {+{+ und }} nach +}+}).

  • {+{+GitHub|cov-lineages/pangolin+}+}
  • {+{+Official website+}+}

Unterhalb des Fließtextes

Bearbeiten
Maskierte Kategorien
Bearbeiten

Unterhalb des Fließtextes wurden zwei Kategorien im englischen Artikel platziert, die hier maskiert sind ([[ nach [+[+ und ]] nach +]+]).

[+[+Category:Genome databases+]+]

[+[+Category:Medical software+]+]

Unterhalb des Artikels

Bearbeiten

Einzelnachweise

Bearbeiten
  1. a b c Real-Time Epidemiology for COVID-19 | Centre for Genomic Pathogen Surveillance. 17. Januar 2021, abgerufen am 27. Oktober 2021.
  2. a b c d e f g Andrew Rambaut, Edward C. Holmes, Áine O'Toole, Verity Hill, John T. McCrone: A dynamic nomenclature proposal for SARS-CoV-2 lineages to assist genomic epidemiology. In: Nature Microbiology. Band 5, Nr. 11, November 2020, ISSN 2058-5276, S. 1403–1407, doi:10.1038/s41564-020-0770-5, PMID 32669681, PMC 7610519 (freier Volltext).
  3. a b c d e f g h i j k l m Pangolin web application release - Software and Tools - Virological. 10. Februar 2021, abgerufen am 28. Oktober 2021.
  4. a b c Andrew Rambaut, Edward C. Holmes, Áine O'Toole, Verity Hill, John T. McCrone: Addendum: A dynamic nomenclature proposal for SARS-CoV-2 lineages to assist genomic epidemiology. In: Nature Microbiology. Band 6, Nr. 3, März 2021, ISSN 2058-5276, S. 415, doi:10.1038/s41564-021-00872-5, PMID 33514928, PMC 7845574 (freier Volltext).
  5. a b c Lenore Pipes, Hongru Wang, John P. Huelsenbeck, Rasmus Nielsen: Assessing Uncertainty in the Rooting of the SARS-CoV-2 Phylogeny. In: Molecular Biology and Evolution. Band 38, Nr. 4, 13. April 2021, ISSN 1537-1719, S. 1537–1543, doi:10.1093/molbev/msaa316, PMID 33295605, PMC 7798932 (freier Volltext).
  6. a b c Jobin John Jacob, Karthick Vasudevan, Agila Kumari Pragasam, Karthik Gunasekaran, Balaji Veeraraghavan: Evolutionary tracking of SARS-CoV-2 genetic variants highlights an intricate balance of stabilizing and destabilizing mutations. Genomics, 22. Dezember 2020, doi:10.1101/2020.12.22.423920.
  7. a b c GitHub - cov-lineages/pangoLEARN: Store of the trained model for pangolin to access. 3. Januar 2021, abgerufen am 28. Oktober 2021.
  8. a b c PANGO lineages. 28. Februar 2021, abgerufen am 28. Oktober 2021.
  9. a b c sklearn.tree.DecisionTreeClassifier — scikit-learn 0.24.1 documentation. 19. Februar 2021, abgerufen am 28. Oktober 2021.
  10. a b c d e GitHub - cov-lineages/pangolin: Software package for assigning SARS-CoV-2 genome sequences to global lineages. 15. Februar 2021, abgerufen am 28. Oktober 2021.
  11. a b c PANGO lineages. 2. März 2021, abgerufen am 28. Oktober 2021.
  12. a b c d e COG-UK. 10. Februar 2021, abgerufen am 28. Oktober 2021.