Caractéristiques génomiques
La structure quadripartite de 22 échantillons de 17 espèces dans Amarante consiste en une grande région à copie unique (LSC avec 83, 382–84, 062 bp), une petite région à copie unique (SSC avec 17, 937 – 18, 124 bp) et une paire de régions répétées inversées (IR avec 23, 964–24, 357 pb). La longueur totale des génomes de 22 cp varie de 149 949 pb dans A. polygonoïdes à 150, 756 pb en A. albus (Tableau 1). Les séquences du génome du chloroplaste ont été déposées dans GenBank (tableau 1).
La teneur totale en GC était de 36,5 % à 36,6 %, seulement A. albus, A. blitoides et A. polygonoïdes ont une teneur en GC de 36,5 % (tableau 1). Le génome du chloroplaste contient un total de 133 gènes, dont 88 gènes codant pour des protéines, 37 gènes d’ARNt et 8 gènes d’ARNr, dont 18 ont été dupliqués dans les régions répétées inversées (voir le tableau supplémentaire S1 en ligne). Le gène rps12 a été trans-épissé ; l’exon à l’extrémité 50 était situé dans la région LSC, tandis que l’intron et l’exon 30 étaient dupliqués et situés dans les régions répétées inversées. Le duplicata partiel de rps19 et ycf1 les gènes sont apparus comme des pseudogènes car ils ont perdu leur capacité de codage des protéines. 16 gènes ont des introns.
Variantes de génomes cp
La longueur de la région SSC a été conservée parmi les sous-genres en comparant la longueur des génomes chloroplastiques de 22 individus de 17 espèces. A. palméri, A. tuberculatus et A. arenicola en sous-gen. Acnide avaient une longueur de 18 027 à 18 042 pb, la longueur SSC de 5 espèces de sous-gen. Amarante était de 17 937 à 17 948 pb et la longueur SSC de 8 espèces de sous-gen. Algérie était de 18 057 à 18 124 pb (tableaux 1, 2). Il y avait environ 77 bp inDels ndhE-G et 180 pb en InDels ndhG-I, qui a induit la variation de la longueur du SSC entre les sous-genres (tableau 2; voir la Fig. S1 supplémentaire en ligne). Les fréquences des SNP et des InDels dans les génomes des chloroplastes des 17 espèces étaient respectivement de 1, 79% et 2, 86% (tableau 3). Les fréquences des SNP et des InDels dans les gènes étaient de 1, 22% et 1, 14%, et les fréquences des SNP et des InDels dans l’espaceur intergénique étaient de 3, 25% et 7, 32%, respectivement (tableau 3). En général, la variation s’est produite principalement dans la région de l’espaceur intergénique et les InDels se sont principalement produites dans la région non codante (tableau 3). L’InDel le plus long était de 387 pb, qui s’est produit le ycf2suivi de 384 bp InDel sur psbM-trnD.
Analyses répétées et SSR
Chaque espèce a 28 à 38 répétitions, réparties dans 30 emplacements, dont 11 à 14 répétitions avant, 11 à 17 répétitions palindromiques et 6 à 8 répétitions inverses allant de 30 à 64 pb de longueur. Il y avait 19 emplacements de répétition communs, dont 11 n’avaient aucune variation et 8 avaient une variation de longueur. Les R3, R8, R11 et R13 avaient la variation la plus abondante (Fig. 2). Le R12 (répétitions directes et inverses) a été distribué dans LSC, IRa, SSC et IRb. Le R12 sur SSC est presque opposé à R12 sur LSC, divisant l’ensemble du génome circulaire en deux parties de longueur presque égale. Les répétitions sur LSC étaient principalement concentrées près de la répétition 12 (loci 29 572–46 282), les loci 8166–8327, les loci 29 572 et les loci 75 230. Les répétitions sur les IR sont constantes au sein du genre. Il y avait deux répétitions communes dans SSC, et l’une était une séquence palindrome partagée par le sous-genre. Acnidesous-gen. Amaranteet A. albus.
La distribution des séquences répétées à 30 locus dans Amarante. “R” est l’abréviation de répétition. Le segment de ligne rouge R12 et les segments de ligne noire sont des répétitions chez les 17 espèces, le segment de ligne orange représente une séquence répétitive chez certaines espèces. Une répétition avec un seul segment de ligne indique qu’il n’y a qu’une seule répétition sur le site, et vice versa indique qu’il y a plusieurs répétitions différentes sur le site. La figure du génome du chloroplaste a été générée par le Geneious Prime v. Logiciel 2020.1.2.
L’analyse MISA a montré que chaque génome cp de Amarantes contenaient 29 à 39 SSR (voir le tableau supplémentaire S4 en ligne). En moyenne, le nombre de types de SSR de plus à moins était de mono-, tétra-, di-, tri-, penta- et hexa-nucléotides dans l’ordre (voir le tableau supplémentaire S4 en ligne). Environ 55,56 % de ces SSR étaient composés de bases A ou T. Parmi tous les SSR, la plupart des loci sont situés dans le LSC (77,78 %) et l’IGS (71,91 %). Environ 12 motifs répétés étaient partagés par toutes les espèces du genre, tandis que les motifs restants étaient spécifiques à l’espèce ou au sous-genre (voir le tableau supplémentaire S4 en ligne). Différentes combinaisons de marqueurs SSR pourraient distinguer toutes les espèces sauf A. standleynas et A. crispus, A. dubius et A. spinosus (voir le tableau supplémentaire S4 en ligne).
Arbres phylogénétiques de génomes chloroplastiques entiers
Les topologies des arbres phylogénétiques construits par le maximum de vraisemblance et les méthodes bayésiennes étaient fondamentalement les mêmes. A. palméri, A. arenicola et A. tuberculatus regroupés (BS / PP = 100/1) pour former sous-gen. Acnideou le clade dioïque (Fig. 3). A. hybridus, A. hypocondrie, A. dubius, A. spinosus, A. rétroflexus regroupés (BS / PP = 100/1) pour représenter le sous-gen. Amarante, ou le Clade Hyridus (Fig. 3). Et les deux clades ci-dessus étaient très proches (BS / PP = 100/1) (Fig. 3). A. albus et A. blitoides ont été regroupés avec une valeur faible / modérée (BS / PP = 35 / 0,84) et séparés du sous-gen. Algérie et étaient étroitement liés au sous-gen. Amarante et sous-gen. Acnide (BS / PP = 58 / 0,99) (Fig. 3). Parmi les trois espèces de sous-gen. Algérie distribué aux Galápagos, A. polygonoïdes est devenu une seule branche basale. Les deux autres espèces, A. albus et A. blitoides, a formé un clade distinct (Clade Galápagos). Le reste du sous-gen. Algérie ont été regroupés en une seule branche, à savoir le Clade ESA + sud-américain (BS / PP = 100/1) (Fig. 3).

Un arbre topologique à maximum de vraisemblance basé sur le génome chloroplastique de Amarante et trois exogroupes. Les valeurs à chaque nœud indiquent la valeur de support bootstrap de probabilité maximale (BS) / probabilité postérieure d’inférence bayésienne (PP). Les individus sur fond gris représentent les principales branches monophylétiques du genre. Les fichiers au format newick sont importés dans MEGA version 6 pour générer l’arbre topologique final.
Points d’accès pour Amarante
Les régions de fragment partiellement qualifiées recherchées par la méthode exhaustive ont été superposées, et les régions superposées ont été combinées ensemble en tant que région de point chaud. Enfin, 16 fragments de points chauds d’une longueur de 737 à 2818 pb ont été obtenus et la fréquence de variation du SNP variait de 0, 78 à 1, 49% (voir le tableau supplémentaire S3 en ligne). Les arbres topologiques construits par les alignements de ces 17 fragments chauds et les arbres topologiques construits par les séquences d’alignement de chaque gène et espaceur intergénique étaient cohérents avec l’arbre topologique du génome chloroplastique, à savoir les points chauds avec plus de 90 % de support de valeur bootstrap pour le sous-gen. Amarantesous-gen. Acnide et sous-gen. Algérie succursale (hors A. albus, A. polygonoïdeset A. blitoides) ont été ndhF-rpl32, ycf1 et rpoC2 (Fig. 4).

Trois arbres topologiques à maximum de vraisemblance basés sur rpoC2, ndhF-rpl32 et ycf1 de Amarante et trois exogroupes. Les valeurs à chaque nœud indiquent la valeur de support bootstrap de probabilité maximale (BS) / probabilité postérieure d’inférence bayésienne (PP). “AMA” représentait la sous-gen. Amarante“ACN” représentait la sous-gen. Acnide“ALB” représentait la sous-gen. Algérie. Les fichiers au format newick sont importés dans MEGA version 6 pour générer l’arbre topologique final.
Dans plusieurs quartiers similaires, il y avait 25 InDels et 11 SNP entre A. tunetanus et A. standleyanus. A. crispus et A. standleyanus n’avait aucune différence. Il y a 46 SNP et 144 InDels entre A. arenicola et A. tuberculatus. Par alignement de séquence et analyse de variation, il a été constaté que trnK-UUU–atpF, trnT-UGU–atpB, RSUE–clpP, rpl14–rps19, ndhF-D pourrait être utilisé pour distinguer A. tunetanus Frome A. standleyanus, A. crispuset A. arenicola Frome A. tuberculatus.