Приложение 2
к МР 3.1.0272-22
ТРЕБОВАНИЯ
К ФАЙЛАМ, СОДЕРЖАЩИМ ИНФОРМАЦИЮ
О НУКЛЕОТИДНОЙ ПОСЛЕДОВАТЕЛЬНОСТИ
Каждый геном SARS-CoV-2 должен быть представлен одной нуклеотидной последовательностью в форматах «*.fasta», «*.fas», «*.fa».
Требования к наименованию последовательности
Требования к наименованию последовательности:
— должно содержать латинские буквы, цифры, нижнее подчеркивание, не должно содержать пробелов
— должно быть полностью идентично названию образца, введенному в форму для представления метаданных.
Требования к буквенным обозначениям нуклеотидов в файлах
Требования к буквенным обозначениям нуклеотидов в файлах:
— в случае наличия не покрытых (неотсеквенированных) областей в геноме, они должны быть замаскированы последовательностью, состоящей из букв NNN;
— в случае наличия вырожденных нуклеотидных позиций они обозначаются вырожденным кодом, согласно номенклатуре IUPAC (например R, для обозначения A/G и т.п.)».