Полноразмерный микробный анализ 16S |
Полноразмерный микробный анализ 16S |

Новое поколение микробных исследований – третье поколение полноразмерных 16S (Full-length 16S)

Сегодня исследования микробного сообщества полностью перешли на стадию анализа секвенирования, а нынешнее основное направление исследований находится в переходном периоде между ампликонами второго поколения и ампликонами третьего поколения. Анализ состава бактериального разнообразия на основе секвенирования третьего поколения может значительно повысить точность и полноту классификации и идентификации видов, а также более точно восстановить состав микробных сообществ в образцах. Одновременно с достижением обнаружения «высокого разрешения» он также обеспечивает. будущие возможности Это заложило основу для углубленного изучения метаболических функций бактериальной флоры.

16S рибосомальная РНК (16S рибосомальная РНК), называемая 16S п РНК, является компонентом 30S рибосомальной субъединицы прокариот. Ген 16С р РНК присутствует во всех геномах бактерий.,Длина ок.1542 б.п., в том числе 10 Заповедная территория регион) и 9 Переменная площадь (Переменная регион), консервативный регион отражает генетическое родство между видами, а вариабельный регион отражает различия между видами (Рисунок 1). 16S Ген р РНК с его умеренным молекулярным размером и низкой частотой мутаций является наиболее полезным и часто используемым молекулярным маркером в исследованиях по классификации бактерий. Обнаружение 16S посредством высокопроизводительного секвенирования ампликонов 16S Вариация последовательности и численность вариабельных областей р ДНК могут предоставить информацию о разнообразии и численности микробных сообществ в образцах и играть важную роль в классификации и идентификации микробов, микроэкологических исследованиях и т. д.

Рисунок 1. Структура 16S р РНК и амплифицированная область.
Рисунок 1. Структура 16S р РНК и амплифицированная область.

В 1990 году ученые впервые обнаружили последовательность 16S р РНК, присутствующую в образцах окружающей среды (1), что прояснило ее исследовательский потенциал. С тех пор началась великолепная эра исследований микробного сообщества. Секвенирование 16S второго поколения имеет ограниченную длину амплифицированных фрагментов, составляющую всего 500-600 п.о. (двустороннее перекрытие), поэтому, как показано, большая проблема заключается в выборе вариабельных областей для ампликонов второго поколения. Отбор означает компромисс и потерю информации. в статье (3) с высокой долей неопознанных видов на уровне рода и вида (рис. 2). Секвенирование ампликона 16S третьего поколения использует праймеры 27F и 1492R для амплификации полноразмерного фрагмента (охватывающего область V1-V9), который может легко покрыть общую длину 16S около 1500 пар оснований и в общей сложности 9 вариабельных областей, что максимально увеличивает возможность разделения видов. идентификация (рисунок 3).

Рисунок 2. Второе поколение 16 и Полная длина третьего поколения 16с. Сравнение доли неидентифицированных видов.
Рисунок 2. Второе поколение 16 и Полная длина третьего поколения 16с. Сравнение доли неидентифицированных видов.
картина3. Полноразмерный 16S третьего поколения.усиленная область
картина3. Полноразмерный 16S третьего поколения.усиленная область

Каждый раунд технологических инноваций приводил к изменениям в исследовательских идеях. Технология ампликонов второго поколения принесла исследовательские идеи, которые фокусируются на изменениях в общем разнообразии сообществ и микробном составе на уровне типа/рода. Технология ампликонов третьего поколения идет на шаг дальше и уделяет больше внимания корреляции между различными группами. Она не только фокусируется на численности видов на уровне типа/рода, но также может исследовать отношения сотрудничества/конкуренции видов внутри рода. Благодаря таким характеристикам высокого разрешения исследование уровня деформации, естественно, стало центром исследований. В отличие от предыдущих исследований 16S второго поколения на уровне семейства и рода, полноразмерное 16S третьего поколения может обеспечить более полное и детальное определение уровня деформации. Приближение всех результатов исследования к экологическим функциям имеет большое значение для мультиомических корреляций и последующего экспериментального руководства и проверки. То же самое верно и с точки зрения мультиомной корреляции. Мультиомная корреляция данных более высокого уровня часто может выявить более четкие локальные закономерности, включая многие детали, которые игнорировались или были недоступны в прошлом.

1. Полноразмерное секвенирование гена 16S р РНК PacBio.

PacBio полная длина 16S секвенирование гена р РНКиспользовать27F1492RПраймеры амплифицируют полноразмерные фрагменты(крышкаV1-V9округ),использоватьPacBio Платформа секвенирования SMRT CCS (Circular Consensus Режим секвенирования) для анализа секвенирования. Пак Био Секвенирование SMRT имеет множество явных преимуществ:

  • долго читать долго,Длина чтения секвенирования второго поколения может достигать всего нескольких сотен пар оснований.,иPacBioДлина считывания секвенирования может достигать десятков или даже сотен.kb。для Длина ок. 1542bp из16S гена р РНК, секвенирование второго поколения может секвенировать только некоторые области, такие как области V4, V3V4 и V4V5, тогда как секвенирование PacBio может легко охватывать 16S. Ген р РНК из полноразмерной последовательности.
  • Высокая точность,PacBio Режим CCS, полученный из HiFi Reads(High fidelity читает) точность самокоррекции достигает 99% и более, С учетом данных секвенирования долго читать долгои Высокая точность. Когда длина чтения секвенирующего фермента достигает При 8Кб можно удовлетворить 1,5Кб из16S Последовательность гена р РНК циклически корректировали 5 раз. (Рисунок 4) и, наконец, получил высококачественную полноразмерную последовательность из16S.
Рисунок 4. Режим секвенирования CCS
Рисунок 4. Режим секвенирования CCS
  • Нет предпочтений в процессе секвенирования,Секвенирование одной молекулы PacBio в реальном времени (SMRT) не требует этапа амплификации.,Это позволяет избежать внесения предвзятости в процесс секвенирования.,Истинную структуру сообщества выборки можно в значительной степени восстановить.

2. PacBio | Процесс анализа полноразмерного HiFi 16S

HiFi Full-length 16S nextflow анализироватьпроцесспредназначен для прохожденияDADA2 иQIIME2Воля Полная длина 16S Кластеризация последовательности Hi-Fi в высококачественный Amplicon Sequence Variants (ASV) для завершения последующего анализа 。этотпроцессна основеQIIME2,Поэтому он может сделать анализ,Такие как альфа-разнообразие и бета-разнообразие.,Аннотация видов и визуализация,HiFi Full-length 16Sанализироватьпроцесс Всего можно достичь (картина5)。КромеASVsкластеризация,анализироватьпроцесс Все еще доступноvsearchруководитьOTUкластеризация。

Рис. 5. Документ с результатами анализа полноразмерного HiFi 16S процесса
Рис. 5. Документ с результатами анализа полноразмерного HiFi 16S процесса

Hi-Fi полноразмерный процесс 16Shttps://github.com/PacificBiosciences/HiFi-16S-workflow

3. Установка и тестирование программного обеспечения.

1. отgithubначальствоскачатьpb-16S-ntдокументпапка:

Язык кода:bash
копировать
$ git clone https://github.com/PacificBiosciences/pb-16S-nf.git
  • скачать После завершения,В текущем пути будет создан именованныйpb-16S-ntиздокументпапка。Если это кампусная сеть,Столкнулся с ситуацией, когда загрузка не может произойти,можно пойтиpb-16S-ntизgithubДомашнее руководствоскачать,Затем загрузите на сервер.
  • в использованииpb-16Sанализироватьпроцессдо,Требуется установкаnextflowи conda,альтернативаsingularityилиdocker

2. Загрузите базу данных аннотаций и классификации видов микробов.

Язык кода:bash
копировать
$ nextflow run main.nf --download_db 
  • скачать После завершения,Текущий путь создаст файл с именемdatabasesиздокументпапка。
  • Если загрузка не удалась, вы можете скачать ее вручную. Адрес загрузки — zenodo: https://zenodo.org/records/6912512。 создаватьdatabasesиздокументпапка,Поместите в него скачатьдокумент.
Рисунок 6. Схематическая диаграмма успешной загрузки базы данных.
Рисунок 6. Схематическая диаграмма успешной загрузки базы данных.

3. Протестируйте программное обеспечение, используя образцы.

Язык кода:bash
копировать
# Создайте образец документа TSV, чтобы указать путь к образцу.
$ echo -e "sample-id\tabsolute-filepath\ntest_data\t$(readlink -f test_data/test_1000_reads.fastq.gz)" > test_data/test_sample.tsv

# Тестовые данные, используйте conda для создания среды
$ nextflow run main.nf --input test_data/test_sample.tsv \
   --metadata test_data/test_metadata.tsv -profile conda \
   --outdir results


# Если conda не может быть создана, вы можете попробовать dockerилиsingularity.
$ nextflow run main.nf --input test_data/test_sample.tsv \
    --metadata test_data/test_metadata.tsv -profile singularity \
    --outdir results
  • Если по сетевым причинам,condaсоздавать Если вы не знаете окружающую среду, вы можете обратиться к моему сайтуgithubначальствопредлагатьизрешение:https://github.com/PacificBiosciences/HiFi-16S-workflow/issues/2
  • еслиcondaсоздавать Экология все еще не очень хорошая,могу попробовать -profile docker или -profile singularity
  • еслииспользоватьdocker или singularity, При первом запуске тестового образца данных вам необходимо загрузить образ, что займет много времени.
Рисунок 7. Процесс запуска тестовых данных
Рисунок 7. Процесс запуска тестовых данных

4. Процесс полноразмерного анализа 16S третьего поколения PacBio.

Обязательным условием является необходимость установки SMRTlink.

1. Загрузите файл последовательности штрих-кода Sequel II 16S.

На официальном сайте PacBio Multiplexing Page Скачать здесь barcode из Fasta документ (Рисунок 7).

Рисунок 7. Полная длина 16S последовательность штрих-кода fastadocumentunder
Рисунок 7. Полная длина 16S последовательность штрих-кода fastadocumentunder

2. Загрузите файл на сервер и импортируйте его в SMRTlink.

  • ВоляSequel_16S_barcodes_for_192-Plex.fastaдокументначальствоперейти на службу,надеватьopt/barcodes/по пути,Если у вас нет этого пути, вы можете создать его самостоятельно.
  • проходитьData Management - Import Data - Select Barcodes (FASTA)документимпортироватьSMRTlinkпрограммное обеспечение,Штрих-код будет разделен позже для использования (рис. 8).
Рисунок 8. Импорт fastaдокумента в SMRTlink.
Рисунок 8. Импорт fastaдокумента в SMRTlink.

3. Исходные автономные данные запускают процесс CCS и процесс демультиплексных штрих-кодов.

  • Исходный прогон данных о высадкеCCSпроцесс。
  • Надо составлять на примерахBarcoded Sample File,Цель состоит в том, чтобы сопоставить штрих-код и названия образцов.
  • проходитьDemultiplex Barcodesпроцесс Волясмешанная выборка(hifi читает) раскол,SMRT Analysis - Creat New Analysis - Demultiplex Barcodes и установите согласно рисунку 9.
Рисунок 9. Процесс демультиплексного штрих-кода
Рисунок 9. Процесс демультиплексного штрих-кода

4. Копирование и переименование файла.

  • расколотьназадиз Образец начинается сдемультиплекс.barcodecombination.hifi_reads.fastq.gzимя (Рисунок 10).
  • Все документы можно сохранить.,илиначальствопроходитьанализироватьсерверруководитьназад续Полная длина 16Sанализировать。
  • Следующий код можно использовать для переименования образца.
Язык кода:bash
копировать
$ cat rename.txt
демультиплекс.barcodecombination.hifi_reads.fastq.gz  newname1.fastq.gz
демультиплекс.barcodecombination.hifi_reads.fastq.gz  newname2.fastq.gz

$ cat rename.txt | while read i j
>do
>mv $i $j
>done
Рисунок 10. Изfastqдокумент после разделения
Рисунок 10. Изfastqдокумент после разделения

5. Проанализируйте процесс pb-16S-nt.

Сделано по запросуmetadata.tsv и sample.tsvдвадокумент,Просто следуйте примеруруководитьPacBio полная длина 16S проанализировал процесс.

6. Запустите реальные образцы

Язык кода:bash
копировать
$ nohup nextflow run main.nf --input 16S_project/sample.tsv \
      --metadata 16S_project/metadata.tsv -profile conda \
      --outdir 16S_project_results &

# После получения кривой разрежения можно указать глубину разрежения и повторно запустить программу.
$ nohup nextflow run main.nf --input 16S_project/sample.tsv \
      --metadata 16S_project/metadata.tsv -profile conda \
      --outdir 16S_project_results  \
      -resume --rarefaction_depth 5000 &

7. Файлы результатов

специфическийиз Для интерпретации результатов см.:https://github.com/PacificBiosciences/HiFi-16S-workflow/blob/main/pipeline_overview.md

Рис. 11. Результаты анализа полноразмерного HiFi 16S.
Рис. 11. Результаты анализа полноразмерного HiFi 16S.

P.S:

1. Если SMRTlink не установлен,barcodeизрасколоть也可以использоватьlima

Язык кода:bash
копировать
#HiFi run from BAM with symmetric barcodes:
$ lima <movie>.hifi_reads.bam barcodes.fasta <movie>.demux.bam --hifi-preset SYMMETRIC

2. Если данные получены от поставщика услуг секвенирования,Выборочные данные должны быть хорошо разделены.,Используйте HiFi напрямую Full-length Просто проанализируйте процесс анализа 16S.

5. Установка программного обеспечения Nextflow.

NextflowОфициальный сайт: https://www.nextflow.io/

Язык кода:bash
копировать
#Убедитесь, что Java11 установлен
$ java -version
#Если Java не установлена, выполните следующую команду, чтобы установить ее
#Установить OpenJDK 11 JDK, серверная система centOS7
$ yum install java-11-openjdk-devel

#Установить следующий поток
$ curl -s https://get.nextflow.io | bash

#nextflow Пробный пуск
./nextflow run hello

#Вы можете добавить следующий поток в системный путь

Ссылки:

  1. David M. Ward, Roland Weller, Mary M. Bateson, 16S rRNA sequences reveal uncultured inhabitants of a well-studied thermal community, FEMS Microbiology Reviews,1990。
  2. Полная длина третьего поколения 16с — Взгляд на конец микробного мира.
  3. Matsuo, Y., Komiya, S., Yasumizu, Y. et al. Full-length 16S rRNA gene amplicon analysis of human gut microbiota using MinION™ nanopore sequencing confers species-level resolution. BMC Microbiol 21, 35 (2021)。
  4. PacBio Полноразмерное секвенирование 16S: эффективный и экономичный метод исследования микробиома
boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose