В ходе эволюции технологий центров обработки данных в последние годы серверные сети AI/ML расширялись быстрее, чем мы ожидали. Конференция OFC в этом году, несомненно, является лучшим объяснением этого явления: масштабы беспрецедентны.
По нашему мнению, раньше этой областью руководила Google, но теперь ею управляет Nvidia. Благодаря своему доминирующему положению в сфере ИИ-вычислений она играет важную роль в содействии развитию оптических технологий, таких как оптическая связь.
Прогнозируется, что к 2025 году оптический спрос на серверные сети AI/ML будет на одном уровне с существующим крупным рынком интерфейсных сетей, и вполне вероятно, что через два года серверная часть превзойдет интерфейсную часть. . Конечно, вместе с этим возникает потребность в интерфейсах с более высокой скоростью и плотностью передачи данных.
В результате мы видим значительный интерес к подключаемым оптическим трансиверам емкостью 800 ГБ, 1,6 ТБ и будущим 3,2 ТБ для внешних и внутренних структур центров обработки данных.
В прошлом году концепция линейной подключаемой оптики (LPO) вызвала бурную дискуссию. Она теоретически может значительно снизить энергопотребление и стоимость за счет перемещения DSP с оптических модулей на хост-ASIC. Такие компании, как Cisco, доказали преимущества этой инновации с помощью данных. Однако со временем люди начали обращать внимание на стабильность ссылок, диагностику производительности и т. д., что привело к охлаждению энтузиазма по поводу продвижения LPO.
В этом контексте линейная приемная оптика (ЛРО) рассматривается как компромиссное решение. То есть, используя ретаймер на стороне передатчика (Tx), линейный приемник подключается непосредственно к ASIC хоста. Хотя это решение не такое энергопотребление и экономичность, как LPO, оно все же снижает энергопотребление модуля и определенную стоимость по сравнению с модулем с полной пересинхронизацией, а также обеспечивает некоторую диагностическую поддержку канала.
При скорости 100 Гбит на канал LRO и LPO имеют большие преимущества в снижении энергопотребления и стоимости. Однако относительно осуществимости LPO в сценарии с одноволновой скоростью 200 Гбит/с на конференции OFC в этом году была проведена горячая дискуссия. для этой цели. Судя по докладам экспертов на встрече, в настоящее время существует два основных лагеря:
Рисунок: LPO без ретаймера, 25 д Б (C2M), требует отношения сигнал/шум на 11,5 д Б выше, чем у оптики с ретаймером.
Кроме того, на рынке до сих пор остаются большие сомнения по поводу энергопотребления ПОЛ. Хотя решение LPO исключает энергопотребление сериализатора/десериализатора (SerDes) и oDSP в модуле, из-за более строгих требований к потерям канала сигнал необходимо компенсировать на стороне хоста, что приводит к SerDes на стороне хоста. . энергопотребление увеличивается.
Мы видим, что, хотя первоначальной целью решения LPO было снижение энергопотребления, вопрос о том, как продолжать эффективно снижать энергопотребление при одновременном увеличении скорости канала, по-прежнему остается проблемой, с которой сталкивается отрасль. Этот спрос также привел к появлению инновационных технологий охлаждения, таких как жидкостное охлаждение и иммерсионное охлаждение, которые рассеивают тепло посредством прямого или косвенного контакта с жидкостью и могут эффективно облегчить проблемы управления температурным режимом, вызванные высокоскоростным оборудованием и высокой плотностью размещения. В настоящее время понятно, что каждая компания ищет индивидуальные решения в соответствии со своей ситуацией.
Здесь я хотел бы упомянуть PPT LPO и 400G DR4, показанный Се Чуном из Alibaba на семинаре. Согласно содержанию PPT, LPO снижает энергопотребление на 50%, задержку на 100% и производственные затраты на 30%. Однако, как отметили Чхонджин Се и многие другие эксперты на конференции, возможность реализации однополосной технологии LPO со скоростью 200 Гбит/с остается серьезной нерешенной проблемой отрасли.
Хотя на прошлогодней конференции OFC мы увидели дебют первых оптических модулей с поддержкой одноканальной технологии 200 Гбит/с. Эти первоначальные решения совместимы с электрическими каналами хост-интерфейса со скоростью 100 Гбит/с благодаря конструкции, напоминающей «коробку передач». Хотя некоторые передовые разработчики могут выбрать системы и оптические модули с такой конфигурацией, в долгосрочной перспективе более идеальным решением будет напрямую использовать электрические каналы 200 Гбит/с для соединения хоста и оптических модулей, что позволит лучше использовать одиночный канал 200 Гбит/с. оптических модулей.
На конференции этого года мы увидели более широкий выбор оптических модулей с одноканальной скоростью 200 Гбит/с, а технологическая зрелость также значительно улучшилась по сравнению с предварительной демонстрацией в прошлом году. Например, компания Broadcom, принадлежащая Niu B, объявила о выпуске модуля EML 200 Гбит/с на канал и первого модуля VCSEL с вертикальным резонатором и пропускной способностью 200 Гбит/с на канал.
Но для модульного решения со скоростью одного канала 200 Гбит/с следует использовать LPO или LRO? Вы можете оставить сообщение, чтобы выразить свое мнение!
Каким бы ни было решение, я считаю, что одноканальные оптические модули со скоростью 200 Гбит/с могут сыграть более важную роль в таких ключевых областях, как соединение центров обработки данных, AI/ML и крупномасштабная сетевая передача.
Просто в чате, прошу простить если есть неточности, спасибо что дочитали! Добро пожаловать, следуйте за нами!