[Источник живой воды] CityGaussian: новый эталон городской реконструкции в эпоху VR/AR
[Источник живой воды] CityGaussian: новый эталон городской реконструкции в эпоху VR/AR

«Спросите канал, насколько он чист, и появится источник проточной воды». Приобретение знаний в передовых областях, получение вдохновения из других областей исследований и более четкое понимание природы исследовательских проблем являются неисчерпаемым источником. самосовершенствования. Для этого мы специально подобрали конспекты для чтения и создали рубрику «Источник живой воды», которая поможет вам широко и глубоко читать научно-исследовательскую литературу, так что следите за обновлениями!

Описание:CityGaussian: высококачественный рендеринг крупномасштабных сцен в реальном времени с использованием гауссиан.

Имя автора: Лю Ян、Гуань Хэ、Ло Чуанчен、Фан Лю、Ван Найян, Пэн Цзюньрань (автор-корреспондент)、Чжан Чжаосян(Автор-корреспондент)

Ссылка на документ: https://arxiv.org/pdf/2404.01133.

Сайт проекта: https://dekuliutesla.github.io/citygs/

Крупномасштабная реконструкция городской сцены и рендеринг в реальном времени имеют большое значение для многих областей национальной экономики и жизнедеятельности людей, включая ситуационную осведомленность, воздушный поиск, моделирование автономного вождения, защиту культурных реликвий и живописных мест, навигацию по онлайн-картам и т. д. . Недавно моя лаборатория представила новую работу на ECCV 2024, ведущей конференции в области искусственного интеллекта, исследующей технологии трехмерной городской реконструкции. В этой работе предлагается алгоритм CityGaussian, который может проводить реалистичную трехмерную реконструкцию городов размером со здания и площадью до 2,5 квадратных километров на основе данных аэрофотосъемки с дронов и сокращает время обучения на видеокартах потребительского уровня почти с 20 часов. до часов. В то же время, на основе предложенной нами технологии LoD (Уровень детализации), туры в реальном времени могут проводиться по реконструированному городу с разрешением высокой четкости 1080P или выше, что привнесет новый опыт в картографическую сцену. предварительный просмотр, VR и AR. Наш метод был протестирован и оценен в нескольких сложных сценариях, включая MatrxiCity, Mill19 и т. д. Результаты показывают, что наш метод значительно лучше существующих алгоритмов реконструкции с точки зрения качества рендеринга и производительности в реальном времени.

Обзор метода

Предложенный нами алгоритм CityGaussian основан на технологии 3D Gaussian Splatting (3DGS) и предлагает эффективный алгоритм параллельного обучения и быстрый алгоритм многоуровневого рендеринга (LoD) для реконструкции крупномасштабных сцен. Традиционный алгоритм неявного представления, основанный на Neural Radiation Field (NeRF), имеет низкую степень восстановления деталей в крупномасштабных сценах, а скорость обучения и рендеринга низкая, что серьезно влияет на впечатления от тура по реконструированной сцене. Недавно предложенный алгоритм явного представления 3D Gaussian Splatting (3DGS) открывает новые возможности для реконструкции сцены благодаря возможности редактирования и эффективному рендерингу. Однако представление крупномасштабных сцен с явным 3DGS часто означает генерацию миллионов гауссовских точек, что не только вызывает переполнение памяти во время обучения, но и сильно замедляет скорость рендеринга, особенно в надежде использовать большое поле зрения с видом на город. .

Для решения этих проблем, с одной стороны, предлагается эффективная структура блочного параллельного обучения, которая делит гауссовы точки на разные подблоки в соответствии с пространственным распределением и адаптивно распределяет необходимые обучающие данные для каждого подблока. Каждый подблок можно обучать параллельно на разных графических процессорах с гораздо меньшими затратами на обучение, а после завершения обучения его также можно объединить в единое трехмерное представление всей сцены, используя простую стратегию. С другой стороны, для обученного крупномасштабного представления 3DGS используются разные степени сжатия для получения представлений сцен с разными уровнями детализации. При фактическом рендеринге мы используем высокие уровни детализации для сцен с близкого расстояния и более грубые уровни детализации для удаленных областей, тем самым значительно уменьшая количество точек Гаусса, фактически необходимых для рендеринга, и значительно снижая стоимость крупномасштабного рендеринга. задерживать.

(1) Этап обучения

Сначала для сцены априори обучается 3DGS-представление с меньшим объемом и более грубым качеством рендеринга. Исходя из этого, мы разобьем гауссовы точки на ряд непересекающихся блоков в сжатом координатном пространстве. Каждый блок определяет, какие данные выделить для обучения, на основе своей проекционной связи и взаимосвязи пространственных координат с обучающей выборкой. Затем каждый подблок можно обучать параллельно, а результаты параллельного обучения можно объединить для получения 3DGS-представления всей сцены. Процесс обучения показан на рисунке ниже.

Рисунок 1. Блок-схема обучения

(2) Этап рендеринга

Используйте LightGaussian для сжатия результатов обучения, а разные степени сжатия соответствуют разным уровням детализации. Во время фактического рендеринга блоки, разделенные на этапе обучения, используются как единицы для быстрого определения того, какие блоки находятся в пределах усеченной пирамиды обзора, а также расстояния между блоками и центром камеры. Чем ближе блок к центру камеры, тем алгоритм будет использовать для характеристики точки GS с более подробной детализацией и меньшей степенью сжатия, тем самым уменьшая количество точек GS, необходимых для рендеринга, и повышая производительность в реальном времени. Процесс рендеринга показан на рисунке ниже.

Рисунок 2. Блок-схема рендеринга

Результаты экспериментов

Сравнение эффектов визуального рендеринга показано на рисунке ниже. Видно, что наш алгоритм может значительно улучшить качество рендеринга и восстановить детали независимо от фактически собранных данных дрона или данных, собранных в среде моделирования. опыт гастролей.

Рисунок 3. Сравнение с методами SOTA на разных наборах данных

Кроме того, мы также проверили эффективность LoD на крупномасштабном наборе данных MatrixCity. Как видно из таблицы 2, представленная технология LoD увеличивает скорость рендеринга с 21,6 кадров в секунду до 53,7 кадров в секунду, обеспечивая при этом реалистичные эффекты рендеринга и хорошо балансируя качество рендеринга и производительность в реальном времени. На рис. 6 показана зависимость изменения скорости при обзоре камеры реконструированного города с разных высот. Видно, что даже в худшем случае наш алгоритм LoD может поддерживать скорость рендеринга более 25FPS, обеспечивая плавное переключение между различными диапазонами углов обзора.

Рисунок 4. Уровень детализации проверки

Демонстрация видеоэффекта

Резюме и перспективы

3DGS в значительной степени способствовал развитию реконструкции 3D-сцен в реальном времени и синтезу новых изображений. Предлагаемый нами алгоритм CityGaussian использует новый метод параллельного обучения и стратегии нескольких уровней детализации (LoD) для эффективного крупномасштабного обучения и рендеринга 3DGS, достижения современного качества рендеринга и может выполнять крупномасштабный рендеринг с различными масштабы. Сцена визуализируется в реальном времени.

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose