Домашний робот Стэнфорда с открытым исходным кодом! Трансформаторная архитектура, разработанная китайцами!
Домашний робот Стэнфорда с открытым исходным кодом! Трансформаторная архитектура, разработанная китайцами!

Подготовлено Дайджестом больших данных

Время от времени в мире технологий происходит прорыв, который полностью меняет наше представление о возможном.

Недавно Стэнфордский университет, Университет Беркли и команда Google DeepMind совместно разработали домашнего робота под названием «Mobile ALOHA».

На первый взгляд «Mobile ALOHA» кажется обычным домашним помощником, но вскоре вы обнаружите, что это нечто большее. Этот ИИ способен выполнять широкий спектр бытовых задач.

Стирка и уборка: от сортировки до стирки и даже складывания, «Mobile ALOHA» может стирать. Мало того, он также оснащен функцией вакуума, чтобы в комнате всегда было чисто и опрятно.

Помощь в садоводстве: снижает нагрузку на ежедневные работы в саду за счет полива и других методов, а также может помочь в вывозе мусора. ‍‍

Уход за домашними животными: Удивительно, но «Mobile ALOHA» также может взаимодействовать и играть с домашними животными, добавляя новое измерение к автоматизированному кормлению домашних животных.

В настоящее время робот доступен для покупки, а его программное обеспечение имеет открытый исходный код. ‍

Mobile АЛОХА: Освободите свои руки в работе по дому

Имя этого робота — Mobile ALOHA. Исследовательская группа из Стэнфорда построила его тремя людьми.

Бумажный адрес:

https://mobile-aloha.github.io/resources/mobile-aloha.pdf

Адрес проекта:

https://mobile-aloha.github.io/

Техническая документация: https://docs.google.com/document/d/1_3yhWjodSNNYlpxkRCPIlvIAaQ76Nqk2wsqhnEVM6Dc/edit.

Среди них Цзипэн Фу является соруководителем проекта. Он является докторантом компьютерных наук в Лаборатории искусственного интеллекта Стэнфордского университета под руководством профессора Челси Финн. Чжао также является докторантом компьютерных наук; Стэнфордский университет, и его научным руководителем также является Челси Финн. Все трое вместе работали над исследованием.

Mobile ALOHA — это небольшой робот на колесиках, по размеру похожий на устройство Amazon Alexa. Оснащенный камерой, микрофоном и динамиками, он может видеть, слышать и общаться с пользователями. Самой уникальной особенностью Mobile ALOHA является его мобильность – способность автономно перемещаться в помещении, используя передовые возможности компьютерного зрения.

Mobile ALOHA Ключевой инновацией являются достижения Google в области роботизированной навигации и картографирования.Mobile ALOHA может использовать камеры и датчики для идентификации мебели, предметов и стен и построения динамической карты внутренних помещений. Он способен позиционировать себя на карте и планировать оптимальные пути навигации. Машинное обучение позволяет роботам со временем улучшать свои картографические и навигационные возможности по мере сбора большего количества сенсорных данных.

на самом деле,Вот этотробот Одной из наиболее привлекательных особенностей является двойной режим работы.。он можетручное управление:Поддержка сложных операций дистанционного управления,Обеспечить точный контроль и возможности выполнения задач.。автоматическая функция:Возможно, самой новаторской особенностью является его способность работать автономно.,После ок. 50 После этой обучающей демонстрации робот смог самостоятельно выполнять сложные задачи, в том числе пользоваться лифтами и готовить еду.

В технических деталях Mobile ALOHA унаследовала преимущества оригинальной системы ALOHA, а именно недорогого, удобного и удобного в обслуживании устройства дистанционного управления с двумя руками, одновременно расширяя его функциональность за пределы настольного компьютера.

Что касается имитационного обучения,Mobile ALOHA воспользовался Трансформер (архитектура, используемая в больших языковых моделях).исходный ALOHA В системе используется метод, называемый Action Chunking with Transformers (ACT) архитектура, которая принимает изображения с нескольких точек зрения и совместных позиций в качестве входных данных и прогнозирует последовательность действий.

Кроме того, благодаря успеху генеративной модели MobileAloha может быстро учиться на человеческих демонстрациях и научиться чему-то одному всего за 50 демонстраций, а совместное обучение может увеличить вероятность успеха до 90%.

Генеративный искусственный интеллект и будущее робототехники

Превосходная производительность робота Mobile ALOHA неотделима от преимуществ некоторых ключевых технологий современных крупных моделей. Генеративный ИИ с пониманием играет две уникальные роли в исследованиях воплощенного ИИ и робототехники:

1. Генератор данных/опыта. Создавайте 2D-изображения, видео, 3D-сцены или корпус 4D (3D + время), необходимые для обучения роботов. Учитывая, что реальный опыт роботов (данные) чрезвычайно ценен, генеративный ИИ можно рассматривать как «симулятор обучения». Я твердо убежден, что без моделирования обучения и тестирования исследования в области робототехники не могут проводиться в больших масштабах.

2. Архитектура самообучения: генерация сенсорных данных, которые робот может наблюдать в будущем, и сравнение их с фактическими наблюдениями в качестве обучающего сигнала, не требующего маркировки.

Робототехника также обнаружила, что большие модели зрительно-речевых действий можно обучить, чтобы улучшить восприятие робота и контролировать движения его рук и ног. В настоящее время генеративный искусственный интеллект окажет революционное влияние на все области робототехники, от моделирования до проектирования. Например:

Симуляция. Модели ускорят разработку симуляций за счет создания сцен, среды и ресурсов, сокращая разрыв между техническими 3D-художниками и разработчиками. Ресурсы, созданные с помощью генеративного искусственного интеллекта, будут широко использоваться в синтезе данных, обучении навыкам роботов и тестировании программного обеспечения.

Мультимодальный ИИ: модели на основе трансформаторов улучшат способность роботов понимать окружающий мир, позволяя им работать в большем количестве сред и выполнять более сложные задачи.

(Пере)программирование роботов: у роботов появится больше возможностей определять задачи и функции простым языком, что сделает их более универсальными и многоцелевыми.

Конструкция: Инновационная механическая конструкция повысит эффективность, например, при разработке концевых эффекторов.

мобильный Появление ALOHA, несомненно, дало импульс отечественному рынку домашних роботов. Хотя он еще не идеален, как сказал Кен из Калифорнийского университета в Беркли, рынок домашних роботов огромен и необходим: «Я прогнозирую. что в ближайшие десять лет мы увидим более доступных домашних роботов, которые Способны помогать в ежедневной уборке, например собирать с пола одежду, игрушки и мусор и размещать их в специально отведенных местах. Хотя эти роботы иногда могут совершать ошибки, они обеспечат удобство семьям, особенно родителям и пожилым людям. их ограничения будут значительно превышены».

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose