Через восемнадцать месяцев после появления ChatGPT индустрия начала задаваться вопросом о будущем — когда наступит «эра AGI»?
19 сентября на конференции Yunqi за круглым столом «Путь к разработке больших моделей AGI» основатель и генеральный директор Step Star Цзян Дасинь, основатель Dark Side of the Moon Ян Жилин、Вице-президент Исследовательского института ИИ Университета Цинхуа、Чжу Цзюнь, главный научный сотрудник Shengshu Technology, и Чжан Пэн, основатель Geek Park,Как практики и люди, испытавшие это на себе, я проанализировал развитие отрасли за последние 18 месяцев, и все они отметили, что «AGI ускоряется очень быстро».
По мнению Цзян Дасиня,Путь эволюции AGI разделен на «мир симуляции». «Исследуй мир» «Обзор мира»,Соответствующие промышленные применения включаютGPT-4o、FSD v12 и OpenAI o1: «(Они) добились очень больших прорывов в этих трех направлениях».
Понимание Ян Жилинем ускорения искусственного интеллекта имеет два уровня.,«IQ продолжает улучшаться» , «Мультимодальное горизонтальное развитие».
Чжу Цзюнь не только считает, что процесс AGI ускоряется,по его мнению,Повышенная производительность AGI также включает в себя более быстрый анализ проблем.,Они извлекают выгоду из более зрелого понимания практикующими специалистами мультимодальности.,и для Вычислительная мощность、Ресурсы инфраструктуры подготовлены лучше.
Ускорение процесса AGI невозможно отделить от успеха новатора OpenAI. OpenAI выпустила новую модель o1 12 сентября. Сэм Альтам заявил, что это «происхождение новой смены парадигмы», и отрасль считает, что это ключевой шаг в развитии AGI.
С точки зрения практикующего,Способность модели o1 к рассуждению обладает отличными возможностями в конкретных сценариях. Что еще более важно, она исследует методологию того, «как обобщить обучение с подкреплением» в контексте «истощения данных».,Цзян Дасинь сказал“это приноситScaling Новое направление Ло, — сказал Ян Жилин, — (обучение с подкреплением) в значительной степени решает проблему дальнейшего масштабирования ИИ и источника получения данных. "
AGI ускорился за последние 18 месяцев
«За последние 18 месяцев AGI очень быстро ускорился», — сказал Цзян Даксин, основатель и генеральный директор Step Star.
Оглядываясь назад, можно сказать, что GPT-4 от OpenAI был доминирующим и далеко впереди. Начиная с этого года, помимо OpenAI o1, Anthropic также выпустила Claude 3.5, Google выпустила Gemma, Grok 2 от XAI и Llama 3 от Meta. представлены одна за другой, и существует тенденция конкуренции крупных моделей друг с другом.
В этом контексте возможности и качество больших моделей также улучшаются за счет многопоточности. Многорежимное объединение GPT-4o вышло на новый уровень, включая независимые модели, такие как изображения, зрение и звук, интегрированные в одну модель». Многорежимный «Fusion» должен помочь нам лучше моделировать наш физический мир», — сказал Цзян Даксин.
Цзян Даксин охарактеризовал путь эволюции ОИИ как «моделируемый мир». «Исследуй мир» «Итоги мира», «За последние несколько месяцев мы видели GPT-4o, FSD v12 и OpenAI o1 добился больших прорывов в этих трех направлениях. "
Что касается итогов прошедших 18 месяцев, Ян Жилин, основатель Dark Side of the Moon Kimi, ответил, что «IQ улучшается» и «мультимодальное горизонтальное развитие».
Ян Жилин сказал: «IQ улучшается. Если вы посмотрите на математические способности участников, то, возможно, в прошлом году вы вообще не потерпели неудачу, но в этом году вы можете набрать более 90 баллов. «Также было много новых прорывов». по горизонтали, и в последнее время появилось много новых продуктов и технологий. Теперь вы можете напрямую создать разговор двух человек с помощью бумаги, который по сути неотличим от истинного к ложному. Такой вид трансформации, взаимодействия и генерации между различными модальностями. станет все более и более зрелым».
«Большие модели претерпели много важных изменений в этом году, и я также согласен, что процесс AGI ускоряется», — сказал Чжу Цзюнь, заместитель декана Института искусственного интеллекта Университета Цинхуа и главный научный сотрудник Shengshu Technology.
По мнению Чжу Цзюня, производительность AGI также включает в себя скорость анализа проблем: «Всеобщее понимание и подготовка к этому (мультимодальному) маршруту достигли относительно хорошего уровня, а также существуют физические условия, такие как облачные объекты и подготовка вычислительных ресурсов: как только мы освоим их, мы сможем решать проблему все быстрее и быстрее».
Значение OpenAI o1: обучение с подкреплением
Недавно выпущенная модель o1 OpenAI доводит возможности рассуждения больших моделей до уровня доктора наук.
«Это впервые доказало, что языковая модель может обладать способностью человеческого мозга думать медленно. Она может самоанализировать и исправлять ошибки, пока не найдет правильный способ решения проблемы. «Это также открывает новое направление». «Закона масштабирования». o1 пытается ответить на вопрос об усилении. «Научитесь обобщать», — сказал Цзян Даксин.
В настоящее время в академических кругах,противAGI делит их на L1, L2, L3, L4 и L5 в зависимости от уровня их способностей. L1 относится к чат-роботу, L2 обладает способностью глубоко мыслить и рассуждать, L3 — интеллектуальный агент, который переходит из цифрового мира в цифровой. физический мир, и L4 должен обладать способностью открывать и создавать новые знания, L5 представляет собой организатора, а ИИ уже обладает способностью организовывать сотрудничество.
«(OpenAI o1) представляет собой значительное качественное изменение», — сказал Чжу Цзюнь, — «O1 может достичь очень высокого уровня человеческого интеллекта при выполнении конкретных задач на уровне L2, что действительно представляет собой прогресс всей отрасли».
Что касается новой модели О1, внешние комментарии вполне положительные, но какова внутренняя перспектива? Сэм Альтман определяет это как «появление новой смены парадигмы».
«Я думаю, что это имеет большое значение. Это поднимает верхний предел ИИ. Ключевым моментом является то, можно ли его масштабировать дальше с помощью обучения с подкреплением», — сказал Ян Жилин. «Если мы посмотрим на развитие ИИ в последние 70-80 годы. лет единственное эффективное средство — это масштабирование. Единственное, что работает, — это увеличение вычислительной мощности».
По мнению Ян Чжилина, в прошлом возможности модели GPT-4 были детерминированным улучшением, тогда как o1 не было детерминированным улучшением.
«Раньше люди, возможно, беспокоились, что большая часть высококачественных данных в Интернете была израсходована, и больше нет данных для анализа. Первоначальная парадигма может столкнуться с проблемами. Если ИИ нуждается в дальнейшем масштабировании, то где тогда данные поступают из? (Обучение с подкреплением) очень велики. Это в определенной степени решает эту проблему или, по крайней мере, доказывает, что это изначально осуществимо». «Таким образом, все больше и больше людей будут вкладывать средства в это, и это полностью можно достичь эффекта, в 10 раз превышающего эффект GPT».
Предпринимательство, инвестиции и ближайшие 18 месяцев
Чжу Сяоху сказал в «Истории китайского реализма AIGC»: «Я верю в AGI, верю в приложения и верю в немедленную коммерциализацию».
Какой уровень информационных продуктов можно коммерциализировать? Когда предприниматели превратятся в инвесторов, как они будут оценивать показатели данных текущих проектов ИИ? В какие проекты стоит инвестировать?
Ответ Ян Жилиня: «ценность самого продукта», «дополнительная стоимость продукта» и «достаточно большой размер рынка».
«DAU и коэффициент удержания, безусловно, являются наиболее важными показателями, но как продукт он в первую очередь должен быть ценным. Эта суть может не иметь большого отношения к ИИ. «За пределами ChatGPT будет много возможностей. По сравнению с тем, что есть». он должен генерировать. Дополнительная ценность может делать то, что невозможно сделать в ChatGPT». «С развитием технологий размер рынка будет становиться все больше и больше, а не меньше и меньше», — сказал Ян Жилин.
За последние 18 месяцев, от ChatGPT до o1 сегодня, как приложения, так и модели и элементы возможностей постоянно расширялись и улучшались. Практики в основном сформировали консенсус по ускорению AGI. Насколько далеко зайдет общий искусственный интеллект. оно пойдет?
Чжу Цзюнь сказал: «Нам необходимо (уровень L4) заниматься научными открытиями и инновациями. Требуемые возможности в настоящее время разбросаны по всем углам, и все еще отсутствует система для интеграции этих вещей. Если мы будем более радикальными, мы будем также будет L4 в ближайшие 18 месяцев. Значительный прогресс».
Ян Жилин согласовал свои цели с OpenAI и продолжил изучать масштабирование на пути обучения с подкреплением.
«Следующая по важности веха — это открытое обучение с подкреплением. O1 может в определенной степени указывать на то, что это направление имеет большую определенность, чем раньше. Это будет важная веха и единственная важная веха, оставшаяся на пути AGI. Проблема».
Цзян Даксин и Ян Чжилинь также пришли к единому мнению по поводу обучения с подкреплением, но у него есть и другое ожидание — «интеграция понимания и генерации видео». «Это может полностью построить мультимодальную модель мира, которая может помочь нам по-настоящему создавать очень длинные видеоролики, что должно решить текущие технические недостатки Соры. Кроме того, она может служить мозгом робота, помогая агенту лучше изучать физику». мир."
Ниже приводится стенограмма разговора (с удалениями и исправлениями без изменения первоначального смысла)
Чжан Пэн:доброе утро всем,Я Чжан Пэн из Geek Park. Большая честь сегодня,Тоже очень рад,Чтобы иметь такую возможность приехать на конференцию Yunqi.,В то же время мне удалось пообщаться с несколькими исследователями в области масштабных моделей в стране.,Давайте вместе изучим прогресс модельных технологий.
Я думаю, что в только что произнесенной речи г-на Ву многие почувствовали его твердую уверенность в больших моделях и в этой волне развития AGI. Он даже четко отметил, что это не просто расширение мобильного Интернета, но может стать революцией в мире. физический мир Новая революция. Конечно, я думаю, что на данном этапе нам, возможно, придется деконструировать цепочку его выводов. Первый шаг — посмотреть, как развивается технология моделирования. Каковы выводы и перспективы на прошедшие 18 месяцев и ближайшие 18 месяцев?
Начнем с взгляда на прошлое. Прошло почти 18 месяцев с тех пор, как выпуск ChatGPT способствовал глобальному пониманию AGI. Интересно, что ты чувствуешь по этому поводу? Разработка моделей ускоряется или замедляется? Мы все наблюдаем за вами, «игроками». Пожалуйста, зайдите на сайт «игроков», чтобы поделиться сегодня. Мы попросили Цзян Дасиня поделиться, что вы думаете о развитии искусственного интеллекта: оно ускоряется или замедляется?
Цзян Дасинь:Я думаю, это прошлое18Ежемесячное развитие ускоряется,Очень быстро.
Оглядываясь назад на события в области ИИ за последние 18 месяцев, мы можем взглянуть на них с двух сторон: одно — количество, а другое — качество. Судя по количеству, новые модели, новые продукты и приложения появляются почти каждый месяц. Если рассматривать только модели, то OpenAI выпустила Sora в феврале, GPT-4o в мае и o1 на прошлой неделе. В прошлом году мы чувствовали, что GPT-4 доминирует, далеко впереди. Но в этом году ситуация стала «толпой героев», и вы гоняетесь друг за другом, поэтому в целом такое ощущение, что все ускоряются. .
Меня поразили три вещи. Первым делом это выпуск GPT-4o,Он выходит на новый уровень в области многомодовой интеграции. До GPT-4o,Есть ГПТ-4в,Это модель визуального понимания.,генеративная модель видения,Есть и звуковые модели. Эти первоначально изолированные модели,Вот мы и на GPT-4o.,Все смешалось вместе。Почему эта интеграция важна?из-за нашегоСам физический мир мультимодален, и синтез помогает лучше моделировать физический мир и симулировать этот мир.
Второе — FSD, выпущенный Tesla. V12,Все знают, что это большая сквозная модель.,Сенсорные сигналы могут быть напрямую преобразованы в управляющие последовательности.。Область интеллектуального вождения очень репрезентативна. Это пример реальных сценариев применения, переходящих из цифрового мира в физический.поэтому,Я думаю ФСД Успех V12 заключается не только в самом интеллектуальном вождении, но и в том, что его методология указывает путь к объединению будущих интеллектуальных устройств с большими моделями для исследования физического мира.
Третье, чтоВыпуск o1 впервые доказал, что языковая модель может обладать «способностью медленного мышления человеческого мозга», которая является так называемой способностью Системы 2.。система2Способность – основное условие понимания и обобщения мира.。
Мы всегда считали, что путь развития ОИИ можно разделить на мир симуляций, мир исследований и, наконец, мир индукции.И в последние несколько месяцев,GPT-4o、FSD V12 и o1 совершили большие прорывы на этих трех этапах и направлениях соответственно, а также указали направление будущего развития. Поэтому данные разработки достойны внимания как по количеству, так и по качеству.
Чжан Пэн:Ян Жилин,Как вы себя чувствуете? Ты тот, кто в этом заинтересован,Он должен отличаться от тех из нас, кто «смотрит за игрой».
Ян Жилин:общий,Действительно, он находится на стадии ускоренного развития.,Ядро может рассматривать развитие ИИ с двух сторон.
Первое измерение — это вертикальное измерение, то есть постоянное улучшение IQ.Сейчас это в основном текстовые модели,Способность явно улучшилась. Например, прошлогодняя модель могла полностью провалить математическое соревнование.,В этом году мы уже набрали более 90 баллов. Способность кодирования,Модель смогла обойти многих профессиональных игроков в программирование.
Еще одним измерением является горизонтальное развитие. Помимо текстовых моделей, развиваются и другие методы.Горизонтальное расширение этих модальностей снабжает модель дополнительными навыками.,Возможность выполнять больше задач.
Давайте посмотрим на конкретные технические показатели, такие как длина контекста, поддерживаемая языковыми моделями. В прошлом году многие модели могли поддерживать только от 4 до 8 КБ, но теперь стандартом стало 128 КБ. Сочетание улучшенного IQ и множества методов оптимизации еще больше ускорило развитие ИИ.
По горизонтали постоянно появляются новые прорывы, такие как создание видео, такие как Sora, которая имеет большое влияние и завершила создание видео. В последнее время появилось множество новых продуктов и технологий, которые могут даже создавать, казалось бы, настоящие разговоры двух человек посредством бумаги. Трансформация, взаимодействие и порождение между модами становятся все более зрелыми, а общий процесс ускоряется.
Чжан Пэн:Эти технологии действительно расширяют возможности изменений и инноваций, которые они приносят.。Хотя мы еще не видели появления какого-либо конкретного суперприложения.,Но технически,Прогресс очень очевиден. Учитель Чжу Цзюнь,Как бы вы подытожили опыт применения технологии AGI за последние 18 месяцев? Какие этапы прогресса можно резюмировать?
Чжу Цзюнь:существоватьAGIполе,Самое интересное — большая модель. В этом году в большой модели произошло много важных изменений.,Я полностью согласен с только что упомянутым ускорением технического прогресса. Я бы добавил, что скорость разбора проблем тоже растёт.
Обзор истории языковых моделей,Ян Жилин и другие начали делать это в 2018 году.,Прошло пять или шесть лет с этого года.。в прошлом годуПервая половина года в основном посвящена языковым моделям, а вторая половина года начинает обсуждать мультимодальность.От мультимодального понимания к мультимодальному порождению,В частности, наиболее очевидным является развитие технологий генерации видео.
В феврале этого года многие люди были шокированы быстрым развитием технологий и даже начали задаваться вопросом, полностью ли раскрыта технология и как были достигнуты технологические прорывы. Было много дискуссий. Но на самом деле, примерно через полгода индустрия внедрила эти технологии в практическое применение, и результаты очень хорошие, особенно показатели пространственно-временной согласованности очень выдающиеся.
Основная причина такого ускорения заключается в том, что всеобщее понимание и подготовка технического маршрута достигли относительно хорошего уровня. Важную роль также играет зрелость физических условий, таких как подготовка облачных мощностей и вычислительных ресурсов.
По сравнению с тем, когда был запущен ChatGPT, многие люди не были готовы принять эту технологию, в результате чего на ее изучение и освоение тратилось много времени. Когда все освоили эти технологии, они обнаружили, что скорость прогресса становится все быстрее и быстрее. Конечно, разные возможности могут работать по-разному на уровне пользователя, и в разных отраслях могут даже быть различия в скорости. Но в широкой перспективе кривая технического прогресса становится круче. Я сохраняю оптимизм в отношении развития искусственного интеллекта более высокого порядка в будущем и думаю, что в будущем прогресс будет быстрее, чем в прошлом.
Чжан Пэн:С точки зрения трех человек,Если кто-то скажет, что развитие AGI замедлилось,Вы можете просто сказать это в одном предложении“Что еще ты хочешь??” Прогресс за последние 18 месяцев ошеломил всех. Только что выпущенная модель o1 также вызвала широкое обсуждение в профессиональной сфере. У нас просто есть шанс услышать, что вы думаете. Цзян Дасинь, что ты думаешь об o1? Многие считают, что это важный прогресс на этапе разработки AGI. Как вы понимаете этот прогресс?
Цзян Дасинь:Действительно,Я вижу голоса, не согласные с консенсусом. Некоторые считают, что это важно,Некоторые люди не находят в этом ничего особенного. Но если вы действительно использовали o1,Первое впечатление – его способность к рассуждению поразительна. Мы провели много тестов,Я обнаружил, что его способность к рассуждению действительно вышла на новый уровень. о его значении,Я могу думать о двух вещах.
Во-первых, o1 впервые доказал, что языковая модель может обладать способностью человеческого мозга к медленному мышлению, то есть способностью Системы 2.система1Это линейное мышление,Система 2 способна исследовать разные пути,Саморефлексия и исправление ошибок,Непрерывные пробы и ошибки,Пока не найдешь правильный ответ. Предыдущий GPT-4 может разбить сложные проблемы на несколько этапов решения.,Но все равно линейно. Разница между Системой 2 заключается в том, что,Он может попробовать разные пути. На этот раз o1 сочетает в себе обучение с имитацией и обучение с подкреплением.,Сделайте так, чтобы модель обладала возможностями как Системы 1, так и Системы 2.,Это очень важно.
Во-вторых, o1 обеспечивает масштабирование Новое направление права.Он пытается ответить на вопрос о том, как обучение с подкреплением обобщает。Обучение с подкреплением — не новая концепция,DeepMind пошел по пути обучения с подкреплением от AlphaGo к AlphaFold.,Но эти сценарии обучения с подкреплением предназначены для конкретных областей.,Например, AlphaGo может играть только в Го. Появление o1 вывело универсальность и способность к обобщению обучения с подкреплением на новый уровень.,и достигло большего масштаба。Поэтому я думаю, что o1 приносит новую парадигму масштабирования, которую можно назвать новым путем масштабирования.Хотя он еще не совсем созрел,Но это просто захватывающе,Точно так же, как нам говорит OpenAI,Он нашел технический проход с очень высоким потолком. Если вы внимательно подумаете о методе, лежащем в основе этого,Вы поверите, что этот путь можно пройти.
Таким образом, с точки зрения возможностей o1 доказывает, что языковая модель может обладать возможностями Системы 2 с технической точки зрения, она привносит новую парадигму масштабирования, которая имеет большое значение;
Чжан Пэн:Похоже, есть голоса, не пришедшие к единому мнению.,Но вы очень оптимистичны и согласны с о1. Учитель Чжу Цзюнь,Что вы думаете о прогрессе, достигнутом o1? Как вы оцениваете его значимость?
Чжу Цзюнь:Я думаюo1представляет собой значительное качественное изменение。академия против.AGIПоставил оценку,От L1 до L5. L1 — чат-бот,L2 — рассуждающий,Умение глубоко мыслить и рассуждать о сложных вопросах,L3 — агент,Может взаимодействовать и изменять цифровой и физический мир.,L4 – новатор,Умение открывать и создавать новые знания.,L5 – организатор,Ресурсы можно совместно использовать и организовывать более эффективно.
o1 выполняет задачи уровня L2 и достиг уровня человеческого интеллекта высшего порядка.С точки зрения оценок,Это действительно огромный прогресс для отрасли.
Технически, как сказал Цзян Даксин, o1 сочетает в себе обучение с подкреплением и другие технологии. Эти технологии неоднократно опробовались в исследовательской сфере, но на этот раз было проверено их влияние на крупномасштабные модели. Это окажет большое влияние на инженерное развитие отрасли, а также будет стимулировать дополнительные исследования и разработки. Как я только что упомянул, я думаю, что прогресс будет очень быстрым, потому что мы провели большую подготовку. Я также ожидаю, что в этой области возможности L2 будут дополнительно оптимизированы и даже достигнут прогресса на более высоком уровне.
Чжан Пэн:Ваше определение этого прогресса уже очень высоко.,Считается, что на этапе L2,AGI добилась значительного прогресса и поэтапных результатов. А ведь раньше мы еще были на стадии L1,В будущем будет дальнейший прогресс,До достижения стадии L3,Только так мы сможем комплексно и системно изменить физический мир.
После выхода на этот раз o1 Сэм Альтман тоже назвал его революцией парадигмы. Сэм Альтман всегда был хорош в речах и выражениях. Как вы понимаете упомянутое им изменение парадигмы? Согласны ли вы, что это революция парадигмы?
Ян Жилин:我觉得它的意义Действительно很大,Основная причина — увеличение верхнего предела AI. Верхний предел ИИ означает, можете ли вы повысить производительность на 5% или 10% сейчас.,все еще10разGPT。Самый важный вопрос здесь заключается в том, сможете ли вы в дальнейшем осуществлять масштабирование посредством обучения с подкреплением, которое является основой полного улучшения верхнего предела возможностей ИИ.если мы оглянемся назадAI За 70-80 лет истории развития единственный по-настоящему эффективный путь — это масштабирование, а единственный эффективный способ — добавить больше вычислительной мощности.
До появления o1 многие люди действительно изучали обучение с подкреплением, но в то время не было четкого ответа. Если обучение с подкреплением интегрировано с большими языковыми моделями и текущими Pre-Training (предобучение) и Post-Training (постобучение), сможет ли оно продолжать совершенствоваться? Это открытый вопрос.
например,Улучшение модели поколения GPT-4 — это скорее повышение уверенности.,То есть я придерживаюсь той же парадигмы,Прогресс достигается за счет масштабирования. Это обязательно улучшится,Но улучшение o1 не является полностью детерминированным улучшением. Итак, до этого,Все будут волноваться,Сейчас большая часть хороших данных в Интернете израсходована.,Продолжение использования этих данных не даст многого. поэтому,Исходная парадигма может столкнуться с узкими местами,Откуда берутся эффективные данные для дальнейшего масштабирования ИИ? Думаю, появление o1 во многом решило эту проблему или, по крайней мере, доказало, что она изначально осуществима.это означает,В эту работу будет вовлечено все больше и больше людей.
В конечном итоге вполне возможно добиться десятикратного увеличения производительности GPT. Я считаю, что это очень важное начало, и для многих промышленных структур и стартапов такая смена парадигмы также принесет новые возможности.
Очень важным моментом здесь является то, что соотношение вычислительных мощностей для обучения и вывода сильно изменится.конечно,Это не означает, что вычислительная мощность обучения снизится.,Вычислительная мощность обучения может продолжать расти,но в то же время,рассуждение Вычислительная мощность Скорость улучшения может быть быстрее。Изменения в этом соотношении по сути откроют множество новых возможностей.。
Здесь будет много возможностей для новых стартапов. Если вы — компания, достигшая определенного порога вычислительной мощности, вы можете проделать большую работу над базовыми инновациями в алгоритмах и даже совершить прорыв в базовых моделях. Это очень важно. Компании с относительно небольшими вычислительными мощностями также могут достичь лучших результатов в определенных областях посредством постобучения, что также откроет больше возможностей для продуктов и технологий. В целом, это изменение открыло много творческого пространства, связанного с предпринимательством.
Чжан Пэн:这次范式变化的核心существовать于,В «Законе масштабирования» мы решили, какие вещи нам следует масштабировать дальше, и увидели новый путь.Путь инноваций для будущего расширения, о котором вы только что упомянули.,Есть еще что изучить,а не контрактное состояние по умолчанию. Сегодня все трое очень воодушевлены изменениями, которые принес o1.,Но это также проблема, которая сейчас всех больше волнует.
Я хотел бы спросить г-на Чжу Цзюня, после того как обучение с подкреплением присоединится к этой системе и станет новой парадигмой, сможем ли мы увидеть четкий путь к обобщению этой способности? Потому что с текущей точки зрения локальная производительность o1 отличная, и улучшение очевидно, но ясен ли путь обобщения? Достаточно ли этой уверенности?
Чжу Цзюнь:Над этим вопросом стоит задуматься。o1существовать每个特定任务上取得突破后,Можно ли продвигать его для обобщения или более широкого улучшения возможностей? С точки зрения обучения с подкреплением,Технический путь реализации o1 не дает четкого указания, как это сделать.
Чжан Пэн:в отличие отChatGPTТакой открытый и прозрачный, когда он был запущен。
Чжу Цзюнь:Да,Но благодаря накоплению научных исследований и интерпретации их методов,Мы видим, что он использует некоторые методы.
Способ контроля данных во время обучения с подкреплением отличается от предыдущего контроля результатов. Каждый шаг мыслительного процесса должен быть помечен. Получить такого рода данные очень сложно. Для создания ценных данных нужны профессионалы. В то же время при практическом применении обучения с подкреплением, особенно в более общих и открытых сценариях, определить модель вознаграждения непросто. Например, в доказательстве теорем или программировании модель вознаграждения ясна, потому что существует правильный ответ.
Однако в таких областях, как автономное вождение, во многих сценариях трудно четко определить «хорошо» или «плохо». Вопрос не просто в том, правильно или неправильно. Иногда речь идет об оценке создаваемого контента, эстетики или других критериев. Каждый чувствует себя по-разному, поэтому в этом случае обобщение технологий сталкивается со многими проблемами. Как мы определяем модель вознаграждения? Как собираются соответствующие данные? Кроме того, как эффективно реализовать эти технологии.
Однако теперь мы прозрели, и все начали работать в этом направлении. В сочетании с более мощной инфраструктурой обобщение может оказаться быстрее, чем миграция предыдущего поколения AlphaGo в другие области. Теперь у нас есть лучшие симуляторы и даже включена сборка среды сборки AGI. Эти достижения в совокупности делают путь к результатам и улучшениям более доступным, чем когда-либо прежде. Это мой взгляд на проблему обобщения.
Чжан Пэн:现существовать还没有一个公开且明确的路径能保证完全实现泛化,Но в самом процессе есть много возможностей для исследования. Позвольте мне еще раз спросить Ян Жилиня.,Что вы думаете об этой ситуации? Для таких стартапов, как ваш,Это хорошо или плохо? когда ты увидишь эти изменения,Каково психическое состояние? Как бы вы проанализировали эту среду?
Ян Жилин:Это очень хорошая возможность。ты найдешь,Появились новые технические переменные и технические аспекты.,Эти изменения более или менее уже связаны с некоторыми из наших предыдущих материалов. теперь это становится темой,У нас есть много новых возможностей в рамках этой темы.
Учитель Чжу Цзюнь только что упомянул проблему обобщения. Кроме того, существуют некоторые базовые технические проблемы, которые не были полностью решены, поскольку нижний уровень включает в себя масштабирование обучения и умозаключений. В то же время возникнет много новых проблем в природе. в этом процессе.
Я чувствую, что эти свойства сегодня не полностью изучены, включая только что упомянутые проблемы контроля процесса. Некоторые галлюцинационные явления в процессе могут иметь большое влияние на эффект. Все это стоит изучить. Но если эти проблемы удастся решить, возможности ИИ поднимутся на новый уровень. Для нас эти технологические инновации могут создать некоторые прорывные возможности.
Чжан Пэн:Неопределенность — это хорошо,Наличие определенного направления, но неопределенного пути может быть преимуществом для стартапов.,В противном случае не было бы места для стартапов. Вернемся к Цзян Дасиню.,Три фактора, упомянутые Ян Жилином, а именно алгоритм, вычислительная мощность и данные, считаются ключевым треугольником в области ОИИ.,На этот раз похоже, что на уровне алгоритма произошли некоторые изменения парадигмы. Глядя на это с другой стороны,Вычислительная мощность Какая цепная реакция будет с данными??你能帮我们рассуждение一下吗?
Цзян Дасинь:алгоритм、Вычислительная Связь между мощностью и данными представляет собой железный треугольник.,Это не изменилось. Обучение с подкреплением действительно является серьезным изменением в алгоритмах.,Результаты определенны и весьма вероятны.,Неопределенность все еще существует.
Несомненно то, о чем только что упомянули эти двое. Что касается вывода, то требования к вычислениям возросли вдвое, а требования к чипам вывода также значительно возросли. Мы можем представить, что OpenAI использует для рассуждений чип H100, стоящий за o1, и каждый вопрос может занять более десяти или даже десятков секунд. Если мы хотим ускорить этот процесс, требования к производительности чипа вывода естественным образом возрастут.
Еще одна вещь, которая может произойти, это,Вычислительная мощность, необходимая для обучения на этапе обучения с подкреплением, не может быть меньше, чем для предварительного обучения.,Может быть, даже больше. Спрос на вычислительные мощности будет продолжать расти,В частности, может не быть верхнего предела объема данных, генерируемых на этапе обучения с подкреплением. мы слышали,OpenAI использовала десятки тысяч карт H100 при обучении модели этого типа.,Тренировался несколько месяцев,Обучение еще не завершено,Эта цена очень высока。Следовательно, если мы преследуем общую модель вывода, которую можно обобщить, а не модель обучения с подкреплением, разработанную для конкретного сценария, требуемая вычислительная мощность все равно будет очень велика.
Что касается основной модели, нам также необходимо подумать, продолжать ли масштабирование и увеличивать количество параметров, чтобы улучшить возможности рассуждения. Например, GPT-4 достиг триллионов параметров. Если параметры будут продолжать увеличиваться, предельная выгода будет постепенно уменьшаться. Но обучение с подкреплением может удвоить этот выигрыш. Можно ли дополнительно скорректировать общий выигрыш? Если этот вывод верен, то рост вычислительной мощности вернулся к квадратной размерности, а объем вычислений будет равен количеству параметров, умноженному на объем данных. Следовательно, независимо от того, идет ли речь о этапе вывода или об обучении, потребность в вычислительной мощности, вызванная обучением с подкреплением, будет продолжать расти.
Что касается данных, в обучении с подкреплением есть два основных типа данных: один — это небольшой объем искусственно сгенерированных ценных данных, а другой — массивные данные, сгенерированные машиной. Объем данных может быть очень большим, но качество данных не менее важно. Очень важно то, как вы структурируете алгоритм генерации данных и как используете мастер-модель.
Чжан Пэн:Только что все были правыo1Очень хороший анализ парадигмальных изменений, вызванных。Сегодня все трое — предприниматели,Развиваем и возглавляем команды в своих областях. Я хочу спросить Ян Жилина,Кими вызвал всеобщее внимание в этом году,Очень хорошо развит. Что вы думаете об этой волне изменений в ИИ?,Какая цепная реакция будет иметь место в отношении продуктов искусственного интеллекта в следующий раз? Как вы сами видите эти изменения? Как они произойдут?
Ян Жилин:это хороший вопрос。Мы все еще находимся на ранних стадиях развития отрасли.,Одной из особенностей является то, что доля высокотехнологичной продукции относительно велика. много раз,Основываясь на современном развитии технологий, вы будете,Максимизируйте свой потенциал. Поэтому я думаю, что этот вопрос очень важен. Нам необходимо адаптироваться к новым технологическим достижениям,Переосмыслите, что вы можете сделать с имеющимися у вас продуктами.
Текущие технологические разработки,Я думаю, есть несколько ключевых моментов。Во-первых, могут появиться новые возможности PMF (соответствие продукта рынку).这существовать于两个因素的平衡。
Первый фактор заключается в том, что задержка мышления Системы 2 увеличивается, что является негативным опытом для пользователей, поскольку все хотят быстрых результатов. Второй фактор заключается в том, что он обеспечивает лучшую производительность и может даже выполнять более сложные задачи.
поэтому,Процесс генерации нового PMF,是要существовать延迟增加带来的负面用户体验和更高质量的输出之间找到平衡点。Важно убедиться, что дополнительная ценность перевешивает потерю пользовательского опыта.существовать更高价值的场景,Особенно в сценариях производительности,Некоторые сценарии применения появятся первыми. Потому что в развлекательных сценариях,Пользователям может быть трудно принять такое увеличение задержки.,Это очень важное соображение.
В то же время, я думаю, изменятся и формы продукции.С изменением парадигмы мышления,Форма синхронных продуктов чата и чата в реальном времени также будет корректироваться в определенных пределах. Будущий ИИ — это не просто мышление в течение 20 или десятков секунд.,Это может потребовать вызова различных инструментов,Полные минуты и часы,Даже миссия дневного уровня. поэтому,Это может быть больше похоже на настоящего помощника,Помочь вам выполнить задачи шаг за шагом. Дизайн формы продукта также претерпит серьезные изменения.,Так что я думаю, что здесь есть большой простор для фантазии.
Чжан Пэн:мы только что говорили оo1изменения, вызванные,Также видим другие изменения в сфере AGI.,Например, пространственный интеллект. Сегодня мы также наблюдаем прогресс в области воплощенного интеллекта, такого как автономное вождение и роботы. Учитель Чжу Цзюнь,Что вы думаете о последних технологических достижениях в этих областях, связанных с искусственным интеллектом? Какое влияние они окажут на окончательное внедрение будущих продуктов или технологий в отрасли? Есть ли постановочные конспекты и наблюдения?
Чжу Цзюнь:大模型或者大规模预训练技术все еще代表了整个范式的变化。мы много обсуждали,Охватывает все: от языка до мультимодальности.,Затем к таким областям, как воплощенный интеллект и пространственный интеллект. на самом деле,Ключ по-прежнему заключается в том, как снабдить интеллектуального агента способностью взаимодействовать и учиться, что является неизбежным направлением развития разведки.Принятие решений и взаимодействие являются ключевыми возможностями разведки.,Мы постоянно принимаем решения,Мы всегда сталкиваемся с неизвестной и открытой средой. поэтому,На пути разумного развития,Все усердно работают в этом направлении.
Все эти достижения, включая o1, генерацию видео, 3D и другие технологии, имеют два четких направления. Во-первых, это ориентированный на потребителя цифровой контент, который привлекает людей, рассказывает истории и является интерактивным. Это, безусловно, очень важно, когда речь идет о цифровом контенте. Во-вторых, это повышение производительности физического мира и физического мира не только для отображения красивого контента, но и для интеграции с физическим миром.
Итак, лучшая комбинация — это роботы. Было много успешных примеров этого, когда мы видим, как роботы обобщают свои способности с помощью парадигм предварительного обучения. Например, мы тестировали четвероногого робота в лаборатории. Раньше требовалась ручная настройка параметров в различных средах. Теперь синтетические данные генерируются с помощью среды моделирования для крупномасштабного обучения. Обученный робот может адаптироваться к различным средам. Это как получить новый мозг.
Это всего лишь предварительный пример, и все также обращают внимание на более сложные вопросы контроля и принятия решений, такие как пространственный интеллект. Этап AGI L3 — это этап агента. После прохождения этапов L1 и L2 следующим шагом является этап L3, который позволяет роботу лучше выполнять планирование рассуждений и эффективно взаимодействовать с окружающей средой. В будущем мы увидим роботов, способных принимать сложные инструкции, выполнять сложные задачи и выполнять задачи с помощью встроенных цепочек мышления и процесса обучения. В то время интеллектуальные возможности будут значительно улучшены.
Чжан Пэн:Я вдруг подумал о вопросе,как стартап,Специально для таких компаний, как ваша, которым необходимо вложить много денег в разработку базовых моделей.,Что вы думаете о последних 18 месяцах?,Особенно появление o1,Изменилось ли это ваше мышление? Будет ли в будущем больше места для стартапов?,Есть ли больше возможностей? Как меняется ваш менталитет?,Что вы думаете о будущем направлении технологического предпринимательства?
Цзян Дасинь:С двух точек зрения,Одно из них — инновации,Появление обучения с подкреплением действительно отличается от предыдущих парадигм. В предыдущей парадигме GPT не было ничего особенно нового.,Но o1 все еще находится на начальной стадии. Как только что упомянули двое,Как объединить обучение с подкреплением с большими моделями и добиться обобщения,Это вопрос, который стоит изучить. Когда мы делаем путь поиска,Требуется ли ручное вмешательство, чтобы найти лучший путь? Откуда взялось название? Как найти ответ? Это новые и неизвестные области,Необходимы дальнейшие исследования. Я верю, что в ближайшее время,Эти исследования ускорят,Определенно будет больше возможностей для инноваций.
с другой стороны,О проблемах вычислительной мощности,Я упоминал об этом раньше,Будь то конец вывода или конец обучения,Необходимая нам вычислительная мощность все еще очень велика,Особенно, когда мы преследуем общие и обобщаемые модели рассуждения.,Требуемая вычислительная мощность не мала. Как мы часто шутим,«Карта ранит чувства. Без карты нет эмоций. Использование карты приводит к потере чувств». Но если наша цель — ОИИ, то, чего бы это ни стоило, мы должны упорствовать.
Чжан Пэн:Раньше мы думали,Если по оригиналуScaling Ло продолжился, и лишь несколько игроков смогли принять участие. Итак, был ли снижен порог ресурса? Будет ли продолжаться конкуренция за вычислительную мощность? Как интегрировать ресурсы, чтобы сделать вычисления более эффективными?
Цзян Дасинь:Я думаю, что это можно разделить на два разных типа инноваций.。Одна из них — базовая модель, цель — перейти к AGI, что требует очень больших инвестиций.Мы видим, что зарубежные гиганты имеют бюджетные планы в сотни миллиардов долларов каждый год.。С другой стороны, еще есть много возможностей для инноваций, ориентированных на уровень приложений.GPT-4所展示的智能已经существовать处理数字世界和物理世界的问题上取得了进展。现существовать,o1 обобщает обучение с подкреплением на более высокий уровень,Как сказал Ян Жилин,его верхний предел становится выше,поэтому,Есть еще много возможностей для инноваций.
Чжан Пэн:我再问问Ян Жилин,В настоящее время у вас есть продукты C-end,В последнее время многие инвесторы обращают внимание на DAU, уровень удержания и другие показатели.,решить, стоит ли инвестировать в компанию. Если вы стоите с точки зрения инвестора,Как инвестор с техническим образованием, разбирающийся в искусственном интеллекте,На какие данные вы обращаете внимание, принимая инвестиционные решения?
Ян Жилин:это хороший вопрос。первый,Такие данные, как DAU и коэффициент удержания, безусловно, являются важными показателями.,Но я рассмотрю это на нескольких уровнях。Первый уровень – является ли продукт ценным.Соответствует ли он реальным потребностям пользователей。Это то же самое, чтоAIне имеющий отношения,Это основной атрибут самого продукта.。например Уровень удержания — главный показатель。Второй уровень больше связан с ИИ, который должен быть не только ценным, но и иметь дополнительную ценность.По сравнению с существующими на рынкеAIпродукт,Или как универсальный ChatGPT,Ваш продукт должен приносить дополнительную ценность,Предоставляет то, что ChatGPT не может сделать,Или функция, реализация которой имеет неудачный опыт,Это дополнительная ценность. Эта дополнительная ценность может возникать из-за различий во взаимодействиях.,Или другой вход,Это также могут быть соответствующие различные ресурсы, стоящие за。поэтому,Создание дополнительной ценности таким образом очень важно.
В-третьих, должна быть не только дополнительная стоимость, но и размер рынка должен увеличиваться и увеличиваться по мере развития технологий, а не постепенно сокращаться.如果你专门研究某个非常细分поле,В будущем могут возникнуть риски снижения спроса. Но если теперь вы можете создать определенный PMF (соответствие продукта рынку),И есть потенциал для расширения на более крупный рынок.,Тогда это хорошая возможность для предпринимательства.
Чжан Пэн:Похоже, данные нужно посмотреть.,но перед данными,Логика продукта должна быть установлена.,Если логика верна,Данные могут доказать, что в этот продукт стоит инвестировать.
Ян Жилин:верно。
Чжан Пэн:у меня есть еще один вопрос,Хотя всегда трудно предсказать будущее,но я хочу знать,Какие изменения вы ожидаете увидеть в ближайшие 18 месяцев? Как вы думаете, какие интересные изменения произойдут?
Чжу Цзюнь:现существовать的技术进展速度很快,Зачастую наши прогнозы о будущем оказываются слишком консервативными. вернемся к твоему вопросу,Я ожидаю, что прогресс в разработке агентов L3 будет очень впечатляющим в течение следующих 18 месяцев.например Создание и генерация моделей мира、Слияние виртуального и реального,Особенно улучшение способности принимать решения в конкретных сценариях. Он будет использовать рассуждение, восприятие и другие способности для достижения прорывов. в то же время,最近我существовать分析L4Соответствующие научные открытия и инновационные возможности。Мы обнаружили, что многие возможности разбросаны по разным углам, и до сих пор отсутствует система, которая могла бы интегрировать эти возможности.
Если он будет более радикальным, я думаю, что L4 также добьется значительного прогресса в ближайшие 18 месяцев, особенно в области научных открытий и инноваций.L4Также включает в себя творческое выражение,Такие как художественное творчество, создание видео и т. д.,Они могут усилить воображение каждого,Помогите нам воплотить абстрактные идеи в конкретику.。поэтому,Я думаю, что в будущем появятся некоторые признаки прорыва в L3 и L4.
Чжан Пэн:до конца года,Какого прогресса вы ожидаете?,Можете ли вы сообщить об этом заранее?
Чжу Цзюнь:до конца года,Я надеюсь, что наша видеомодель станет более эффективной и управляемой для всех. Эффективность означает снижение затрат на вычислительную мощность.,Возможность обслуживать больше пользователей. Управляемость означает, что пользователи могут продолжать выражать свое творчество;,взаимодействовать несколько раз,Продолжайте вдохновлять себя,Конечная цель — добиться генерации в реальном времени. Таким образом,Пользовательский опыт и объем пользователей будут значительно улучшены.,Это то направление, на котором я хочу сосредоточиться в этом году.。В долгосрочной перспективе в ближайшие 18 месяцев мы войдем в сценарий виртуальной и реальной интеграции.
Чжан Пэн:Ян Жилин呢?твое будущее18месяцы,Или есть ли какой-то прогресс, которым вы можете поделиться в ближайшие три месяца?
Ян Жилин:Следующая важная веха – открытое обучение с подкреплением,Умение взаимодействовать с пользователями по продукту.,Выполняйте задания и развивайтесь в реальных условиях.o1В определенной степени это доказывает определенность этого направления.,Это единственная серьезная проблема, остающаяся на пути к AGI.,Этот вопрос очень важен.
Чжан Пэн:ты с нетерпением ждешь будущего18месяцы内,Можно ли добиться явного прорыва и прогресса в этом вопросе?
Ян Жилин:Да,18 месяцев – это достаточно долго в сфере ИИ,Будет большой прогресс.
Цзян Дасинь: Я очень жду дальнейшего обобщения обучения с подкреплением.Другое направление – поле зрения,Хотя мы ждали уже давно,Но в создании видео по-прежнему существуют большие проблемы. до сих пор,Визуальное понимание и генеративные модели по-прежнему разделены. После GPT-4 решено множество проблем,Только видео генерировать нельзя. Если бы мы могли решить проблему интеграции генерации и понимания видео,Вы можете построить полную мультимодальную модель мира.,Помогите нам создавать очень длинные видео.,И решить текущие технические трудности Соры. также,Эта технология также может служить мозгом робота,Помогите агентам лучше исследовать физический мир.,Это то, чего я очень жду.
Тенсент Технологии
, вроде 56