На вершине волны искусственного интеллекта,Модель под названием SQLCoder-7b была шокирующе опубликована на Huggingface.,Он не только находится на одном уровне с GPT-4 в генерации текста в SQL,,Компания также добилась потрясающих прорывов в скорости и точности обработки данных.,Есть даже импульс превзойти GPT-4.
Благодаря фокусу на Zhihu было перенесено больше контента на:https://www.zhihu.com/people/dlimeng
Однако что вызывает у людей любопытство, так это то, как именно эта модель достигает такого скачка? В чем именно заключается его секретное оружие?
Вы когда-нибудь запутались в понимании данных в базе данных SQL? Теперь с моделями SQLCoder-7B-2 и SQLCoder-70B-Alpha эти проблемы будут решены. Эти два мощных инструмента предназначены для нетехнических пользователей и позволяют им легко анализировать содержимое базы данных, не требуя глубоких знаний.
Примечательно, что SQLCoder-70B-Alpha превосходит все распространенные модели, включая GPT-4, по возможностям преобразования текста в SQL. Это означает, что он может более точно понять ваши потребности и генерировать соответствующие запросы SQL. В то же время SQLCoder-7B-2 также является лидером, которого нельзя игнорировать. Он хорошо справляется с созданием естественного языка для SQL.
Однако обратите внимание, что эти модели доступны только пользователям с доступом только для чтения. Чтобы обеспечить безопасность данных, они не обучены реагировать на вредоносные запросы на запись.
Дух открытого исходного кода является важной движущей силой технологического развития. Модели SQLCoder2 и SQLCoder-7B стали общедоступными, что позволило большему количеству людей воспользоваться их возможностями. Среди них SQLCoder2 внес значительные улучшения на основе исходного SQLCoder, а SQLCoder-7B дебютирует как модель с 7B параметрами, и ее производительность сравнима с предыдущей.
За всем этим стоит глубокое понимание командой разработчиков отзывов пользователей и постоянное совершенствование. Они обнаружили, что исходный SQLCoder имел трудности с обработкой функций даты и времени и иногда генерировал неправильные имена столбцов или таблиц. В то же время существует огромный спрос со стороны сообщества на модели, которые могут работать на небольших графических процессорах. В результате, как того требует время, появились SQLCoder2 и SQLCoder-7B. Они не только решают эти проблемы, но и более подходят для производственных сред.
Как SQLCoder оценивает высокоточную модель ИИ?
SQLCoder классифицирует каждый сгенерированный вопрос на 6 категорий. В следующей таблице показана доля правильных ответов для каждой модели в каждой категории вопросов.
В океане данных SQL — это рыболовная сеть. Надежен ли SQL, сгенерированный LLM? SQL-Eval судить!
SQL-Eval, как видно из его названия, его миссия: оценивать правильность операторов SQL, генерируемых LLM. В процессе разработки разработчики часто сталкиваются с дилеммой: как определить, является ли SQL-запрос «правильным»? В конце концов, может быть несколько правильных способов написания SQL для одной и той же задачи.
Приведите пример,Если вы хотите найти последних 10 пользователей из Торонто,Оба следующих запроса верны:
1. Запрос А собирает идентификатор пользователя, имя пользователя и время создания;
2. Запрос Б выбирает идентификатор пользователя, полное имя и время создания.
Выявление метода оценки
1. Разверните комбинации столбцов стандартного запроса.
2. Запустите запрос для каждой комбинации и получите кадр данных результата.
3. Сравните результаты созданного запроса со стандартными результатами. Если они совпадают, то они верны.
SQL-Eval учитывает псевдонимы столбцов, дополнительные столбцы и другие варианты, чтобы обеспечить точную оценку. Его исходный код выложен на GitHub и ждет вас!
https://github.com/defog-ai/sql-eval
Подскажите формат слова:
### Task
Generate a SQL query to answer [QUESTION]{user_question}[/QUESTION]
### Database Schema
The query will run on a database with the following schema:
{table_metadata_string_DDL_statements}
### Answer
Given the database schema, here is the SQL query that [QUESTION]{user_question}[/QUESTION]
[SQL]
😎 Пример:https://colab.research.google.com/drive/1z4rmOEiFkxkMiecAWeTUlPl0OmKgfEu7
💻 Демо:https://defog.ai/sqlcoder-demo/
🤗 Модель:https://huggingface.co/defog/sqlcoder-7b-2
🤖 Github:https://github.com/defog-ai/sqlcoder/
Появление SQLCoder-7b — это не только технологический скачок, но и важный шаг в демократизации анализа данных.
Добро пожаловать, подписывайтесь и оставляйте сообщения для общения!
Я Ли Менглиао AI, независимый разработчик программного обеспечения с открытым исходным кодом и автор SolidUI. Я очень интересуюсь новыми технологиями и специализируюсь на области искусственного интеллекта и данных. Если вас интересует содержание моей статьи, пожалуйста, помогите подписаться на нее. ставь лайк и собирай Спасибо!