Примерное время чтения: 5 минут.
Рекомендации по чтению: Эта статья представляет собой рекомендательную статью для веб-сайта. Рекомендуется сохранить ее и медленно просматривать в свободное время.
Решите болевые точки: чтобы улучшить возможности анализа и анализа данных, вам необходимо постоянно исследовать работу, но что делать, если она не задействована в работе? Это лучший способ использовать общедоступные наборы данных и практиковать методологии и модели в свободное время. Где я могу найти общедоступные данные? Возможно, вы сможете использовать эти URL-адреса!
00
Предисловие
Сяо Чармандер обобщил 10 широко используемых общедоступных наборов данных для всех, охватывая три основных направления, в том числе: национальная официальная статистика, статистика сторонних агентств и данные о конкуренции в области науки о данных.
01
официальная национальная статистика
Веб-сайт 1: Национальное бюро статистики «Общий индекс: 3 звезды».
http://www.stats.gov.cn/tjsj/
В основном он охватывает важные национальные макроэкономические, социальные данные, данные о средствах к существованию людей и другие важные данные.
Веб-сайт 2: Китайский интернет-информационный центр CNNIC «Общий индекс: 3 звезды».
http://www.cnnic.cn/
В основном он охватывает данные, связанные с развитием Интернета в Китае, и является более авторитетным, чем сторонние платформы.
02
Статистика сторонних агентств
Веб-сайт 3: Индекс Baidu «Общий индекс: 5 звезд»
https://index.baidu.com/v2/index.html#/
Данные о поведении пользователей на основе Baidu имеют широкий охват и могут быть получены в виде API, который можно использовать для анализа популярности в отрасли и т. д.
Веб-сайт 4: Данные iResearch «Общий индекс: 4 звезды»
https://data.iresearch.com.cn/home.shtml
Помимо регулярной публикации интернет-отчетов, на веб-сайте также представлены сегментированные отраслевые данные, которые можно использовать в качестве дополнения к индексу Baidu.
Веб-сайт 5: Информационная сеть Интернет-данных 199IT «Общий индекс: 4 звезды»
http://www.199it.com/
В дополнение к отчетам, связанным с Интернетом, он также имеет «Навигацию по большим данным» для запроса данных о тенденциях в популярных направлениях.
Веб-сайт 6: SouShu.com «Часто используемый индекс: 3 звезды».
http://www.soshoo.com/index.do
Распространение по отрасли относительно широкое и может использоваться в качестве дополнения к данным Национального бюро статистики.
Веб-сайт 7: Зал данных «Общий индекс: 3 звезды»
http://www.datatang.com/
В основном он охватывает данные обучения искусственного интеллекта. Студенты, изучающие алгоритмы, могут сосредоточиться на этом.
03
данные соревнований по науке о данных
Веб-сайт 8: Kaggle «Общий индекс: 5 звезд»
https://www.kaggle.com/
Kaggle — это онлайн-платформа для соревнований по интеллектуальному анализу данных, основанная в 2010 году. Будучи местом сбора энтузиастов интеллектуального анализа данных, вы можете не только улучшить свои алгоритмы и возможности кодирования посредством соревнований, но и получить бонусы, если вам повезет. Кроме того, на веб-сайте имеется множество данных из открытых источников, которые можно использовать для ежедневного обучения моделей, например, знакомые «данные по прогнозированию выживаемости Титаника» и так далее.
Веб-сайт 9: Али Тяньчи «Общий индекс: 5 звезд»
Как и Kaggle, он поддерживается платформой Alibaba для соревнований по большим данным, а также является местом сбора отечественных гигантов алгоритмов. Данные с открытым исходным кодом можно напрямую загружать и применять.
Веб-сайт 10: DataCastle «Общий индекс: 5 звезд»
https://www.datacastle.cn/index.html
Ведущая китайская платформа для соревнований по науке о данных похожа на Kaggle и Tianchi. Существует множество данных из открытых источников, которые можно загрузить и использовать в качестве образцов для упражнений по интеллектуальному анализу данных.
Выше приведен обмен контентом в этом выпуске. Программирование - это непросто. Если вы считаете, что это вам немного полезно, пожалуйста, «подписывайтесь», «лайкайте» и «делитесь». Я продолжу выпускать высококачественный «оригинальный контент» для всех ~~