Учебное пособие Pandas на китайском языке, второе издание: 1–5
Учебное пособие Pandas на китайском языке, второе издание: 1–5

1. Панды ианализ данных

Добро пожаловать в Панды Учебное пособие»! существуют В этой книге мы, Воля, проводим соответствующее наше исследование. Pandas путешествие, это способ Python Язык программирования из анализа с открытым исходным кодом данныхбиблиотека. pandas Библиотекапредоставилиспользовать Python Создавайте высокопроизводительные и простые в использовании инструменты структурного анализа. pandas из языков статистического программирования R принести в Python много преимуществ,Специальный дафрейм данныхобъекти R Сумка(Напримерplyrиreshape2),и Воляони размещаютсуществовать Можносуществоватьвнутреннийиспользоватьиз Python в библиотеке.

В этой первой главе мы потратим некоторое время на понимание Pandas и как он адаптируется к большому анализу данныхизнуждаться。 Это сделает Pandas Заинтересованные читатели чувствуют, что они существуют, более широкий анализ данныесерединаизстатуса, не обязательно полностью сосредотачиваясь наиспользовать Pandas подробности. Цель состоит в том, чтобы научиться Pandas В то же время вы также понимаете, почему в хранилище существуют эти функции для поддержки выполнения анализа. данных Задача。

Итак, давайте войдём. В этой главе мы рассмотрим:

  • Панды да что,почему был создан,что это тебе принесет
  • Pandas ианализ данныхинаука о данныхмеждуизсвязь
  • анализ данныхс участиемизпроцесски Pandas Как поддержать
  • данныеи Анализ Общие понятия
  • анализ данныхи Статистический анализиз Основные понятия
  • тип данные и их пары Pandas из Применимость
  • Вы можете и pandas Вместеиспользоватьиз Python из Другие Библиотеки в экосистеме

Введение в Панды

pandas это Python Библиотека, содержащая расширенные структуры данных и инструменты, созданные для помощи Python Программисты выполняют мощный анализ данных。 Pandas изконечная цельизда Помогите вам быстро обнаружитьданныесерединаизинформация,А Воляинформация определяется как основной смысл.

Уэс Мак Кинни начал разработку Pandas в 2008 году. Он был открыт в 2009 году. Pandas в настоящее время поддерживается и активно развивается различными организациями и участниками.

оригинальный дизайн Pandas приезжать, чтобы рассмотреть финансовые вопросы, особенно если это связано с данными временных операции рядов и способность работать с историческими запасами. Существует множество проблем, связанных с обработкой финансовой информации, вот некоторые из них:

  • Указывает на изменения с течением времени из данных безопасности.,Напримерзапасцена
  • существовать одновременно с несколькими потоками данных из метрик
  • Определить взаимосвязь между двумя или несколькими потоками данных (Актуальность)
  • Воля время и дата представлены в виде потока сущностей
  • Период выборки данных преобразования вверх или вниз

Чтобы сделать это,Нужен инструмент,Позволяет нам выполнять поиск по одномерным и многомерным данным.,индекс,Чистый и опрятный,пластическая хирургия,слить,кусочек и выполнить различные анализы.,Сумказаключенный вдольданныеавтоматическое выравниваниеиз Чужакданные。 Общий набор индексных тегов. Это Pandas Там, где он родился, он имеет множество полезных и мощных функций, таких как:

  • Быстро и эффективноизSeriesиDataFrameобъект,проходитьинтегрированныйиндексруководить Обработка данных
  • использоватьиндекси Этикеткаруководитьразумныйданные Выравнивание
  • Интегрированная обработка недостающих данных
  • Инструмент для конвертации хаотичных данных Воли (точных) в упорядоченные данные.
  • Встроенные инструменты,Использовать Всуществовать структуру данных и файл памяти,данные Библиотекаи Web Чтение и запись данных между службами
  • иметь дело скмного распространенных форматов(Например CSV,Excel,HDF5 и JSON) возможность хранения
  • Гибкое изменение формы и перспективный набор данных
  • Индекс необычное подмножество
  • Можно получить изданные вставить и Удалить в структуру столбец,к добиться изменения размера
  • Мощный инструмент группировки, агрегирования или преобразования данных.,Иди направоданные Установить приложение разделения выполненияслить
  • данныенаборизвысокая производительностьслитьисоединять
  • Иерархический индекс помогает Всуществовать низкоразмерную структуру данных для представления многомерных данных.
  • данные временных рядовиз Обширный функционал,Включает диапазон дат, преобразование частоты.,Статистика скользящего окна,подвижное окно линейное начало,Сдвиг даты и задержка
  • проходить Cython или C писатьиззакрыватьключкодпутьвернопроизводительностьруководить Понятновысокийоптимизация

Мощный набор функций, а также Python и Python Бесшовная интеграция других инструментов в экосистему позволила Pandas Широко используется во многих областях. Он широко используется в академических и деловых областях, включая финансы, нейронауки, экономику, статистику, рекламу и сетевой анализ. это стало наукой о Домашняя страница данных представляет данные, один из наиболее предпочтительных инструментов для выполнения операций и анализа.

В течение долгого времени Питон существовать Обработка данныхи Подготовить всегда было исключением,носуществоватьанализ данныхи Моделированиеаспектноисключение。 pandas помогает восполнить этот пробел, позволяя вам Python выполнить весь анализ рабочий процесс обработки данных без необходимости переключаться на более конкретный домен В из языка (например, Р). Это очень важно, потому что знакомство Python людей, чем R (дополнительный пакет статистики), полученный R из многих выражений данных и рабочих функций, полностью сохраняя при этом чрезвычайно богатый Python в экосистеме.

и IPython,Блокнот Юпитераи множество других Библиотек вместе взятых и множество других инструментов по сравнению с Всуществовать. Python в исполнении анализ данныеизсредасуществовать превосходит других с точки зрения производительности, продуктивности и возможностей совместной работы. Это привело к широкому распространению среди пользователей во многих отраслях. Pandas。

Обработка данных, анализ, наука и панды

Мы живем в мире, где каждый день создается и хранится огромное количество информации. Эти данные поступают от большого количества информационных систем, устройств и датчиков. Почти все, что вы делаете, и проекты, которые вы для этого используете, генерируют данные, которые можно зафиксировать или зафиксировать.

Это во многом подтверждается повсеместным характером услуг, подключенных к сети, и массовым увеличением средств хранения данных. Это в сочетании с постоянным снижением затрат на хранение.,сделать захвати Хранение даже самого тривиальногоизданныевсе становятся эффективными。

Это привело к накоплению большого количества данных и Подготовлению к доступу. но,Данные распространяются по всему киберпространству.,на самом деленельзя назватьинформация。 Часто это коллекция записей о событиях, будь то финансовые записи, ваше взаимодействие с социальными сетями или персональный монитор здоровья, который отслеживает ваше сердцебиение в течение дня. Эти данные хранятся в различных форматах, в разбросанных местах, и их необработанный характер действительно дает много информации.

Логически весь процесс можно разделить на три основные предметные области:

  • Обработка данных
  • анализ данных
  • наука о данных

Эти три дисциплины могут во многом пересекаться. Где заканчивается одна сторона и начинается другая, остается открытым для интерпретации. Для целей этой книги мы дадим этому определение в следующих разделах.

Обработка данных

Данные распространяются по всей планете. Он хранится в разных форматах. Уровень его качества сильно варьируется. Следовательно, необходимо собрать существующие вместе с ВВоляданными и преобразовать их в пригодные для использования формы принятия решений из инструментов и процессов. Для этого требуются оперативные данные для анализа. Подготовить инструмент необходимо для выполнения множества различных задач и функций. К обязательным функциям этого инструмента относятся:

  • Повторное использование и совместное использование и программируемость
  • Данные доступа к внешнему источнику
  • существоватьлокальное хранилищеданные
  • индексданныебыть эффективным Поиск
  • в соответствии с выравниванием атрибутов в разных коллекциях изданные
  • слитьдругойнаборобъединитьсерединаизданные
  • Конвертировать Воляданные в другие представления
  • Удаляет остатки из данных
  • Эффективно справляйтесь с плохими данными
  • Воляданные группировки приезжать универсальная корзина
  • Агрегация имеет схожие характеристики: изданные
  • Применить функцию для вычисления значения или выполнения преобразования
  • Запросикусочек Приходитьисследоватьобщий
  • Реорганизовать в другие формы
  • Для разных типов изданные Моделирование,Напримеркатегория,непрерывный,Дискретныйивремяпоследовательность
  • Воляданные передискретизации приезжают на разных частотах

житьсуществоватьмного Обработка данныхинструмент。 Каждый проект в этом списке имеет различную поддержку, методы развертывания и пользовательский опыт. Эти инструменты включают реляционные базы данных (SQL Сервер, Oracle), электронные таблицы (Excel), системы обработки событий (например. Spark), а также более общие инструменты, такие как R и Pandas)。

анализ данных

анализ данныхдаотданныесоздавать смыслизпроцесс。 иметь количественный смыслизданныеобычно называетсяинформация。 анализ данныхдапроходитьсоздаватьданные Модельиматематика Модель Приходитьотданныесерединасоздаватьинформацияизпроцесс。 Его операции часто пересекаются, и различие между ними не всегда четкое. много Обработка инструмент данных также включает функцию анализа и анализа данныхинструментв целомнестидля Обработка данных Функция。

наука о данных

наука о данныхдаиспользоватьстатистикаианализ данныхпроцесс Приходить ПонятноразвязатьданныесерединаФеноменизпроцесс。 наука о Данные обычно начинаются с информации, а затем переходят к более сложному анализу информации. Эти области охватывают многие области, такие как математика, статистика, информатика, компьютерные науки, машинное обучение,Классификация,кластерный анализ,данныекопать,данные Библиотекаи Визуализация。 наука о данныхдамеждисциплинарныйиз。 Его подход к анализу предметной области часто сильно отличается и зависит от предметной области.

Для чего подходят Панды?

Pandas первыйсуществовать Обработка Отличная производительность в данных. Книга Воляиспользовать Pandas Соответствует всем требованиям, перечисленным ранее. Это Pandas Ядро также находится в центре внимания этой книги.

Стоит отметить, что у Pandas есть конкретная цель дизайна: подчеркнуть данные.

но Pandas предоставляет анализ выполнения данныеиз Множество функций. Эти функции обычно вращаются вокруг Описательная статистикаифинансовые потребностииз Функция(Например Актуальность)。

Поэтому панды сам не данаука о данныхинструмент Сумка。 Это скорее инструмент манипуляции с некоторыми аналитическими возможностями. Pandas Явно воля комплекс из статистики, финансов и других видов анализа оставлена ​​на усмотрение других. Python библиотека, например SciPy, NumPy, scikit-learn и зависимости от библиотеки Graphics, например matplotlib и ggvis использовать Вданные Визуализация。

Этот фокус на самом деле Pandas относительно R и другие сильные стороны других языков, потому что Pandas Приложения могут использовать преимущества Python Сообщество существует в других местах. Уже создано и протестировано из мощного Python Обширная сеть фреймворков.

анализ данныхпроцесс

Основная цель этой книги — научить вас делать это тщательно. Pandas манипулировать данными. но есть и второстепенная, возможно, не менее важная цель, дашоу. Pandas Как адаптироваться к анализу данныеразделение/наука Домсуществовать в повседневной жизни из процесса.

Шаги, необходимые для анализа данных, описаны на веб-сайте Pandas:

  • четкие и чистые данные
  • анализировать/Моделирование
  • Организовать в форме, удобной для общения.

Этот маленький списокэто очень ХОРОШО, исходное определение,но он не может охватить весь объем процесса и создать Pandas, используя множество реализованных функций. Следующее содержание Воля расширяет этот процесс.,И задать рамки всего пути.

процесс

предложенныйизпроцесс Воляназываетсяпоток данных,А существование представлено на картинке ниже:

Процесс устанавливает структуру, в которой В определяет логические шаги, которые необходимо предпринять при работе с данными. Теперь давайте кратко рассмотрим каждый этап процесса производства, использования и использования. Pandas изанализ участник данных Воля выполняет некоторые задания.

Важно понимать, что это не чисто линейный процесс. Лучше всего это делать интерактивно/гибко/итеративно.

Концепция

Первым шагом в решении любой проблемы с данными является определение проблемы, которую необходимо решить. этот СразудаКонцепция,это подсказывает, что мы хотим сделатьидоказыватьизиметь значениеиз Концепция。 Концепция обычно включает в себя предположения о доступных для принятия обоснованных решениях и шаблонах.

Эти решения обычно принимаются в масштабах всего предприятия.,носуществовать Другие предметы(Напримернаукаи Исследовать)серединатакжедатаким образом。 Сейчас в тренде понимание операций бизнеса, поскольку на понимании данных часто можно заработать много денег.

но,Что мы обычно хотим сделатьиз Решать? Вот ответы на несколько часто задаваемых вопросов:

  • Почему что-то происходит?
  • Можем ли мы киспользовать исторические данные, предсказать будущее?
  • Как можно оптимизировать операции в будущем?

Этот список ни в коем случае не является исчерпывающим, но он охватывает значительный процент причин, по которым кто-либо может предпринять эти усилия. Чтобы получить ответы на эти вопросы, необходимо собрать и разобраться в связанных с ними вопросах. Это включает в себя определение данных, подлежащих изучению, преимуществ исследования, способа получения данных, критериев успеха и, в конечном итоге, способа предоставления информации.

Pandas Он сам по себе не предоставляет вспомогательных инструментов Концепции. но Как только вы освоите использование Pandas Благодаря знаниям и навыкам, вы естественным образом поймете, куда ездить. Pandas Как Воля может помочь вам предложить Идею. Потому что у вас есть мощный инструмент, с помощью которого можно построить множество сложных гипотез.

Поиск

Если у вас появилась идея, вам нужно найти данные, чтобы попытаться подтвердить свою гипотезу. Эти данные могут поступать изнутри организации или от внешних поставщиков данных. Данные обычно доступны в виде заархивированных данных, а также доступны в живом виде (хотя живая обработка Известный своими инструментами обработки данных Pandas)。

Даже если они получены из источника данных, который вы создаете, или внутри вашей организации, данные часто бывают очень необработанными. Необработанные данные означают, что данные могут быть беспорядочными, иметь разные форматы и быть ошибочными; относительноподдерживаю тебяизанализировать,Это может быть неполным,Требуется ручное расширение.

В мире много бесплатных данных. Многие данные не бесплатны и на самом деле стоят больших денег. Некоторые из них доступны бесплатно через общедоступные API, другие доступны по подписке. Данные, за которые вы платите, обычно чище, но это не всегда так.

В обоих случаях Панды Все они предоставляют набор мощных и простых инструментов Виспользовать для Вот различных источников Поисковых данных, и эти данные могут иметь различные форматы. pandas Это также позволяет нам не только Поискданные, но и кпроходить. pandas Структуры данных обеспечивают исходную структуру ваших данных без необходимости вручную создавать сложное кодирование, которое может потребоваться другим инструментам или языкам программирования.

Подготовить

существовать Подготовитьпроцесссередина,уже Подготовить Так оригинальноданныекдляисследовать。 Подготовить работу обычно это Нет очень интересного процесса. Обычно при покупке данных изданных возникают различные проблемы, связанные с качеством. Вы можете потратить много времени на решение этих проблем с качеством, что обычно занимает очень мало времени.

Почему? Ну, причин много:

  • данные просто не верны
  • Отсутствует часть набора данных
  • Unableuse подходит для вашего анализа показателей для выражения данных.
  • данные Формат неудобен для анализа
  • данныеиз Уровень детализации не подходит для вашего анализа
  • И Нет, все обязательные поля заполнены. Можно получить из одного источника.
  • данныеизменяется в зависимости от провайдера

Подготовитьпроцесс направлен на решение этих проблем. Pandas для Подготовитьданные(обычно называетсяаккуратныйданные)предоставилмногоудобныйвыгодаизинструмент。 Эти функции включают обработку отсутствующих данных, преобразование типа данные, использование преобразования формата, изменение частоты измерений, воля из нескольких групп данных из данных соединений, отображение/преобразование символов воля в общее представление и группировка данных воля из интеллектуальных методов. Мы углубимся во все это.

исследовать

Обдумывание предполагает возможность интерактивно нарезать кусочки данных,к Постарайтесь узнать это быстро. Обдумывание может включать в себя различные задачи,Например:

  • Проверьте взаимосвязь между переменнойиз
  • Определить способ распространения данныхиз
  • Найдите и исключите выбросы
  • Создать быстрый просмотр Предварительный просмотр
  • Быстро создавайте новые изданные представления или модели для обеспечения более постоянного из Моделированияпроцесса.

исследоватьда Pandas главное преимущество. Хотя Доступно киспользоватьбольшоймногоматематический язык программированияруководитьисследовать,но Каждый язык имеет свойизцеремонияуровень – существования Сколько Неисследованной секс-работы необходимо выполнить, прежде чем вы сможете это выяснить.

Когда IPython и/или Блокнот ЮпитераизЦикл чтения-оценки-печатиREPL)природа Вместеиспользоватьчас,Pandas Создадим небольшой церемонияизис по охране окружающей среды. pandas Выразительность синтаксиса позволяет кратко описывать сложные структуры манипулирования данными, а результаты каждой операции, выполняемой с данными, немедленно представляются для проверки. Это позволяет вам быстро определить достоверность того, что вы только что выполнили, без необходимости перекомпиляции и полного повторного запуска программы.

Моделирование

Стадия существования Моделирование, вы Воляисследоватьпроцессосноватьизнайти Формализация — это четкое объяснение шагов и структуры данных, необходимых для достижения желаемого значения включения в приезжающие. ЭтоМодель,да Две структуры данных к&от исходных данныхприезжают вашу информацию и вывод из комбинации шагов кода.

Моделированиепроцессда Итерироватьиз,существоватьэтотпроцесссередина,Вы можете просмотреть данные, чтобы выбрать изпеременные, поддерживающие анализ.,Организация переменнойк для процесса анализа входных данных,осуществлять Модельиправильный Конечно Модельоригинальная гипотезаизуровень поддержки。 Он может включать структурирование и формализацию, но также может сочетать в себе методы из различных областей анализа, таких как (но не ограничиваясь ими) статистика, обучение Исследование операций.

Для этого Панды Предоставляет широкий набор инструментов. существоватьэтотшагсередина,Тебе, Воля, нужно больше от работы,отисследоватьданныеприезжатьсуществоватьDataFrameобъектсередина Формализацияданные Модель,иправильный Сохранятьсоздаватьэтотнекоторый Модельизпроцесскраткий。 Кроме того, на основе С помощью Python вы можете воспользоваться его мощными возможностями для создания программ, автоматизирующих процессы от начала до конца. Созданная вами модель является исполняемой.

С аналитической точки зрения панды Предлагает множество функций, самая яркая из которых — изда против описания. статистикаинформацияиз Интегрированная поддержка, данные возможности позволяют решать многие виды задач. И потому что Pandas основан на Python из, поэтому, если вам нужны более продвинутые возможности анализа, вы можете легко получить доступ к его обширным Python Интеграция с другими частями научной среды.

Демо

Предпоследний этап процесса обычно представляет собой отчет, в котором ваши выводы будут представлены другим. Вам нужно будет создать убедительное и подробное описание вашего решения. Обычно доступно киспользовать Python серединаиз Различный Рисунокинструменти Руководствосоздавать Демо Рукопись Приходитьнадстановитьсяэтотдействовать。

Блокнот Юпитерадамощныйизинструмент,Доступно для вас Pandas Анализируйте и создавайте демонстрационные документы. Эти блокноты позволяют выполнять код и предоставляют богатые возможности Markdown Функции для аннотирования и описания выполнения в нескольких точках приложения. этотнекоторый Можетиспользовать Всоздавать Нет Часто эффективениз Можетосуществлять Демо Рукопись,Эти демо-рукописи визуально богаты фрагментами кода.,Стилизованный текст и графика.

Мы будем в главе 2 Глава «Беги Краткое введение в Панды" Блокнот Юпитера。

Повторение

Важным аспектом исследований является обмен информацией и обеспечение воспроизводимости результатов исследования. люди часто говорят,Если другие исследователи не могут проверить ваши результаты,Тогда вы ничего не докажете.

Счастливая изда,Для тебя,проходитьиспользовать Pandas и Python, вы сможете легко воспроизвести свой анализ. Это можно сделать, поделившись драйвером Pandas Закодированный Python код и данные для завершения.

Блокнот Юпитера также предоставляет удобный способ упаковки кода и приложений и может кпроходить Установить Блокнот Юпитераи Легко поделиться с кем-либо еще. В Интернете существует множество бесплатных и безопасных сайтов для обмена файлами, которые позволяют создавать или развертывать Блокнот Юпитера поделиться.

Примечание об итерации и гибкой разработке

Выкл. Вданные операции,Анализ инаукаиз Нет очень важен с небольшой да,этоэто Итерироватьпроцесс。 Хотя ранее обсуждалось, что естественный процесс существует в прямом направлении, но в конечном итоге вы волясуществовать этот процесс в прямом и обратном направлении. Например,существоватьисследоватьэтап,Выявить аномалии, связанные с проблемами чистоты, можно на этапе и Подготовить.,И нужно вернуться и исправить эти проблемы.

Этопроцессфуниз часть. Вы находитесь в приключении существования, чтобы решить первоначальные проблемы, получая при этом прогрессивное понимание существованияиспользоватьизданныеиз. Эти идеи могут побудить вас задать новые вопросы, более точные вопросы или понять, что ваш первоначальный вопрос не был тем вопросом, который нужно было задавать. Этот процесс действительно является путешествием, а не обязательно пунктом назначения.

Забронировать ипроцессиз Контакты

Ниже представлена ​​краткая карта различных этапов этого процесса. найти Изучите эти шаги в этой книге. Не волнуйтесь, если предыдущий процесс, шаг назад и глава сохраняются. Эта книга проведет вас шаг за шагом в логической последовательности. Pandas,и Можно получить из Рассмотрите соответствующие этапы из в каждой главе процесса прибытия.

шаги в процессе

Расположение

Концепция

Концепцияданаука о данныхсерединаиз Инновациипроцесс。 Вам нужна идея. Тот факт, что вы читаете эту статью, дает вам право, потому что вам нужно проанализировать некоторые данные и надеяться сделать это в будущем.

Поиск

данныеиз Поискосновнойсуществовать Нет. 9 Описано в главе «Доступ к данным».

Подготовить

данные Подготовитьосновнойсуществовать Нет. 10 Это описано в главе «Организация данных», но это общая тема на протяжении большей части этой главы.

исследовать

обдумывать всю книгу из 3 глава“использоватьпоследовательностьэкспресс-синглпеременнаяданные”,прямойприезжать Нет. 15 Глава «Исторический анализ цен на акции». но самое нужное обсуждение из главы да 14 глава“Визуализация”и Нет. 15 Глава «Исторический анализ цен на акции», Начать смотреть анализ приезжать данныхизрезультат。

Моделирование

Моделированиеизфокусда Нет. 3 главаи“использовать последовательность пандэкспресс-синглпеременнаяданные”,Нет. 4 Глава «Использование фреймворка» таблица данныхсредств Разнообразныйданные”,Нет. 11 Глава «Состав, объединение и переосмысление данных», с. 13 Глава «Моделирование времени по хронологии», посвященная финансам из главы 15 Глава «Исторический анализ цен на акции».

Демо

Демода Нет. 14 глава“Визуализация”изосновнойглазиз。

Повторение

Повторениеиз содержания на протяжении всей книги,Например Блокнот Юпитера приводит примеры. вблокнотидти на работу,По умолчанию,Ваш инструмент «Воляиспользовать Повторение»,А делиться блокнотом можно разными способами.

Концепции данных и аналитики в путешествии по Pandas

изучение Pandas ианализ данных, вы столкнетесь со многими связанными с этим исследованиями, анализом концепций моделирования. Рассмотрим некоторые из этих понятий и их Pandas отношение.

тип данных

существоватьполеиспользоватьданныечас,Вы столкнетесь с несколькими основными категориями приезжающих.,этотнекоторыйданныенуждатьсябудучи принужденнымдля Pandas структура данных. Их важно понимать, поскольку инструменты, необходимые для каждого типа, будут разными.

pandas по существу обрабатывает структурированные данные с помощью В, но предоставляет множество инструментов, облегчающих преобразование воля Нетструктурированных данных в средства, которыми мы можем манипулировать.

структурированный

структурированныеданныедасуществовать записи или файлы, организованные в виде фиксированных полей любого типа.,Напримерсвязьданные Библиотекаиэлектронныйповерхностьсеткасерединаизданные。 Структурированные данные зависят от Вданной модели, организации данных и значения модели данных, а также от того, как обычно следует обращаться с данными. этот Сумкавключатьобозначениеданныеизтип(целое число,число с плавающей запятой,строка и т. д.),к И любые ограничения на данныеиз,Например, количество символов,Максимальное значение и минимальное значение или Ограничение на определенный набор значений из.

структурированныйданныеда Pandas Дизайн для использования изтипа данных。 какнас ВоляпервыйиспользоватьSeriesЗатемиспользоватьDataFrameЧто ты видишьприезжатьизтаким образом,pandas Воляструктурированные данные организованы в один или несколько столбцов данных, каждый столбец имеет определенный тип. данных,Затем добавьте ноль или несколько строк данных и после этого.

Нетструктурированный

Нетструктурированный данныеда не имеет какой-либо определенной организации изданных, и эти данные не разбиты конкретно на конкретные типы по строго определенным столбцам. Это доступно во многих типах информации, таких как фотографии и графические изображения, видео, данные потоковых датчиков, веб-страницы, PDF-файлы. Документы, PowerPoint Демонстрационные рукописи, электронные письма, записи в блогах, вики Документ текстовой обработки.

Pandas Нетструктурированные данные не могут быть обработаны напрямую, но они предоставляют множество от Нетструктурированных источников для извлечения структурированных данных. В качестве конкретного примера мы рассмотрим панд иметь Поисквеб-страницаи Воля Извлечение конкретного контентаприезжатьDataFrameсерединаизинструмент。

Половинаструктурированный

Половинаструктурированныйданные Подходящий Нетструктурированныйданные。 Ее можно рассматривать как своего рода структурированные, но в ней отсутствуют строгие изданные Модель структуры. JSON да Половинаструктурированныйданныеизформа。 ХОРОШО JSON С определенным форматом, но не всегда строго соблюдает конкретную схему данных. В большинстве случаев данные Воля представляют собой повторяемый шаблон и могут быть легко преобразованы в структурированныйтип. данных,Например pandas DataFrame,нопроцесс может потребовать от вас предоставить некоторые рекомендации по указанию или обязательному типу данных.

переменная

в праве Pandas При выполнении моделирования данных мы Воля выполняем Моделирование на одной или нескольких переменных и ищем статистическую значимость между значениями или несколькими переменными из. переменнаяиз Определить недаязык программированиясерединаизпеременная,идастатистикапеременная№1。

переменнаяда может измерять или подсчитывать любую характеристику, количество иликоличество. переменнаяк названа так потому, что значения существовать могут различаться между единицами популяции, а значения могут меняться с течением времени. запасценаценить,возраст,пол,Операционные доходы и расходы,страна рождения,капитальные затраты,уровень класса,Цвет глаз и тип автомобиля дапеременнаяиз примера.

использовать Pandas час,мы встретимсяприезжать Несколько широкихизстатистикапеременнаятип:

  • категория
  • непрерывный
  • Дискретныйкатегория

категория

категорияпеременнаяда Можетк Выбиратьиспользоватьограниченныйколичество(в целомдазафиксированныйколичество)из Можетспособныйценить№1изпеременная。 каждый Можетспособныйизценитьобычно называетсяуровень。 Pandas серединаизкатегорияпеременнаяиспользоватьCategoricalsвыражать,Это Что-то вроде Pandas тип данные, изкатегорияпеременная в статистике. категорияпеременнаяот Примерdapol,социальный класс,группа крови,Страна/регион,наблюдатьвремяилиоценка(Например Шкала Лайкерта)。

непрерывный

непрерывныйпеременнаяэто Можетк Принимать неограниченно(Нет Можетчислоколичество)ценитьизпеременная。 Наблюдения могут принимать любые значения между некоторым набором действительных чисел. непрерывныйпеременнаяиз Пример Сумкавключатьвысокий,времяитемпература。 Pandas изнепрерывныйпеременный с использованием типов с плавающей запятой или целочисленных типов (Python Нативное (native) представление, обычно существующее, представляет собой конкретную переменную множественную выборку из коллекции.

Дискретный

Дискретныйпеременнаяэтопеременная,Чтосерединаизценитьбаза Внабор разныхизобщийценитьизсчитать。 Дискретная переменная не может давать оценку между любыми двумя переменными. Примеры дискретнойпеременной включают зарегистрированный автомобиль и количество детей, местонахождение предприятия и количество детей в семье, все из которых измеряют всю единицу (например, 1、2 или 3 ребенок). Дискретныйпеременнаяв целомсуществовать Pandas серединаиспользоватьцелое числовыражать(или Изредкаиспользоватьчисло с плавающей запятойвыражать),Он также обычно представлен двумя или несколькими переменными наборами выборок.

данные временных рядов

данные временных рядовда Pandas Первоклассная сущность в . Время Pandas Внутренняя изпеременная выборка добавляет важное дополнительное измерение. Обычно переменное время выборки не имеет значения. То есть время выборки не имеет значения. носуществовать Так происходит во многих случаях. Время посуществовать Определенный временной интервал образует Дискретнуюпеременную выборку, в которой наблюдения имеют естественный временной порядок.

времяпоследовательностьизстохастическая Модель обычно отражает тот факт, что наблюдения, близкие по времени, более тесно связаны, чем наблюдения, находящиеся далеко. Модели временных рядов обычно используют естественное одностороннее упорядочение времени, чтобы представить значения данного периода времени как полученные из прошлых значений, а не из будущих значений.

Pandas из распространенной ситуации — финансовые данные, где переменная представляет собой стоимость акций в том виде, в каком они существуют, изменяются в пределах фиксированных интервалов времени в течение дня. Мы часто хотим определить изменения в скорости изменения цен за определенный интервал времени. Нам также может потребоваться сопоставить цены нескольких акций за определенный интервал времени.

Это Pandas — важная и мощная функция, поэтому мы посвятим этой концепции целую главу.

Общие понятия анализа и статистики

существоватькнигаискусствосередина,Мы, Воля, изучаем только статистику и анализ. данныхизтехнологияпроцесс。 но обратите внимание изда на некоторые аналитические концепции, часть из которых дасуществовать Pandas Реализация, созданная непосредственно внутри компании. Другим нужно полагаться на другую библиотеку, например SciPy,носуществоватьи Pandas Вы также можете столкнуться с ними во время совместной работы, поэтому полезно их вызвать.

Количественные и качественные данные/анализ

Качественный анализ – это научное исследование данных, которые можно наблюдать, но невозможно измерить. Основное внимание уделяется классификации качества данных. Примерами качественных данных могут быть:

  • Ваша кожа мягкая
  • Кто-то из бегает изящно

Количественный анализ — это исследование фактических значений данных и фактическое измерение предметов в форме данных. Обычно это следующие значения:

  • количество
  • цена
  • высокий

Pandas В основном занимается количественными данными, предоставляя вам широкий спектр инструментов для представления наблюдаемых переменных значений. Pandas Не обеспечивает качественный анализ, но позволяет представить качественную информацию.

одинпеременнаяимногопеременнаяанализировать

посмотреть на это под определенным углом,Статистика исследований переменнаяиз практики,Особенно да для тех переменнаяиз наблюдений. Многие статистические данные основаны наверноодининдивидуальныйпеременнаяизанализировать Приходите виз,этотназываетсяодинпеременнаяанализировать。 Самая простая форма одиночного переменного анализа — анализ данных. Он не обрабатывает причины или отношения, обычно описываемые с помощью В или агрегации данных, и существуют, где искать закономерности.

Разнообразныйанализироватьда Что-то вроде Моделированиетехнология,Среди них есть два или несколько влияний на результаты эксперимента из-за переменной выходной мощности. Множественный переменный анализ обычно связан с такими понятиями, как Актуальностьивозвращаться.,Это помогает нам понять взаимосвязь между несколькими переменными и то, как эти взаимосвязи влияют на результаты.

Pandas В основном предоставляет базовые функции анализа одиночных переменных. Эти функции обычно да Описательная статистические, хотя в рамках существования существует поддержка таких концепций, как ассоциация (поскольку они существуют и очень распространены в других областях финансов).

Доступно киспользовать StatsModels Выполните другую, более сложную статистику. Опять же, это не само по себе Pandas из слабых сторон, и это особенности дизайнерских решений, которые позволяют этим концепциям доминировать над другими специализированными Python обработка библиотеки.

Описательная статистика

Описательная статистикаинформациядаагрегация Учитывая набор данных из функции, обычно этот набор данных представляет собой одну переменную совокупность или выборку. Они описывают центральную тенденцию и зданные множества и меры формы, к и изменчивость и дисперсию и з меры.

Например,к Внизда Описательная статистикаинформация:

  • Распределение (например, нормальное, Пуассона)
  • наборсерединатенденция(Например,иметь в виду,медиана и мода)
  • Дискретныйстепень(Например,дисперсия,стандартное отклонение)

Как мы увидим, панды SeriesиDataFrameобъектинтегрированный Понятновернобольшойколичество Описательная статистикаинформацияизподдерживать。

логическая статистика

логическая статистикаи Описательная Статистически не существует, логично Статистика пытается сделать отданные выводы, не обобщая их. логическая Примеры статистики включают в себя:

  • Т-тест
  • Хи-квадрат
  • Дисперсионный анализ
  • Бутстрап

Эти методы рассуждения обычно начинаются с Pandas Отложите использование других инструментов, например. SciPy и StatsModels。

стохастическая модель

стохастическая модельда. Форма статистического моделирования, состоящая из одной или нескольких случайных переменных, обычно включающих используемые данные. временных рядов。 стохастическая Моделирование расчетных результатов существует на основе шансов в пределах определенного прогнозируемого диапазона, чтобы прогнозировать различные ситуации в зависимости от условий.

Пример стохастического моделирования методом Монте-Карло. Моделирование Монте-Карло обычно используется для оценки финансового портфеля. Повторяющееся моделирование инвестиционных портфелей на рынке используется для моделирования эффективности портфелей. На моделирование влияют различные факторы и распределение вероятностей доходности компонентов.

Pandas длянаспредоставилDataFrameсерединастохастическая модельиз Базовыйданныеструктура,в целомиспользоватьданные временных рядов Приходить Учреждатьибегатьстохастическая модель。 Хотя киспользовать pandas и Python Напиши себе изстохастическое модели анализируют код, но существуют во многих случаях, кроме существования и з Библиотеки (например PyMC) может упростить такие задачи.

Вероятность и байесовская статистика

Байесовская статистика — это метод статистического вывода, полученный на основе теоремы Байеса, математического уравнения, основанного на простых аксиомах вероятности. Это позволяет аналитикам рассчитывать условные вероятности для любого интересующего условия. Условная вероятность – это вероятность события А при наступлении события Б.

Итак, с точки зрения вероятности, событие данных уже произошло и было собрано (потому что мы знаем вероятность). проходитьиспользовать Теорема Байеса,насудобный Можетквычислитьуженаблюдатьприезжатьизданныеданныйилик Это условиеиз Различныйзаинтересованныйизвещьиз Вероятность。

Байесовское моделирование выходит за рамки этой книги, но снова воспользуемся Pandas Хорошо работает с базовыми данными Модель, а затем использует их, например PyMC Подобные библиотеки использовались для реального анализа.

Актуальность

Актуальностьданаиболее распространенныйизстатистикаданные№1,прямойловить Учреждатьсуществовать Pandas DataFrameсередина。 Актуальностьэтоодинодинчисло,Опишите степень связи между двумя переменными,В частности, да описывает степень связи между этими двумя наблюдениями по продолжительности.

Типичным примером является определение того, насколько тесно две акции связаны друг с другом с течением времени. Если изменения близки, корреляция между двумя акциями высока, если нет заметной закономерности, то между ними нет корреляции. Этоиметьценаценитьизинформация,Можно найти виспользовать среди многих инвестиционных стратегий.

Степень корреляции между двумя акциями также может незначительно различаться в зависимости от временного интервала и интервала всего набора данных. К счастью, панды Имеет мощный функционал, позволяющий легко изменить эти параметры и повторно запустить ассоциацию. Далее в книге «Волясуществовать» несколько мест высоты. Актуальность。

возвращаться

возвращатьсяда Что-то вродестатистикаколичествостепень,использовать ВВероятно, из-запеременнаяикакой-то другойпеременнаямеждуизсвязьмощныйстепень。 Его можно использовать, чтобы понять взаимосвязь между переменной и отношением. Финансовые аспекты на примере понимания цен на сырьевые товары, вещей, которыми торгуют эти товары, и отношения к акциям компаний.

Первоначально один был построен прямо на Pandas серединаreturnModel, но ужеварп-сдвигприходите StatsModels в библиотеке. Это показывает Pandas Общие закономерности. Pandas Обычно некоторые концепции уже встроены в систему, и по мере их развития считается, что они наиболее эффективно вписываются в другие концепции. Python библиотека. Этохорошийдаплохой。 Первоначально непосредственно в pandas Используйте его очень хорошо, но когда вы обновляете новую версию pandas , это может сломать ваш код!

Другие библиотеки Python, совместимые с Pandas.

Pandas да Python Внутрианализ данныхинаука о Небольшой, но важный компонент экосистемы данных. Для справки, вот еще несколько важных моментов, на которые стоит обратить внимание. Python библиотека. Этот список не является исчерпывающим, но в нем описаны некоторые проблемы, с которыми вы можете столкнуться.

Численные и научные вычисления – NumPy и SciPy

NumPy даиспользовать Python Базовый набор инструментов для научных вычислений, включенный в большинство современных Python В релизной версии 。 Фактически, он строит Pandas избазафундаментинструменткоробка,использовать Pandas Вы почти наверняка будете часто им пользоваться. NumPy Обеспечивает поддержку множества многомерных операций, которые имеют базовые операции и полезные функции линейной алгебры.

NumPy измножество функции изиспользовать Pandas Специальный да Pandas Seriesобъекттесно связанный。 Большинство наших примеров будут относиться к NumPy,но pandas Seriesфункцияда NumPy Плотный расширенный набор массивов, поэтому мы не будем углубляться в него, за исключением нескольких кратких случаев. NumPy подробности.

SciPy Предоставляет набор численных алгоритмов и наборов инструментов для конкретной предметной области, включая обработку сигналов, оптимизацию, статистику, и многое другое.

Статистический анализ – StatsModels

StatsModels это Python Модуль, который позволяет пользователям просматривать данные, оценивать статистические модели и выполнять статистические тесты. 。 Описательная Обширный список статистической информации, статистических тестов, функций построения графиков и статистики результатов, применимых к различным типам изданныхи каждого оценщика. Исследователи из разных областей могут найти StatsModels Полностью доволен своим Python Выполните статистические расчеты в данныхизнуждаться。

Особенности включают в себя:

  • Линейныйвозвращаться Модель
  • Обобщенная линейная модель
  • Дискретныйвыбирать Модель
  • Прочная линейная модель
  • Анализ времени по хроническому состоянию из многих функций модели
  • непараметрическая оценка
  • В качестве примера мы получаем набор данных из набора.
  • широкоизстатистикатест
  • Инструменты ввода и вывода,Использовать Вгенерировать несколько форматов таблиц (текстовых,LaTex,HTML)ки Воля Stata Чтение файлов NumPy и Pandas
  • Функция рисования
  • Обширное модульное тестирование,Чтобы убедиться в правильности результатов

Машинное обучение – scikit-learn

scikit-learn даа типа NumPy,SciPy и matplotlib Сборка измашинное обучениебиблиотека. это анализ данныхсерединаизобщий Задачапредоставилпростойодинэффективныйизинструмент,Например Классификация,возвращаться,кластеризация,Уменьшение размерности,Выбор модели и предварительная обработка.

PyMC – стохастическое байесовское моделирование

PyMC это Python Модуль, реализующий алгоритмы подбора байесовских статистических моделей, включая цепь Маркова Монте-Карло. Гибкость и масштабируемость делают его применимым для решения многих задач. В дополнение к основной функции выборки PyMC возвращаться Сумкавключатьиспользовать ВСовокупный выпуск,Рисунок,Диагностика согласия и конвергенции и метод.

Визуализация данных — Matplotlib и Seaborn

Python Имеется богатый набор рамок. Самый популярный из двух да matplotlib ивозобновлятьиз seaborn

Matplotlib

Matplotlib это Python 2D Рисуя Библиотеку, она поддерживает различные форматы печатных копий и кроссплатформенность в интерактивной среде, обеспечивая качество публикации с помощью графики. Matplotlib Можно найти в Python Скрипт, Питон и IPython shell,Блокнот Юпитера,Web Сервер приложений и четыре набора инструментов графического пользовательского интерфейса.

pandas тесно интегрирован с включенным matplotlib,СумкавключатьделатьдляSeriesиDataFrameобъектизчастьиз Функция,этотнекоторый Функциявстречаавтоматическийнастраиватьиспользовать matplotlib。 это не значит Pandas ограничивается только matplotlib。 Как мы увидим, это можно легко изменить на ggplot2 и seaborn и другие имена.

Seaborn

Seaborn этоиспользовать Всуществовать Python Создавайте привлекательные и информативные статистические графики из библиотеки. это основано на matplotlib построить, и я PyData Стек тесно интегрирован, включая поддержку NumPy и pandas Поддержка структуры данных, а также SciPy и StatsModels статистические процедуры. это обеспечивает выход за рамки matplotlib дополнительные функции, а также отображаются по умолчанию, чем matplotlib Более богатый и современный визуальный стиль.

Подвести итог

В этой главе мы рассмотрели Pandas из Как это работает и Почему, Обработка данных/анализироватьинаука。 впервые изложенный Pandas Существование панд Место Включить функциональную и дополнительную обработку данных,анализироватьинаука о данныеизмежду понятиями отношения.

Тогда мы проводим анализ данныхпроцесс,к Определите, почему Pandas В . есть определенные особенности. Чтосередина Сумкавключать Поискданные,Данные об организации и очистке,руководитьисследовать,Затем установите официальную модель,Продемонстрируйте свои выводы и получите возможность делиться и воспроизводить результаты анализа.

Следующий,наспредставлять Понятноданныеистатистика Моделированиесерединас участиемизнесколько концепций。 Чтосередина Сумкавключать涵盖многообщийизанализироватьтехнологияиконцепция,Позвольте мне познакомить вас с этими техническими и концептуальными концепциями.,А существование поможет вам лучше ознакомиться с ним, поскольку он более подробно обсуждается в последующих главах.

Pandas Еще больше Python Библиотека часть экосистемы из доступных Анализ данныхинаука。 Хотя эта книга посвящена только Pandas, но вы встретите и другие библиотеки и познакомитесь с ними, так что вы познакомитесь с ними, когда вырастете.

нас Подготовитьначинатьиспользовать Pandas . В следующей главе мы начнем изучать Панды, полученные из Python и Pandas окружение начинается, верно Блокнот Юпитера для обзора, затем существование для глубокого погружения Pandas SeriesиDataFrameобъект Извпередверно Чторуководитьбыстрыйпредставлять。 Pandas Последующие элементы имеют большую глубину.

2. Запустите и запустите Pandas

В этой главе мы объясним, как установить Pandas и начните использовать его основные функции. Содержание этой книги основано на Ноутбуки IPython и Jupyterизформа式нестидля,поэтому,Мы также VolyaQuick используем оба инструмента.

В этой книге будут использованы Continuum из Anaconda наука Python Выпускать. Anaconda да Популярностьиз Python Дистрибутивы, в которых включаются бесплатные и платные компоненты. Anaconda Обеспечивается кроссплатформенная поддержка, в том числе Windows,Mac и Linux。 Anaconda из Базовой версии дистрибутива Установить Pandas,Ноутбуки IPython и Jupyter,поэтомуначиная Нетчастопростойодин。

В этой главе будут рассмотрены следующие темы:

  • Установить Anaconda,Pandas и IPython/Блокнот Юпитера
  • использовать Ноутбуки IPython и Jupyter
  • Jupyter и его блокнот
  • Настройте свою среду Pandas
  • Pandas SeriesиDataFrameбыстрыйначиная
  • из CSV-файла данные загрузки
  • генерировать Pandas данныеиз Визуализация

Установка Анаконды

Книга Воляиспользовать Anaconda Python Версия 3,Специальный да 3.6.1。 На момент написания статьи Панды из Версия это 0.20.2。 По умолчанию Анаконда Установщик установит Python,IPython,Блокнот Юпитераи pandas。

Можно получить из Сайт Континуум Аналитикискачать Anaconda Python。 Web Сервер Воля распознает ваш браузер из операционной системы и предоставляет вам файлы для загрузки соответствующего программного обеспечения для этой платформы.

Когда вы откроете этот URL-адрес в своем браузере, я хотел бы посетить страницу, похожую на этот контент:

Нажмите на ссылку программы из Установить, подходящую для вашей платформы. Эта Воля предоставляет вам контент, похожий на страницы Вкизскачать:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-27cyNlu7-1681365384091) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00007.jpeg)]

скачать 3.x Установщик. Книга WillUseFromкогдавпередVersion Anaconda да 4.3.1, с Python 3.6.1:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-BPyvSL8c-1681365384092) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00008.jpeg)]

Эта ситуация часто меняется, и к тому времени, когда вы прочтете это, она, возможно, изменится.

Запустите программу, подходящую для вашей платформы из Установить,После завершения,Открыть командную строкуили ТерминалиосуществлятьpythonЗаказ。 Вы должны увидеть что-то похожее на следующее (в Mac Вот так на да):

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-OdwG9uMR-1681365384092) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00009.jpeg)]

ты Можеткпроходитьпроблемаexit()выход оператора Python Устный переводчик:

существует Терминал или командная строка,ты Доступно киспользоватьpip show pandasЗаказпроверять Pandas из Установить Версия:

Уже установленоиз в настоящее время Версия проверена как 0.20.2。 Пожалуйста, убедитесь, что вы 0.20.2 иливыше Версия,потому что Воляиспользоватьэтот Версияидентификация В Pandas из Изменять.

сейчассуществовать,У нас уже есть все, что нам нужно,Продолжим использовать Ноутбуки IPython и Jupyter.

Ноутбуки IPython и Jupyter

приезжать На данный момент у нас есть выполнение из командной строки или терминала Python。 Это Python Поставляется сизпо умолчаниюЦикл чтения-оценки-печатиREPL)。 этот Можеткиспользовать Приходитьбегатькнига Книгасерединаиз Местоиметь Пример,но Книга Воляиспользовать IPython Написание пакетов текста и кода Блокнот из заявления в Юпитера. Давайте кратко рассмотрим оба.

IPython

IPython использовать тебя Python Интерактивная работа из резервной копии Shell。 к этому Python Предоставляется по умолчанию REPL Сделаны некоторые улучшения.

Если вы хотите узнать более подробную информацию IPython,пожалуйста, проверьтедокумент

начать IPython,Толькоот Заказ ХОРОШО/ТерминалосуществлятьipythonЗаказ。 При запуске вы увидите что-то похожее на следующее:

отображение подсказки вводаIn [1]:。 каждый раз IPython REPL Когда предложение вводится в , цифры в подсказке увеличиваются.

такой же,тывходитьизлюбойидентификация条глазиз Результат:ВолякOut [x]:начало,ЧтосерединаxисоответствующийизIn [x]:из Сопоставление номеров。 На следующем скриншоте показано это:

inиoutзаявлениеизпара чисел ВПример Очень тяжелыйхотеть,потому что Местоиметь Пример Все ВолякIn [x]:иOut [x]:начало,После этого вы сможете продолжить обучение.

Обратите внимание, что эти цифры являются чисто непрерывными. Если следовать кодам в тексте и при вводе возникает ошибка или вводится другое предложение, то нумерация может быть неправильной (можно выйти и перезапустить IPython чтобы сбросить номер). Пожалуйста, используйте их исключительно в качестве справки.

Блокнот Юпитера

Блокнот Юпитерада IPython блокнотиз Эволюция. Это с открытым исходным кодом Web отвечатьиспользовать,Позволяет создавать и публиковать живой код.,уравнение,Визуализацияиснижение цениздокумент。

Изначально IPython Ноутбуки ограничены Python。 Блокнот Юпитера был разработан, чтобы позволить использовать несколько языков программирования, включая Python,R,Julia,Scala и F#。

Если вы хотите узнать больше о Блокнот Юпитера,Пожалуйста, посетитеэта страница,существоватьэта страница на Воля отображает аналогичный контент со страниц Вк:

Блокнот Юпитера Можеткнезависимый В Python скачатьииспользовать。 Anaconda Установлено по умолчанию. начать Блокнот Юпитера,пожалуйстасуществовать Заказ ХОРОШОили Терминалначальствопроблемак Вниз Заказ:

Язык кода:javascript
копировать
$ Блокнот Юпитера

В целях демонстрации давайте посмотрим, как запустить пример кода, прилагаемый к тексту. от Packt загрузка код сайта, а затем извлеките файл Воля из каталога по вашему выбору. В каталоге существования вы увидите похожий контент ниже изк:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-Kd4PQj6l-1681365384094) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00015.jpeg)]

сейчассуществоватьпроблемаjupyter notebookЗаказ。 Вы должны увидеть что-то похожее на следующее:

Откроется страница браузера, показывающая Блокнот Юпитера Домашняя страница,Прямо сейчасhttp://localhost:8888/tree。 Эта Воля открывает витрину эта страницаиз Web Окно браузера, похожее на содержимое Вк и список каталогов:

одинударять.ipynbСвязь Может Открытьблокнотстраница。 Если вы откроете эту главу, вы увидите содержимое, подобное следующему:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-Co5cCa9C-1681365384095) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00018.jpeg)]

Показать изблокнотда Jupyter и IPython генерироватьиз HTML。 Он состоит из ряда ячеек, которые могут быть одного из четырех типов: Code, Markdown, Raw. nbconvert или титул. Все примеры в этой книге представляют собой единицы со скидкой.

Jupyter Запустите по одному для каждого блокнота IPython Ядро. Включать Python Закодированный модуль существования выполняется в этом ядре, и результат такой: HTML Добавить в блокнот.

Двойной щелчок по любой ячейке сделает ее доступной для редактирования. 编辑надодин元сеткаиз Внутри Ронг Хоу,в соответствии сShift + Enter,этотчас Jupyter/IPython Содержимое будет оценено и отображен результат.

Если вы хотите узнать больше о том, что составляет основу страницы, изблокнот формата,пожалуйста Видетьздесь

Верхняя часть панели инструментов блокнот предоставляет вам множество функций для управления блокнотом. К ним относятся перемещение вверх и вниз, добавление и удаление ячеек. Также содержит основы для запуска устройства, повторного запуска устройства и перезапуска устройства. IPython Ядро из команды.

Чтобы создать новый блокнот, перейдите в раздел «Новый блокнот». -> Python3”:

Волясуществовать Новая вкладка в браузере для создания новой изолированной страницы. Его имя будет Без названия:

блокнот Включатьодин Подготовитьхорошийвходить Python из Код. существоватьодин元сеткасерединавходить1 + 1ив соответствии сShift + Enterосуществлять。

Блок был выполнен,результатпоказыватьдляOut [1]:。 Jupyter Также открывается новая единица, где вы можете ввести дополнительные коды или скидки.

Блокнот Юпитера будет автоматически сохранять ваши изменения каждую минуту, но сохранять изменения вручную время от времени все равно полезно.

Введение в последовательности Pandas и фреймы данных

Давайте начнем использовать немного Панды и дайте краткое введение Pandas издваосновнойданныеструктураSeriesиDataFrame。 Мы проверим следующее:

  • Воля Pandas импортироватьтыизотвечатьиспользовать
  • Создавать и манипулировать Pandas Series
  • Создавать и манипулировать Pandas DataFrame
  • Воляданныеот Загрузка файлаприезжатьDataFrame

Импорт панд

Мы Воляиспользоватьиз каждого блока сначала Импорт панд и еще несколько полезных Python библиотека. Он также установит несколько опций для управления Pandas как Блокнот Вывод рендера в Юпитера. Код Включенияк гласит:

Первый оператор импортирует NumPy и Воля Библиотекасерединаизпроектвестииспользоватьдляnp.。 В этой книге мы не будем обсуждать NumPy Проведите детальное возвышение, но иногда приходится его использовать.

Второй импорт использует Pandas В наличии нас Воляиспользоватьpd.вперед缀вестииспользовать Библиотекасерединаизпроект。 from pandas import Series, DataFrameзаявление ВоляSeriesиDataFrameобъектявныйимпортироватьприезжатьобщая ситуацияимякосмоссередина。 Это подводит нас к Можно найти в Нетpdиз Состояние ВнизвестииспользоватьSeriesиDataFrame。 префикс. этот Очень квадратныйудобный,Потому что мы часто будем их использовать,Это экономит много времени при наборе текста.

import datetimeзаявлениевести入ПонятноdatetimeБиблиотека,Должен Библиотекав целомсуществовать Pandas Используется во Вданных временных рядов。 это Воля Сумкавключатьсуществоватькаждыйблокнотизимпортироватьсередина。

pd.set_option()функциянастраиватьиспользовать Установить параметры,этотнекоторый选项通Знатьблокноткакпоказывать Pandas из вывода. Нет.одинсообщить статус ВоляSeriesиDataFrameРезультат:сейчасдляискусствокнигаи Нетда HTML。 Следующие две строки определяют максимальное количество выводимых столбцов и строк. final Опция устанавливает максимальное количество выводимых символов в строке.

ты Можно найти в этом URL Дополнительные параметры см. в

увлеченныйиз Глаз Можетспособныйвстреча注意приезжатьэтотодин元сетка НетOut [x]:。 И Нет всех единиц (или IPython оператор) будет генерировать выходные данные.

Если вы хотите использовать IPython заменять Блокнот Юпитера для последующих операций, затем Можно найти в IPython Shell Выполните этот код в . Например, вы можете просто вырезать и вставить код в ячейку. Это может выглядеть так:

IPython shell Будьте достаточно умны, чтобы понимать, что вы вставляете несколько строк и делаете соответствующие отступы. И обратите внимание, что в IPython shell серединатакже НетOut [x]:pd.set_optionНетвозвращатьсялюбой Внутри Позволять,поэтому Нет Комментарий。

последовательность панд

Pandas Seriesда Pandas из Базовыйструктура данных. последовательностьи NumPy множествосходство,но ЭТО ИЗ РАЗНИЦЫ существует В ИМЕЕТ индекс,Индекс позволяет расширить возможности поиска элементов.,И не просто даот нулевое стартовое значение измножествоиндекса.

к Внизот Python Список создает последовательность. :

Вывод включает в себя два столбца информации. Нет.одиндаиндекс,Нет.дваиндивидуальныйдаSeriesсерединаизданные。 Выход из каждого представителя рядаиндексЭтикетка(существовать Нет.один Списоксередина),Затемпредставлятьи Должен Этикеткаассоциацияизценить。

Зависит от ВсоздаватьэтотSeriesчасеще нетобозначениеиндекс(Следующий Воляхотетьосуществлятьиздействовать),поэтому pandas Автоматически создавать целочисленный индекс, индексиз Этикеткаот 0 Для начала для каждого элемента данных добавьте 1。

Затем,Доступно киспользовать[]доступ оператораSeriesобъектизценить,ипередача Местонуждатьсяценитьиз Этикетка。 к Вниз Внутри Позволятьполучать Этикетка1изценить:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-HG0BAi21-1681365384097) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00025.jpeg)]

Это очень похоже на обычный доступ во многих языках программирования. но, как мы видим, приезжатьиз, индекс не обязательно от 0 Начать без увеличения 1, и может быть много типов данные, а не просто целые числа. Этот способ обеспечивает гибкие возможности индексации Pandas из Одна из великих сверхдержав.

в Python В списке можно указать несколько позиций, указав их из Этикетка. к Вниз Внутри Позволять Поиск Этикетка1и3начальствоизценить:

проходитьиспользоватьindexпараметриобозначениеиндекс Этикетка,Доступно киспользоватьиспользовать户Конечно义изиндекссоздаватьSeriesобъект. ВнизлапшаизкодсоздаватьодинSeries,чьи ценности одинаковы,Но индекс состоит из строковых значений:

сейчассуществовать,эти буквенно-цифровыеиндекс Этикетка МожеткдоступSeriesобъектсерединаизданные。 к Вниз Внутри Позволять Поискиндекс Этикетка'a'и'd'начальствоизценить:

все еще Можеткпроходитьбаза В[0]изчисло РасположениевестииспользоватьэтотSeriesобъектизэлемент。 :

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-HG6awP3G-1681365384098) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00029.jpeg)]

нас Доступно киспользовать.indexПроверка недвижимостиSeriesизиндекс:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-oOZrR0x4-1681365384099) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00030.jpeg)]

индексна самом делеэто Pandas объект, эти выходные данные показывают нам значение индексизации и виндексизтип данных。 существуют В этом случае обратите внимание на индекссерединаизтип данных(называетсяdtype)даобъекти Нетданить。 Позже в этой книге мы изучим, как изменить эту настройку.

Seriesсуществовать Pandas Обычное использование в из да означает дату/время индекса Этикетки, связанное с временем по очереди. Внизлапшапроходитьиспользоватьpd.date_range() pandas создание диапазон дат функции, чтобы проиллюстрировать это:

Это Pandas серединасоздавать ПонятноодинназываетсяDatetimeIndexизособенныйиндекс,Это Что-то вродеособенныйиз Pandas индекс,пройтиоптимизация Можетверносдатаивремяизданныеруководитьиндекс。

сейчассуществовать,позволятьнасиспользовать ДолжениндекссоздаватьодинSeries。 Значение данных представляет собой высокую температуру в определенный день:

этотдобрыйсDateTimeIndexизпоследовательностьназываетсявремяпоследовательность。

нас Доступно киспользоватьдатаделатьдлянить Приходить Запросидентификацияданныеизтемпература:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-NAXvU2VK-1681365384100) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00033.jpeg)]

дваSeriesобъект Можеткпроходить Арифметические операции相互отвечатьиспользовать。 к Внизкодсоздавать Нет.дваиндивидуальныйSeriesивычислитьдва者междуизтемпература Разница:

вернодва Нет标количествоценитьизSeriesобъектруководить Арифметические операции(+,-,/,*,…)изрезультат Волявозвращаться ДругойодинSeriesобъект.

От Виндекс не да целое число,поэтомунасвозвращаться Можеткпроходитьот 0 Начните со значения, чтобы найти цену:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ADSr7tHN-1681365384100) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00035.jpeg)]

Наконец, панды Приведен ряд описательных и статистических методов. Например,Следующий контент возвращает разницу температур от средней цены:

кадр данных панд

Pandas Seriesможет толькоикаждыйиндекс Этикеткаассоциацияодинценить。 Чтобы каждый индекс Этикетка имел несколько значений, мы можем киспользовать фрейм данных。 рамка данныхпредставлятьодинилимногоиндивидуальныйв соответствии синдекс Этикетка ВыравниваниеизSeriesобъект. каждыйпоследовательность Волядафрейм В столбце есть один столбец, и каждый столбец может иметь связанное имя.

в каком-то смысле фрейм данныхпохожий Всвязьданные Библиотекаповерхность,Потому что это означает, что в одном столбце имеется несколько разнородных типов (но один тип для всех элементов в каждом соответствующем столбце).

к Внизсоздаватьприносить Есть две колонкиизDataFrameобъект,ииспользоватьтемператураSeriesобъект:

производить изфрейм данные имеют два столбца,соответственноMissoulaиPhiladelphia。 Эти столбцыдафрейм данныхсередина ВключатьизновыйSeriesобъект,иметьоторигинальныйSeriesобъекткопироватьизценить。

Доступно киспользоватьс именами столбцовили Списокимя Списокповерхностьизмножествоиндексустройство[]доступDataFrameобъектсерединаиз Список。 к Внизкод ПоискMissoulaСписок:

Внизлапшаизкод ПоискPhiladelphiaСписок:

Списокимяиз Python Списки также можно использовать для возврата нескольких столбцов:

иSeriesобъектпо сравнению с,DataFrameобъектжитьсуществоватьтонкийизразница。 Воля Списокповерхностьперешел кDataFrameиз[]оператор Воля Поискобозначениеиз Список,иSeriesВоля Возвратная строка。

Если имя столбца не содержит пробелов,но Доступно киспользоватьсвойствостильруководитьдоступ:

фрейм данныхсерединакаждый Списокмеждуиз Арифметические операцииимногоиндивидуальныйSeriesначальствоиз Арифметические операциитакой же。 Для демо,Следующее обозначение атрибута codeuse вычисляет разницу между температурами:

Толькопроходитьиспользоватьмножествоиндексустройство[]выражать Закон ВолядругойSeriesназначен наодин Список Прямо сейчас Может Воляновый Списокдобавить вприезжатьDataFrame。 к Вниз Внутри ПозволятьсуществоватьDataFrameсерединадобавить в Понятностемпература Разницаизновый Список:

Можетпроходить.columnsсвойстводоступDataFrameсерединаиз Списокимя:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-F9ms9LNW-1681365384103) (https://gitcode.net/apachecn/apachecn-). ds-zh/-/raw /master/docs/learning-pandas-2e/img/00044.jpeg)]

МожетккусочекDataFrameиSeriesобъектк Поискидентификацияиз ХОРОШО。 В следующую секунду приедет четвертая линия разницы температур изкусочек:

Доступно киспользовать.locи.ilocсвойство Поискфрейм данныеиз всей строки. .locправильный Сохранятьв соответствии синдекс Этикетка Находить,Чтосередина.ilocиспользоватьот 0 Запуск из Расположение.

к Вниз Внутри Позволять Поискфрейм данныхиз Нет.два ХОРОШО:

пожалуйста, обрати внимание,этотрезультатуже Воля ХОРОШОКонвертироватьдляSeries,фрейм данныхиз СписокимяужеперспективаприезжатьрезультатSeriesизиндекс Этикеткасередина。 Результаты показаны ниже:

Доступно киспользовать.locсвойствопроходитьиндекс Этикеткаявныйдоступ ХОРОШО。 к Внизкодпроходитьиндекс Этикетка Поискодин ХОРОШО:

Доступно киспользоватьцелое число Расположение СписокповерхностьвыбиратьDataFrameобъектсерединаизидентификация ХОРОШО。 к ВнизотDifferenceСписокизцелое число Расположение1,3и5из ХОРОШОсерединавыбиратьценить:

[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-bKuuTASK-1681365384104) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00049.jpeg)]

Вы можете применить данныеиз логических выражений в каждой строке к Выберите строки фрейма данных。 к ВнизпоказыватьMissoulaСписоксерединабольшой В82степеньизценить:

Затем Можетк Воляповерхностьвыражениеизрезультатотвечатьиспользовать Вфрейм данных(ипоследовательность)из[]оператор,этоттолькопривести квозвращатьсяпроситьценитьдляTrueизповерхностьвыражениеиз ХОРОШО:

Эта технология находится в pandas терминсерединаназываетсяЛогический выбор,это Воляструктурастановитьсябаза Видентификация Списоксерединаизценитьвыбирать ХОРОШОизбазафундамент(Напримерсуществовать SQL серединаиспользоватьWHEREпунктиз Запрос – Но мы увидим, что он мощнее).

Загрузить данные из файла в фрейм данных

Pandas Библиотека удобно предоставляет различные источники данных в Поисковых Pandas объектиз Инструменты. В качестве простого примера рассмотрим Pandas к CSV Возможность загрузки данных формата.

книга Пример Воляиспользовать С этой книгойизкодdata/goog.csvнестидляиздокумент,Содержимое этого файла представляет собой информацию об акциях Google с учетом временных финансовых показателей.

к Следующее предложениеиспользовать операционную систему (от Блокнот Юпитераили IPython Internal) отображает содержимое этого файла. Какая команда вам нужна, зависит от вашей операционной системы:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-kFCoIdmx-1681365384105) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00052.jpeg)]

Доступно киспользоватьpd.read_csv()функция ВоляэтотнекоторыйинформациялегкийимпортироватьDataFrame

pandas не знает дату в первом столбце файла,ииуже ВоляDateПолеиз Внутри Позволять Видетьдлянить。 Доступный киспользовак pandas заявлениеверноэтотруководитьпроверять,Должензаявлениекнитьформа式показыватьDateСписокизтип:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-mk7MyUHK-1681365384105) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00055.jpeg)]

the pd.read_csv()функцияизparse_datesпараметр Можетгид Pandas Как преобразовать данные напрямую в Pandas Объект даты. к Следующее уведомление Pandas ВоляDateСписокиз Внутри Позволять КонвертироватьдлядействительныйизTimeStampобъект:

Если мы проверим, действительно ли это,насвстреча看приезжать ДатаTimestamp

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-FfC9bUS0-1681365384106) (https://gitcode.net/apachecn/apachecn-). ds-zh/-/raw /master/docs/learning-pandas-2e/img/00058.jpeg)]

К сожалению, здесь нет поля даты, как в фрейме данныхизиндекс. И даиспользовать значения по умолчанию из целочисленного индекса с отсчетом от нуля Этикетка:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ga8FnoUt-1681365384106) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00059.jpeg)]

пожалуйста, обрати внимание,этотсейчассуществоватьдаRangeIndex,существоватьквпередиз Pandas Версия, это должен быть целочисленный индекс. Мы рассмотрим эту разницу позже в книге.

Доступно киспользоватьpd.read_csv()функцияизindex_colпараметр Воля Чтозафиксированный,к указывает, какой столбец в файле Воля следует использовать в качестве индекса:

сейчассуществоватьиндексдаDateTimeIndex,этоделатьнас Доступно киспользоватьдата Находить ХОРОШО。

Визуализация

Мы будем в главе 14 Углубленное изучение Предварительной обработки, носуществовать в главе «Визуализация», перед которой мы время от времени Pandas серединаизданныеруководитьбыстрый Визуализация。 использовать Pandas Создать данные Визуализация Нет очень просто. Местоиметьнуждаться Делатьиз Сразуданастраиватьиспользовать.plot()метод。 ВнизлапшапроходитьрисоватьзапасданныеизCloseценитьруководить Демо:

Подвести итог

В этой главе мы устанавливаем Python из Anaconda Scientific Версия。 Это также установит pandas и Блокнот Юпитера, приготовься к твоей казни Обработка данныхианализироватьизсреда,и создано с помощью ВПредварительный просмотр,Представьте и поделитесь анализом и блокнотом.

Мы все еще правы Pandas SeriesиDataFrameобъектруководить Понятнопредставлять,выставка Понятноодиннекоторый Базовый Функция。 На выставке показано, как выполнить некоторые основные операции, прежде чем углубляться во все детали, которые можно использовать для начала работы. Pandas。

существовать Следующийиз Несколькоглавасередина,нас Воляидти глубже ИсследоватьSeriesиDataFrameиздействовать,Внизодинглава ВоляфокуспредставлятьSeries

3. Используйте последовательности для представления одномерных данных.

Seriesда Pandas из Основные строительные блоки. Это означает один тип данныеиз — это одномерный набор значений, аналогичный Вмножествоиз. Обычно он измеряется с помощью В для одной переменной из нуля или многократного моделирования. хотяэтосмотреть Приходитькартинамножество,ноSeriesиметьассоциацияизиндекс,Индекс, доступный в базе ВЭтикетка, исполнение Нет, часто действителен из значения Поиск.

Seriesвозвращатьсявстречаавтоматическийосуществлятьсами Чтоон Pandas Сопоставьте свои объекты. Выровнять да Pandas Основная функция, при которой данныедасуществовать сопоставляет кратные значениям Этикетки перед выполнением какого-либо действия. Pandas объект. Это позволяет применять операции просто без явного кодирования соединения.

существоватькнигаглавасередина,нас Воля ИсследоватькакиспользоватьSeriesдляпеременнаяиз Измерение Моделирование,Включить использование индекса. Образец поиска.,кусочеки Запросданные,Выравнивание и повторная индексация по нескольким шаблонам.

В частности, в этой главе мы рассматриваем следующие темы:

  • использовать Python Список, Словарь, NumPy функция и скалярное значение Создать последовательность
  • доступSeriesизиндексиценитьсвойство
  • правильный КонечноSeriesобъектизразмериформа
  • существоватьсоздаватьSeriesчасобозначениеиндекс
  • использоватьhead,tailиtakeдоступценить
  • проходитьиндекс Этикеткаи Расположение Находитьценить
  • кусочекичастоиспользоватькусочекмодель
  • проходитьиндекс Этикетка Приходить Выравнивание
  • выполнить логический выбор
  • ТяжелыйновыйиндексSeries
  • Изменить значение на месте

Настроить Панды

Мы начинаем эту главу со следующего оператора импортироватьиконфигурацию:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-AdkSyCZA-1681365384108) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00063.jpeg)]

Создать последовательность

Доступно киспользоватьмногодобрыйтехнологиясоздаватьSeries。 Мы изучили следующие три:

  • использовать Python Списокповерхностьилисловарь
  • использовать NumPy множество
  • использовать标количествоценить

использовать Python Список и словарь Создать последовательность

Можно получить из Python СписокповерхностьсерединасоздаватьSeries

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-8R8GnSwO-1681365384108) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00064.jpeg)]

числоиз Нет.один СписоквыражатьSeriesиндекссерединаиз Этикетка。 Во втором столбце указано значение Включать. dtype: int64выражатьSeriesсерединаценитьизтип данныхдляint64

По умолчанию Панд-встреча создаст индекс,Должениндекс Зависит от0начинатьизнепрерывныйвсемножествостановиться。 Это делает последовательность похожей на множество других языков программирования. Например, мы Можно найти вlabel 3в Находитьценить:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-N1jBqtiL-1681365384108) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00065.jpeg)]

Найденное значение для дапроходить Этикетка вместо даот 0 Начать из Расположение продолжить. Мы рассмотрим это подробно позже в этой главе.

Доступно киспользовать Нетцелое числоизтип данных。 Создайте строковое значение изположения под k:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-8615Z3i0-1681365384108) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00066.jpeg)]

хотетьсоздавать Зависит отnиндивидуальныйтакой жеценитьvизпоследовательность Группастановитьсяизпоследовательность,пожалуйстаиспользовать Python стенографияповерхностьсоздавать[v]*n。 к Внизсоздавать2изпятьценить:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-yC25BEPu-1681365384109) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00067.jpeg)]

Внизлапшада Что-то вродепохожийизстенографиятип,этоиспользовать Python Сокращение для использования каждого символа в качестве элемента списка:

Можно получить из Python словарьпрямойловитьинициализацияSeries。 При использовании словаря в качестве индекса Этикетка используется словарь из ключа:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-0bsHvsKk-1681365384109) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00069.jpeg)]

использовать NumPy создание функции

инициализацияSeriesобъектиз Различный NumPy Функция да А распространена на практике. Например, в следующем примереиспользуйте NumPy np.arangeфункциясуществовать4и8междусоздаватьодинцелое числоценитьпоследовательность:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-B7FJO9Hp-1681365384110) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00070.jpeg)]

np.linspace()методиз Функцияпохожий,но позволяет нам указать, что мы хотим существовать, чтобы создать изколичество значений между (и включительно) двумя указанными значениями.,И с указанным количеством шагов:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-FFeiWB01-1681365384110) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00071.jpeg)]

использоватьnp.random.normal()генерировать Также существует набор случайных чисел.даочень распространенныйиз。 Кот Нормальное распределение предполагает пять случайных чисел:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-QfgED5yr-1681365384110) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00072.jpeg)]

использовать создание скалярного значения

также Доступно киспользовать создание скалярного значенияSeries

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-7Ddbyoy3-1681365384111) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00073.jpeg)]

Seriesтолькоиметьодининдивидуальныйценить,Кажется, это деградирующая ситуация. но,существуют в некоторых случаях,это важно,Например,Воляпоследовательность при умножении на скалярное значение,Как показано ниже:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-dxY66vpy-1681365384111) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00074.jpeg)]

Под обложкой Панды Выбиратьценить2иот Должен标количествоценитьсоздаватьодинSeries,Чтоиндексиsсерединаизиндекссоответствовать,Затемпроходить ВыравниваниедваSeriesруководить乘Закон。 существования Далее в этой главе мы, Воля, еще раз рассмотрим этот пример более подробно.

.indexи.valuesсвойство

каждыйSeriesобъектвсе Зависит отодиннекоторыйценитьиодининдекс Группастановиться。 Можеткпроходить.valuesсвойстводоступэтотнекоторыйценить:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-Tg8QH9c3-1681365384111) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00075.jpeg)]

результат — это объект массива NumPy, как показано ниже:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-6DCSvq4L-1681365384112) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00076.jpeg)]

Вне Винформации называется пункт из Воля. Мы не будем рассматривать это в этой книге. NumPy множество. от Исторически, Панды изправильныйсуществоватьза кулисамииспользовать NumPy массив, следовательно NumPy Раньше «множествосуществовать» было более важным, но эта опора на существование недавно была заменена на «удалить» в из Версии. Но для удобства, даже если базовое представление не NumPy множество,.valuesтакжевстречавозвращаться NumPy множество.

кроме того,Доступно киспользовать.indexПоиск Долженпоследовательностьизиндекс:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-pNh7zPdO-1681365384112) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00077.jpeg)]

Pandas создаватьизиндекстипдляRangeIndex。 При существовании этого типа изиндекс не существует, этои предыдущая версия по сравнению с из Pandas Изменять. RangeIndexобъектпредставлятьиметьобозначениеstepизотstartприезжатьstopценитьизценитьобъем。 иквпередиспользоватьизInt64IndexПо сравнению с Это работает для Pandas daiz.

RangeIndexТолькоданас Воляхотетьисследоватьиз Что-то вродеиндекстип(Нет. 6 Большая часть подробностей в разделе «индексданные»).

Размер и форма последовательности

Seriesобъектсерединаизпроектчисло Можеткпроходитьмногодобрыйтехнология Приходитьправильный Конечно,Чтосередина Нет.Что-то вродедаиспользовать Python len()функция:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-e6PZKIjU-1681365384112) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00078.jpeg)]

проходитьиспользовать.sizeсвойство Можеткполучить то же самоеизрезультат:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-KfRMSjkW-1681365384112) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00079.jpeg)]

получатьSeriesразмериз Другойформадаиспользовать.shapeсвойство。 Это возвращает двоичный кортеж, но указывается только первое значение, представляющее размер:

[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-dkCQEWsZ-1681365384112) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00080.jpeg)]

Укажите индекс во время создания

Доступно киспользоватьструктура造устройствоизindexпараметрсуществоватьсоздаватьSeriesчасобозначениеиндекссерединаиз Этикетка。 ВнизлапшасоздаватьодинSeriesи Волянитьназначен наиндексизкаждый Этикетка:

исследовать.indexсвойство,Мы обнаружили, что индекс Вниз был создан:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-svm7okkz-1681365384113) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00082.jpeg)]

использоватьэтотиндивидуальныйиндекс,нас Можеткпроситьодинпохожийwho is the Dad?извопрос:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-2ncsktyq-1681365384113) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00083.jpeg)]

.head(),.tail()и.take()

Pandas предоставил.head()и.tail()метод ПриходитьисследоватьSeriesсерединавпередгид(голова)илиследовать(хвост)ХОРОШО。 По умолчанию,Они возвращают первые пять строк и последние пять строк.,но Доступно киспользоватьnпараметрруководить Изменять.

позволятьнасисследоватьк ВнизSeriesизиспользовать Закон:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-89JIhqtp-1681365384113) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00084.jpeg)]

Первые пять строк следующего содержания:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-lzZiHdTt-1681365384114) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00085.jpeg)]

Доступно киспользоватьnпараметр(илитолькопроходитьобозначениечисло)Приходить Изменятьпроектчисло:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-1ws7nOxa-1681365384114) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00086.jpeg)]

.tail()возвращатьсянаконецпять ХОРОШО:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-NyG2VxdB-1681365384114) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00087.jpeg)]

обозначение5кснаружиизчислочас,Это работает следующим образом:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ntTbOoEM-1681365384114) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00088.jpeg)]

.take()методвозвращатьсяобозначениецелое число Расположениеиз ХОРОШОизпоследовательность:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-cTrb4YNV-1681365384115) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00089.jpeg)]

проходить Этикеткаили Расположение Поискпоследовательностьсерединаизценить

Seriesсерединаизценить Можеткпроходитьдвадобрыйчасто规метод Поиск:проходитьиндекс Этикеткаилиот 0 Запуск из Расположение. Pandas Для выполнения обоих поисков предусмотрено несколько методов. Давайте рассмотрим некоторые распространенные методы.

использовать[]оператори.ix[]свойствов соответствии с Этикетка Находить

использовать[]операторосуществлять Скрытый Этикетка Находить。 Обычно этот оператор соответствии Найдите значение, указанное в индексе Этикетка.

позволятьнасотиспользоватьк ВнизSeriesначинать:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-YwJqJYFg-1681365384115) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00090.jpeg)]

Найдите одну ценить только с необходимыми элементами.Используйтезиндекс Этикетку:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-V4f8vx0O-1681365384115) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00091.jpeg)]

список использоватьиндекс Этикетка может искать несколько элементов одновременно:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-vZybvmLT-1681365384115) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00092.jpeg)]

насвозвращаться Доступно киспользоватьпредставлять Расположениеизцелое число Приходить Находитьценить:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-vt09K9kQ-1681365384115) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00093.jpeg)]

Это чисто да, потому что индекс не использует целочисленную Этикетку. если Воляцелое числоперешел к[],и индекс имеет целочисленное значение,Затем введите Воля передает значение из и целое значение Этикеткаиз для сопоставления для выполнения поиска.

этот Доступный киспользовакSeriesруководить Демо:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-dYxsRF2V-1681365384116) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00094.jpeg)]

к Вниз Внутри Позволятьсуществовать Этикетка13и10и Нет Расположение13и10в Находитьценить:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-UJzMeV4H-1681365384116) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00095.jpeg)]

использовать[]операторруководитьиз Находитьииспользовать.ix[]свойствотакой же。 но,Начиная с версии Pandas 0.20.1,.ix[]ужезаброшенныйиспользовать。 Причина прекращения поддержки заключается в том, что да путается при передаче целого числа оператору и зависит от разницы в типах операций Этикетки в Виндексе.

Чтов результатеда[]или.ix[]все Нет Можетиспользовать ВНаходить。 идаиспользовать.loc[]и.iloc[]свойство,Они явно найдены только Этикеткаили Расположение.

использовать.iloc[]в соответствии с Расположениеявный Находить

Доступно киспользовать.iloc[]Приходитьв соответствии с Расположение Находитьценить。 Ниже Демоиспользовать целое число в качестве параметра:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-s4gJlrhU-1681365384116) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00096.jpeg)]

Несмотря на то, что индекс имеет целое число Этикетка, Расположение будет найдено следующее:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-vzfSgVbc-1681365384116) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00097.jpeg)]

пожалуйста, обрати внимание,Если указано несуществующее существованиеиз Расположения (маленький В ноль или большой В номер позиции - единица),Тогда Воля выбрасывает исключение.

проходить.loc[]проходить Этикеткаруководитьявный Находить

также Можеткпроходитьиспользовать.loc[]свойство Приходить Реальностьсейчасв соответствии с Этикетка Находить:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-24tHAGha-1681365384117) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00098.jpeg)]

использовать целое число. Этикетка без проблем:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-8qQOBq8N-1681365384117) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00099.jpeg)]

пожалуйста, обрати внимание,Когда доставки нетсуществоватьиндекссерединаизиндекс Этикеткачас,.loc[]и.iloc[]иметьдругойиз ХОРОШОдля。 В этом случае Панды ВолявозвращатьсяNaNценить,Без исключения:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-iZJao7x2-1681365384117) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00100.jpeg)]

ЧтодаNaN? Мы Волясуществовать эту главу из более подробной информации о данном правительстве, но pandas использовать Он представляет собой недостающий номер данныхили, который невозможно найти в пройтииндексфинд найти приезжатьиз. Это также имеет значение для различных статистических методов, которые мы также рассмотрим позже в этой главе.

Разрезать последовательность на подмножества

Pandas Seriesподдерживатьназываетсякусочекиз Функция。 кусочекдаот Pandas объект в Поискданные подмножества мощного метода. проходитькусочек,нас Можеткв соответствии с Расположениеилииндекс Этикеткавыбиратьданные,и лучший контроль над генерацией элементов (вперед или назад) и интервалов (каждый элемент,друг друга) из порядка.

кусочексделаю обычныймножество[]оператор(ки.loc[],.iloc[]и.ix[])перегрузка,кприниматькусочекобъект。 кусочекобъектдаиспользоватьstart:end:stepграмматикасоздаватьиз,Представляет первый элемент,последний элементизкомпонентыкихотетьделатьдляstepизкаждый项междуиз Приращение。

кусочекиз Каждый компонент не является обязательным,и опустить спецификатор фрагмента компонента,Предоставляет удобный способ выбора целых строк.

Для начала Демокусочек,нас Воляиспользоватьк ВнизSeries

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-UQsgJyGs-1681365384118) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00101.jpeg)]

нас Доступно киспользоватьstart:endделатьдлякусочеквыбиратьнепрерывныйизпроект。 к ВнизвыбиратьSeriesсередина Расположение1к5изпятьпроект。 Зависит от Внасеще нетобозначениеstepкомпоненты,поэтомупо умолчаниюдля1。 Другойпожалуйста, обрати внимание,результатсередина Нет ВключатьendЭтикетка:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-Pv6YrBCv-1681365384118) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00102.jpeg)]

Этот результат примерно эквивалентен следующему содержимому:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-QRTafMEE-1681365384118) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00103.jpeg)]

примерно эквивалентно,потому чтоверно.iloc[]изиспользоватьвозвращатьсяисточниксерединаданныеизкопировать。 кусочка Ссылка на данныеиз в источнике. Исправлять Местопридетсякусочекиз Внутри Позволять Воля Источник влиянияSeries。 нас Волясуществоватьпозжеизчастьсередина Сразу Кусочек ИсправлятьSeriesданные,Изучите этот процесс дальше.

проходитьобозначение2шаг,часть возвращает все остальные элементы:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-rFnQsQTw-1681365384118) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00104.jpeg)]

как упоминалось ранее,кусочекиз Каждый компонент не является обязательным。 еслиупущениеstartкомпоненты,норезультат Воляот Нет.один项начинать。 Например,к Внизда.head()изаббревиатура:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-lmCpTxuv-1681365384119) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00105.jpeg)]

проходитьобозначениеstartкомпонентыиупущениеend,Можетквыбиратьидентификация Расположениеи Чтоназадиз Местоиметьпроект。 к Внизвыбиратьот4thначинатьиз Местоиметьпроект:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-1cfRiiiC-1681365384119) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00106.jpeg)]

stepтакже Можно найти а именно два случая использования, чтобы пропустить элементы:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-43hGC12l-1681365384119) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00107.jpeg)]

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-vD2e5EGF-1681365384120) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00108.jpeg)]

использоватьstepгрузценить Воляобеспечить регрессрезультат。 к Вниз Демо Понятнокакобеспечить регрессSeries

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-JZFw48De-1681365384120) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00109.jpeg)]

ценить-2Воляотначинать Расположениевозвращаться Местоиметь Чтоонпроект,ик Напротивизпоследовательное направлениеSeriesизначинать工делать。 Внизлапшаиз Примервозвращаться Местоиметь Чтоонпроект,Сумкавключать Расположение4виз ХОРОШО:

[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-MVltgwk0-1681365384120) (https://gitcode.net/apachecn/apachecn-). ds-zh/-/raw /master/docs/learning-pandas-2e/img/00110.jpeg)]

кусочекизstartиendизгрузценитьиметьособенныйзначение。 -nизstartгрузценитьвыражатьнаконецnХОРОШО:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-WEVvwgXy-1681365384121) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00111.jpeg)]

-nизendгрузценить ВолявозвращатьсяудалятьнаконецnХОРОШОИзснаружииз Местоиметь ХОРОШО:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-k6pYHIhl-1681365384121) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00112.jpeg)]

грузstartиend分количество Можетккомбинацияиспользовать。 к Вниз Внутри Позволятьпервый Поискнаконец Четыре ХОРОШО,Затемотсередина Поискудалятьнаконецодин ХОРОШО(Прямо сейчасвпередтри ХОРОШО)Изснаружииз Местоиметь ХОРОШО:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-VkomK3jv-1681365384121) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00113.jpeg)]

Вы также можете выполнить измерение целых чисел с помощью Нетиндексизпоследовательность. Для демо,позволятьнасиспользоватьк ВнизSeries

использоватьэтотSeries,верноцелое числоценитьруководитькусочек Воляв соответствии с Расположениенести Выбиратьпроект(как упоминалось ранее):

[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-oP8AmQO7-1681365384122) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00115.jpeg)]

но,Целочисленное значение WhenuseNet как компонент фрагмента,Pandas Воля, попытайтесь понять тип данных и по очереди, чтобы выбрать соответствующий пункт. Например,от'b'приезжать'd'изк Внизкусокчасть:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-lcnJMUmD-1681365384122) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00116.jpeg)]

Выровнять по индексному тегу

проходитьиндекс ЭтикеткаверноSeriesданныеруководить Выровнять да Pandas Базовая концепция, а также одна из самых мощных концепций. Выравнивание Виндекс Этикетка обеспечивает автоматическое объединение нескольких последовательность объектов по соответствующим значениям. использоватьстандартныйизпроцесстехнология,Можно найти Сохраняйте большое количество данных о сопоставлении рабочей нагрузки, подверженных ошибкам, в нескольких коллекциях.

Для демо Выравнивание,позволятьнас ПодниматьодинсуществоватьдваSeriesобъектсерединадобавить вценитьиз Пример。 позволятьнасотк ВниздваSeriesобъектначинать,этоихпредставлятьодин Группапеременная(aиb)издва Неттакой жекнига:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ayKPr5a1-1681365384123) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00117.jpeg)]

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ApFHFyxc-1681365384123) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00118.jpeg)]

Теперь предположим, что мы хотим оценить и для каждого переменного значения. нас Можеткпростойодинземлявыражатьдляs1 + s2

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-u7lkM1B5-1681365384123) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00119.jpeg)]

Pandas сопоставил все переменные измерения в каждой последовательности.,Воля Эти значения суммируются,Затемсуществоватьодинкраткийиззаявлениесередина Волякаждыйпеременнаяизобщийивозвращаться Даватьнас。

также Можетк Воля标количествоценитьотвечатьиспользовать ВSeries。 результат Волядаиспользоватьобозначениеиздействовать Воля标количествоотвечатьиспользовать ВSeriesсерединаизкаждыйценить:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-Q1RJmp7l-1681365384124) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00120.jpeg)]

Помните, я упоминал ранее о приезде,нас Волявозвращатьсясоздаватьиметь标количествоценитьизSeries?? При выполнении таких операций Pandas Фактически будут выполнены следующие операции:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-j8ZH2pao-1681365384124) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00121.jpeg)]

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-JH0PSv74-1681365384124) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00122.jpeg)]

Нет.один步даот标количествоценитьсоздаватьодинSeries,носглаз标Seriesизиндекс。 Затем Воля乘Законотвечатьиспользовать ВдваSeriesобъектиз Выравниваниеценить,То же от Виндекса,Они идеально выравниваются.

Индекс в из Этикетке не требует выравнивания. Если не выровнено, то Pandas ВолявозвращатьсяNaNделатьдлярезультат:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-bwe1RPZ1-1681365384124) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00123.jpeg)]

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-68o9D6Uu-1681365384125) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00124.jpeg)]

По умолчанию,NaNценитьдалюбой Pandas Выравниваниеизрезультат,Чтосерединаиндекс Этикеткаи ДругойодинSeriesНет Выравнивание。 и NumPy По сравнению с Это Pandas из Важные особенности. Если метки не выровнены, исключение не должно создаваться. Это помогает, когда чего-то не хватает, но это приемлемо. Обработка все еще продолжается, но Pandas проходитьвозвращатьсяNaNМожеткпозволятьты Знатьжитьсуществоватьвопрос(но Нетодин Конечнодавопрос)。

Pandas Индекс не обязательно должен быть уникальным в из Этикетке. Выравниваниедействоватьна самом делесуществоватьдваSeriesсерединаформастановиться Этикеткаиз Декартово произведение。 если1последовательностьсерединаиметьnиндивидуальный Этикетка,и2последовательностьсерединаиметьmиндивидуальный Этикетка,норезультатобщийсчитатьдляn * mрезультатсерединаиз ХОРОШО。

Для демоэтотодин点,позволятьнасиспользоватьк ВниздваSeriesобъект:

[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-bDONsXyw-1681365384125) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00125.jpeg)]

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-Wm0P3lXf-1681365384125) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00126.jpeg)]

Это произведет 6 индивидуальный'a'индекс Этикетка,ки'b'и'c'изNaN

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ddz8aAqR-1681365384126) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00127.jpeg)]

выполнить логический выбор

индексдлянаспредоставил Что-то вродебаза ВЧто ЭтикеткасуществоватьSeriesсередина Находитьценитьиз Нет Часто эффективенизозначает。 но,еслитыдуматьбаза ВэтотнекоторыйценитьсуществоватьSeriesсередина Находить条глаз,что делать?

Чтобы справиться с этой ситуацией, Pandas Нам предоставляется логический выбор. Логический выбор Волялогикаповерхностьвыражениеотвечатьиспользовать ВSeriesизценить,И существование возвращает новое логическое значение последовательности для каждого значения.,Эти логические значения представляют собой результат выражения. Затем,Долженрезультат Можетиспользовать Втольконести ВыбиратьрезультатдляTrueизценить。

Для демо Логический выбор,позволятьнасот ВнизлапшаизSeriesначинатьиотвечатьиспользоватьбольшой Вбольшой Воператор Приходитьправильный Конечнобольшой Вилиждать В3изценить:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-nhtrwrqi-1681365384126) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00128.jpeg)]

этот Воляпривести кSeriesиметьсоответствоватьизиндекс Этикетка,ииповерхностьвыражениеизрезультат Воляотвечатьиспользовать Вкаждый Этикеткаизценить。 ценитьизdtypeдляbool

Затем Доступно киспользовать Долженпоследовательностьоторигинальныйпоследовательностьсерединавыбиратьценить。 проходить Волялогическое значениерезультатпередачаприезжатьисточникиз[]оператор Приходитьосуществлятьэтотвыбирать。

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-SLQR08zK-1681365384126) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00129.jpeg)]

Можеткв[]операторсерединаосуществлятьлогика运算Приходитьпростой化грамматика:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-gBt3R7OL-1681365384127) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00130.jpeg)]

Неудачная изда, обычная из Python Синтаксис не может использовать несколько логических операторов. Например,к вызывает исключение:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-GSMqnsp7-1681365384127) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00131.jpeg)]

Существуют технические причины, по которым приведенный выше код не работает должным образом. решениедаиспользоватьдругойиз Способповерхностьдостигатьуравнение,существуют Добавляйте круглые скобки до и после каждого логического условия.,идляи/или(|и&)использоватьдругойизоператор:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-KSRnuuLY-1681365384127) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00132.jpeg)]

использовать.all()метод Можеткправильный КонечноSeriesсерединаиз Местоиметьценитьданетиданныйповерхностьвыражениесоответствовать。 Внизлапшаиз Внутри Позволять询просить Долженпоследовательностьсерединаиз Местоиметьэлементданет Всебольшой Вилиждать В0

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-UFI7jMoY-1681365384127) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00133.jpeg)]

Если какое-либо значение удовлетворяет выражению,но.any()метод ВолявозвращатьсяTrue。 Внизлапшаиз Внутри Позволять询проситьданетиметьлюбойэлемент Маленький В2

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-xoxYzRaN-1681365384128) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00134.jpeg)]

ты Можетквернорезультатвыбиратьиспользовать.sum()метод Приходитьправильный Конечноиметьмногонемногопроектудовлетворитьповерхностьвыражение。 Этопотому чтокогдаданныйлогическое значениеценитьпоследовательность,Долженпоследовательностьиз.sum()методвстреча ВоляTrueВидетьдля1иFalseВидетьдля0

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-kDKuordw-1681365384128) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00135.jpeg)]

Последовательность переиндексации

существовать Pandas середина ТяжелыйновыйиндексдаделатьSeriesсерединаизданныесопоставить группу Этикеткаизпроцесс。 Pandas использоватьэто Приходитьосуществлятьбольшойчасть Выравниваниепроцесс,поэтомудаодин项Базовыйдействовать。

Перереализованы следующие функции:

  • Измените порядок существующих данных, чтобы они соответствовали набору Этикетки.
  • существовать Нет Этикеткаданныеизразместить вставкуNaNотметка
  • Доступно киспользоватькакое-то логическое дополнение Этикеткаиз Отсутствующийданные(по умолчаниюдлядобавить вNaNценить)

Легко переустановить,ТолькодляSeriesиз.indexсвойствораспространятьодинновыйиндекс Прямо сейчас Может。 Внизлапша Демо Понятнокэтотдобрый Способ ИзменятьSeriesизиндекс:

[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-jsp7803V-1681365384128) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00136.jpeg)] [Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-IWrPwxZh-1681365384129) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00137.jpeg)]

назначен на.indexсвойствоиз Списокповерхностьсерединаизэлементчисло必须и ХОРОШОчислосоответствовать,нет Тогда Воля выбрасывает исключение. Тяжелыйновыйиндексвозвращаться Сразуземля Исправлять ПонятноSeries

проходитьиспользовать.reindex()метод,Гибкое создание нового индекса. Ситуация да присваивает новый индекс,Номер Этикетки не соответствует:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-YKiJUHpy-1681365384129) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00138.jpeg)]

Следующий код использует набор с новыми значениями,потерянныйценитьи Тяжелый叠ценитьиз ЭтикеткадляSeriesТяжелыйновыйподготовлениндекс:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-YKVaypJu-1681365384129) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00139.jpeg)]

закрывать В.reindex(),иметь Несколько点нуждатьсяуказать。 первыйда.reindex()методизрезультатдановыйизSeries,и Нетда Сразуземля Исправлять。 новыйизSeriesиметьс Этикеткаизиндекс,нравитьсяперешел кфункциячас Местообозначение。 ВолядляоригинальныйSeriesсерединажитьсуществоватьизкаждый Этикеткакопироватьданные。 еслисуществоватьоригинальныйSeriesсерединапопытаться найти Нетприезжать Этикетка,но ВоляNaNраспространятьдля Долженценить。 наконец,ВоляудалитьSeriesсерединас Нетсуществоватьновыйиндекссерединаиз Этикеткаиз ХОРОШО。

когдатыхотеть ВыравниваниедваSeriesквернодваSeriesсерединаизценитьосуществлятьдействоватьноSeriesобъект Нет Зависит от В某добрый原因Выравниваниеиз Этикеткачас,Повторный индекс также полезен. Обычная ситуацияда,одинSeriesиметьцелое числотипиз Этикетка,Еще одна строка,но значение избазового значения да такое же, как из (от удаленного источника при получении данных,этоточень распространенный)。 кк ВнизSeriesобъектдляпример:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-7MEMoVKY-1681365384129) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00140.jpeg)]

хотядваSeriesсередина Этикеткаиз То же значение,но Зависит от Вэтоихизтип данные разные, они выровнены Воля. Как только проблема обнаружена, ее можно легко устранить:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-TD4MS2dc-1681365384130) (https://gitcode.net/apachecn/apachecn-). ds-zh/-/raw /master/docs/learning-pandas-2e/img/00141.jpeg)]

.reindex()методиметьпо умолчаниюдействовать,Прямо сейчассуществоватьисточникSeriesсерединапопытаться найти Нетприезжать Этикеткачас,ВоляNaNделатьдля Недостатокизценитьвставлять。 Доступно киспользоватьfill_valueпараметр Изменятьэтотценить。 Внизлапшаиз Пример Демоиспользовать0заменятьNaN

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-pjg8pgY0-1681365384130) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00142.jpeg)]

когдаверноиметь序данные(Напримервремяпоследовательность)осуществлять Тяжелыйновыйиндексчас,Можеткосуществлять Вставлятьценитьилиценитьнаполнение。 существовать Нет. 10 глава“данные временных В «рядах» Воля более подробно обсуждает интерполяцию и дополнение, и следующий пример высоты иллюстрирует эту концепцию. позволятьнасотк ВнизSeriesначинать:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-DdHT6E0x-1681365384130) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00143.jpeg)]

Следующий пример иллюстрирует концепцию прямого заполнения.,обычно называетсяпоследнее известное значение。 ТяжелыйновыйиндексSeriesксоздаватьнепрерывныйизцелое числоиндекс,ипроходитьиспользоватьmethod='ffill'параметр,длялюбойновыйизиндекс Этикеткараспространять Первыйвпередуже ЗнатьизНе НЭН ценить:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-SpiMv3Bu-1681365384130) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00144.jpeg)]

индекс Этикетка1и2и Этикетка0изкрасный,4и5от Этикетка3изgreenкикрасный6приезжать5изblueсоответствовать。

к Вниз Примериспользоватьmethod='bfill'накладка назад:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-5Uk9wz6z-1681365384130) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00145.jpeg)]

Этикетка6Нет Первыйвпередизценить,поэтому Воля ЧтонастраиватьдляNaN4настраиватьдля5blue)изценить; 2и1настраиватьдля Этикетка3green)изценить。

Изменить последовательность на месте

Seriesиз Сразуземля Исправлятьэтоспорныйизтема。 если Можетспособный,большинствохорошийосуществлятьвозвращатьсясновыйSeriesсерединавыражатьиз ИсправлятьизновыйSeriesиздействовать。 но,если необходимо,Может изменять значения и добавлять/удалять строки на месте.

проходитьдля尚НетжитьсуществоватьизindexЭтикеткараспространятьценить,Можно найти впоследовательностьсерединадобавить водин ХОРОШО。 к ВнизкодсоздаватьодинSeriesобъект,И добавьте к этой последовательности дополнительный элемент:

[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-4BXrn289-1681365384131) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00146.jpeg)]

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-Xub6CtWy-1681365384131) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00147.jpeg)]

Вы можете изменить его, присвоив конкретному индексу существование Этикетка из значения:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-QlqYp1qG-1681365384131) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00148.jpeg)]

Можеткпроходить ВоляindexЭтикеткаперешел кdel()функцияотSeriesсерединаудалить ХОРОШО。 Внизлапша Демо Понятнокакудалитьсиндекс Этикетка'a'из ХОРОШО:

[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-8HB5wE14-1681365384131) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00149.jpeg)]

хотетьдобавить виудалитьдискомфорт Когдазпроект,пожалуйстаиспользоватьpd.concat()использовать Логический выбор Приходитьдобавить виудалить.

использоватькусочекиз Важно помнитьда,кусочекизрезультатдаоригинальныйSeriesизвид。 проходитькусочекдействоватьрезультат Исправлятьценить Воля ИсправлятьоригинальныйизSeries

Рассмотрим следующий пример,Должен ПримервыбиратьSeriesсерединаизвпереддваэлементи Воля Чтожитьмагазинсуществоватьновыйпеременнаясередина:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-pUw1oO5L-1681365384131) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00150.jpeg)]

Воляценитьназначен накусочекэлементизк Вниздействовать Воля ИзменятьоригинальныйSeriesсерединаизценить:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-yeW09KrQ-1681365384132) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00151.jpeg)]

Подвести итог

существования В этой главе вы узнали Pandas Seriesобъекткикак Воля Чтоиспользовать Ввыражатьпеременная Измерениеценитьизиндексвыражать。 насоткаксоздаватьиинициализацияSeriesи Чтоассоциацияиндексначинать,Затем Исследовать ПонятнокакодинилимногоиндивидуальныйSeriesобъектсерединаманипулироватьданные。 Мы рассмотрели, как Выровнять по индексному тегуSeriesобъекткикакв Применяйте математические операции над значениями правепиз. Затем мы проверили, как найти данные по индексу, к и как в. соответствии сданные (логическое выражение) выполняет запрос. Затем,нас Заканчивать Понятновернокакиспользовать Тяжелыйновыйиндекс Приходить Изменятьиндекси Выровнять данныеиз Исследовать。

существовать Внизодинглавасередина,ты Воляузнать, какиспользоватьDataFrameкединыйизповерхностьсеткаструктуравыражатьмногоиндивидуальныйSeriesданные。

4. Используйте фреймы данных для представления таблиц и многомерных данных.

Pandas DataFrameобъект ВоляSeriesобъектиз Функция Расширятьдлядваизмерение。 заменятьодининдивидуальныйценитьпоследовательность,фрейм данныеиз Каждая строка может иметь несколько значений, каждое значение представлено в виде столбца. Затем, каркас данныеиз Каждая строка может использоваться для наблюдения за несколькими связанными атрибутами, а каждый столбец может представлять разные типы.

фрейм данныеиз каждого столбца да Pandas Series,иифрейм Данные можно рассматривать как форму данных, например, электронную таблицу или таблицу Библиотеки. ноэтотнекоторый比较и НетсимволобъединитьDataFrameизхотетьпросить,Потому что кадр данных Pandas уникален из Нет, очень отличается по качеству,Напримерпредставлять СписокизSeriesобъектизавтоматическийданные Выравнивание。

Это автоматическое выравнивание использует фрейм данные более эффективны, чем электронные таблицы или данные библиотеки, для проведения анализа пола. данных。 Объединив существующие строки и столбцы одновременно с функцией «сокращенныеиз», этот ифрейм Изданные данные для интерактивного просмотра и функции просмотра очень эффективны для того, чтобы найти то, что вам нужно.

существуют В этой главе мы, Воля, углубимся в Pandas DataFrameSeriesвстреча熟悉многоконцепция,но добавим некоторые инструменты обработки данных для поддержки его работы. Конкретно,существоватькнигаглавасередина,Мы освещаем следующие темы:

  • в соответствии с Python объект,NumPy Функции, Питон Словарь, Панды Seriesобъекти CSV документсоздаватьDataFrame
  • правильный Конечнофрейм данныхразмер
  • обозначениеидействоватьфрейм данныхсерединаиз Списокимя
  • Создать кадр данных периода из выравнивания строк
  • Выберите определенные столбцы и строки
  • Волякусочекотвечатьиспользовать Вфрейм данных
  • проходить Расположениеи Этикетка Выберите строки фрейма данныхи Список
  • Поиск скалярного значения
  • отвечатьиспользовать Вфрейм данныхиз Логический выбор

Настроить Панды

Мы начинаем эту главу со следующего оператора импортироватьиконфигурацию:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-htdjQzXM-1681365384132) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00152.jpeg)]

Создать объект фрейма данных

Существует много видов создания фреймворков. данныхизметод。 Можно получить изодинилиодин Группамногоизмерениеданныенаборсоздаватьрамка данных。 Наше исследование технологий заключается в следующем:

  • использовать NumPy функцияизрезультат
  • использовать Включать Списокповерхностьили Pandas Seriesобъектиз Python словарьсерединаизданные
  • использовать CSV В файле изданные

существуют При проверке всего этого,Еще мы Воля проверяем, как указывать имена столбцов,Как выполнить выравнивание во время инициализации Демо и посмотреть, как определить размер кадра данных.

использовать NumPy Результат функции создает фрейм данных

фрейм данные могут быть представлены одномерными NumPy Целое число (диапазон от 1 приезжать 5) Создайте:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-pZesLpEH-1681365384132) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00153.jpeg)]

Первый столбец вывода показывает, что индексиз Этикетка создана. Создано Всуществовать без указания индекса, т.е. Pandas создавать Понятноодинбаза ВRangeIndexиз Этикетка,Этикеткаиз начинается с 0.

данныесуществовать Нет.два Списоксередина,Зависит отценить1к5Группастановиться。 данные Списокначальствонаправлениеиз0да Должен Списокизимя。 существоватьсоздаватьфрейм данные, когда имя столбца не указано, pandas использоватьот 0 Начните с увеличения целых чисел для именования столбцов.

также Доступно киспользоватьмногоизмерение NumPy массив и создайте несколько столбцов:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-TcuGLIj5-1681365384132) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00154.jpeg)]

Доступно киспользовать.columnsсвойстводоступDataFrameиз Список:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-WV5pIjqr-1681365384133) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00155.jpeg)]

Это показывает, что если имена столбцов не указаны, Pandas ВолясоздаватьодинRangeIndexПриходитьвыражать Список。

Доступно киспользоватьcolumnsпараметробозначение Списокимя。 Внизлапшасоздавать Понятноодиндва СписокDataFrame,Представляем два города и две выборки температуры:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-MF6Na12I-1681365384133) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00156.jpeg)]

Доступно киспользоватьlen()функцияпопытаться найтиприезжатьDataFrameсерединаиз ХОРОШОчисло:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-nvsmOXRN-1681365384133) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00157.jpeg)]

Доступно киспользовать.shapeсвойствопопытаться найтиприезжатьDataFrameизразмер:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-eII9N9qD-1681365384133) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00158.jpeg)]

использовать Python словарь и pandas Объект последовательности создает кадр данных

Python словарь Можетиспользовать ВинициализацияDataFrame。 использовать Python словарь, панды Воля использует ключи в качестве имен столбцов, а Воля использует каждый ключ из значения как изданные столбцы:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-KkvivW8g-1681365384134) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00159.jpeg)]

создаватьDataFrameизчастоиспользоватьтехнологиядаиспользовать Воляиспользоватьделать ХОРОШОиз Pandas Seriesобъектиз Списокповерхность:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-oaScfzAk-1681365384134) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00160.jpeg)]

существуют В этом случае,каждыйSeriesпредставлятькаждый Городсуществоватьидентификация Измерениеинтервалвизодининдивидуальный Измерение。

Чтобы назвать столбец,нас Можеткпытатьсяиспользоватьcolumnsпараметр:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-bT5yG15z-1681365384134) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00161.jpeg)]

Этот результат отличается от того, что мы могли ожидать,потому чтоэтотнекоторыйценитьужеиспользоватьNaNнаполнение。 Это можно исправить двумя способами. Нет.Что-то вродеда Воля Списокимяназначен на.columnsсвойство:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-IqtwvKD5-1681365384134) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00162.jpeg)]

Еще один прием даиспользовать Python словарь,где ключ да имя столбца,каждыйключизценитьдаSeries,Представляет показатель в этом конкретном столбце:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ykx5Ce1Q-1681365384134) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00163.jpeg)]

пожалуйста, обрати внимание,существовать СтроитьDataFrameчас,Воля ВыравниваниенестидляизSeries。 Ниже добавлен третий город с разными значениями индекса, чтобы проиллюстрировать это:

[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-5xFBqLdJ-1681365384135) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00164.jpeg)]

Создайте фрейм данных из файла CSV.

Можеткпроходитьиспользоватьpd.read_csv()функцияот CSV Файл считывает данные для создания фрейма данных.

pd.read_csv()Волясуществовать Нет. 9 Проведите более обширное исследование в главе «Посещение данных».

Для демо Долженпроцесс,нас Воляотодин Включать S&P 500 Снимокиздокументсерединанагрузкаданные。Должендокументимядляsp500.csv,Кусочек Вкод Сумкаизdataглаз录середина。

Файл из первой строки Включает каждую переменную/столбец по имени, остальные 500 представляют ряды по 500 различных значений.

к Загрузите код ниже данных,При этом укажите, какой столбец в файле использовать Виндекс.,А нам нужны всего четыре конкретных столбца (0, 2, 3 и 7):

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-QqloEvNX-1681365384135) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00165.jpeg)]

использовать.head()исследоватьвпередпять ХОРОШО,Покажите нам структуру ниже:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-SxxLEIHR-1681365384135) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00166.jpeg)]

Давайте проверим этот фреймворк данныеиз Некоторые свойства. оно должно было иметь 500 данные строки. Можеткпроходитьисследоватьфрейм длина данныхиз для проверки:

[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-FWeBHrJr-1681365384135) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00167.jpeg)]

мы хотим, чтобы это имело 500 ХОРОШОитри Списокизформа:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-dCpsBsmU-1681365384136) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00168.jpeg)]

Доступно киспользовать.sizeсвойствопопытаться найтиприезжатьфрейм данныхизразмер。 Это свойство возвращает фрейм данныхсерединаданныеценитьизколичество。 мы ожидаем 500 * 3 = 1,500:

[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-oI1S6Hnn-1681365384136) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00169.jpeg)]

Фрейм данныхизиндекс состоит из 500 акций из символов:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-YnZHtP5G-1681365384136) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00170.jpeg)]

Столбцы состоят из следующих трех имен:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-2DEJZUpw-1681365384136) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00171.jpeg)]

пожалуйста, обрати внимание,Хоть мы и указали при загрузке четыре столбца,Но результат всего лишь Включить три столбца,Потому что в одном из четырех столбцов исходного файла используется Виндекс.

Доступ к данным внутри фрейма данных

фрейм данные состоят из строк и столбцов и имеют структуру данных, выбранную в определенной строке и столбце. этотнекоторыйвыбиратьиспользоватьиSeriesтакой жеизоператор,Сумкавключать[],.loc[]и.iloc[]

Несколько измерений,поэтомуотвечатьиспользоватьэтотнекоторыйизмерениестепеньизпроцесс略иметьдругой。 Мы воляпроходить сначала учимся выбирать столбцы, а затем строки, существовать выбирать строки и столбцы из комбинации к и исполь зовать Логический в одном операторе. выбор, чтобы проверить это.

Кроме того, панды Предоставляет конструкцию с Всуществовать, которую мы хотим проверить, выбирая одно скалярное значение в определенной строке и столбце. Этот метод важен и полезен, поскольку обеспечивает очень высокопроизводительный способ доступа к этим значениям.

Выберите столбцы кадра данных

использовать[]операторвыбиратьDataFrameидентификация Списоксерединаизданные。 этотиSeriesдругой,существоватьSeriesсередина,[]обозначение Понятно ХОРОШО。 Можетк Воля[]действоватьсимволперешел кодининдивидуальныйобъектилипредставлятьхотеть Поискиз Списокизобъект Списокповерхность。

к Вниз Внутри Позволять Поискимяназывается'Sector'из Список:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ZGjKBNEw-1681365384136) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00172.jpeg)]

когдаотDataFrameсередина Поискодининдивидуальный Списокчас,результатдляSeries

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-nU9SmwQi-1681365384137) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00173.jpeg)]

Привести указанный список имен столбцов можно к Поиск нескольких столбцов:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-i7eJidkf-1681365384137) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00174.jpeg)]

По В у него несколько столбцов,поэтомурезультатдаDataFrameи НетдаSeries

[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-lveKt5HD-1681365384137) (https://gitcode.net/apachecn/apachecn-). ds-zh/-/raw /master/docs/learning-pandas-2e/img/00175.jpeg)]

Доступ к столбцам также можно получить с помощью атрибута кпроходить. Толькохотетьимя Нет Включатькосмос,DataFrameВолядобавить впредставлять Каждый Списокимяизсвойство。 Внизлапшакэтотдобрый Способ ПоискPriceСписок:

[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-LxOPIoSp-1681365384137) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00176.jpeg)]

пожалуйста, обрати внимание,этотимядискомфортиспользовать ВBook ValueСписок,Потому что в названии есть пробелы.

Выберите строки фрейма данных

Доступно киспользовать.loc[]проходитьиндекс Этикеткаценить Поиск ХОРОШО:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-1hbs7lcR-1681365384137) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00177.jpeg)]

также,Доступно киспользовать Этикетка Списокповерхность Поискмного ХОРОШО:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-sUmQJRyU-1681365384138) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00178.jpeg)]

Доступно киспользовать.iloc[]в соответствии с Расположение Поиск ХОРОШО:

[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-jALCqBst-1681365384138) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00179.jpeg)]

Можно найти видентификация Этикеткаценитьизиндекссередина Находить Расположение,Затемиспользовать Долженценитьв соответствии с Расположение Поиск ХОРОШО:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-WU48ypO5-1681365384138) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00180.jpeg)]

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-exX6iwKj-1681365384138) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00181.jpeg)]

В качестве заключительного замечания этого раздела,также Доступно киспользовать.ix[]руководитьэтотнекоторыйдействовать。 но этот метод устарел. иметьзакрывать Дажемногоподробныйинформация,пожалуйста Видетьздесь

использовать.at[]и.iat[]в соответствии с Этикеткаили Расположениеруководить标количество Находить

Доступно киспользовать.at[]проходить Этикетка Находитькаждыйиндивидуальный标количествоценить,А также передайте ему имена строк и столбцов:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-KSoEpqOw-1681365384139) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00182.jpeg)]

также Доступно киспользовать.iat[]в соответствии с Расположение Находить标количествоценить,Также передайте строку Расположениеи столбец Расположение. Это Доступ к одному значению из предпочтительного метода,И может обеспечить высочайшую производительность:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ZlrtwYs3-1681365384139) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00183.jpeg)]

использовать[]операторруководитькусочек

существовать ЧтоиндексначальствокусочекDataFrameсуществоватьграмматиканачальствоииспользоватьSeriesосуществлятьтакой жедействоватьтакой же。 поэтому,Мы Волясуществовать в этом разделе не упоминаем различные механизмы из деталей.,итолько查看отвечатьиспользовать ВDataFrameиз Несколькоиндивидуальныйпредставлятьсекс Пример。

использовать[]операторруководитькусочекчас,Волясуществоватьиндекси Нет Списокначальствоосуществлятькусочек。 Первые пять строк следующего содержания:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-7Z1kEtde-1681365384139) (https://gitcode.net/apachecn/apachecn-). ds-zh/-/raw /master/docs/learning-pandas-2e/img/00184.jpeg)]

иик ВнизвозвращатьсяотABTЭтикеткаприезжатьACNЭтикетканачинатьиз ХОРОШО:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-P9kQREki-1681365384139) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00185.jpeg)]

кусочекDataFrameтакжеподходящийиспользовать В.iloc[]и.loc[]свойство。 использовать Эти свойства считаются лучшими практиками.

использовать Логический выбор Приходитьвыбирать ХОРОШО

Доступно киспользовать Логический выбор для выбора строк. При применении Вфрейма данныхчас,Логический выборк может использовать несколько столбцов в изданных. Рассмотрите возможность запроса ниже,Должен Запрослоготипцена Низкий В100из Местоиметьзапас:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-hAS6enid-1681365384139) (https://gitcode.net/apachecn/apachecn-). ds-zh/-/raw /master/docs/learning-pandas-2e/img/00186.jpeg)]

Затем Доступно киспользовать[]оператор Воляэтотрезультатотвечатьиспользовать ВDataFrame,ктольковозвращатьсярезультатдляTrueиз ХОРОШО:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-BYnhYCUA-1681365384140) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00187.jpeg)]

Доступно киспользоватьскобки Волямногоиндивидуальный Условное освобождениесуществовать Вместе。 к Вниз Внутри Позволять Поискценасуществовать6и10междуиз Местоиметьзапасизкодицена:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-whu8bRxJ-1681365384140) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00188.jpeg)]

Обычно используют несколько переменных выполнения выбора. Внизлапшапроходить НаходитьSectorдляHealth CareиPriceбольшой Вилиждать В100.00из Местоиметь ХОРОШОПриходитьдоказыватьэтотодин点:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-5zCFrDXI-1681365384140) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00189.jpeg)]

Выбор между строками и столбцами

Обычно выборка состоит из подмножества строк и столбцов. Внизлапшапроходитьпервыйвыбиратьчасть ХОРОШОЗатемвыбирать Местонуждатьсяиз Список Приходитьиллюстрироватьэтотодин点:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ziPYKx69-1681365384140) (https://gitcode.net/apachecn/apachecn-). ds-zh/-/raw /master/docs/learning-pandas-2e/img/00190.jpeg)]

Подвести итог

существования В этой главе вы узналикаксоздавать Pandas DataFrameобъекткибаза ВРазличный Списоксерединаизиндексиценитьвыбиратьданныеиз Различныйметод。 этотнекоторый ПримериSeriesиз Примерсходство,Доказательство,Зависит от ВDataFrameиметь Списокиассоциацияиз Списокиндекс,поэтомуграмматикаиSeriesиметь Местодругой。

существовать Внизодинглавасередина,нас ВолядальшеиспользоватьDataFrameидти глубже Исследоватьданныедействовать,и着Тяжелый ВверноDataFrameструктураи Внутри Позволятьруководить Исправлять。

5. Структурные операции с кадрами данных

Pandas Предоставляет мощный механизм манипуляций, который можно использовать для просмотра данных. этотдобрыйисследоватьв целомс участиемверноDataFrameобъектизструктураруководить Исправлять,к Удалите ненужные изданные,Изменятьсейчасиметьданныеиз Форматилиот Чтоон ХОРОШОили Списоксерединаизданныесоздаватьпроизводнаяданные。 В этих главах показано, как выполнять эти мощные и важные операции.

В частности, существование в этой главе мы представляем:

  • Переименование столбцов
  • использовать[]и.insert()добавить вновый Список
  • расширение для добавления столбцов
  • использовать столбец добавления соединения
  • Изменение порядка столбцов
  • Заменить содержимое столбца
  • Удалить столбец
  • добавление нового банка
  • присоединиться к строке
  • введите расширение, добавьте и замените строку
  • использовать.drop()удалить ХОРОШО
  • использовать Логический выборудалить строку
  • использоватькусочекудалить ХОРОШО

Настроить Панды

Следующий код Воля — это следующий пример Настроить Панды среда. Это также загрузит S&P 500 данныенабор,кудобный Можно найти в примере используйте его:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-qf5t8IUN-1681365384140) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00191.jpeg)]

Переименование столбцов

Доступно киспользоватьподходящийкогда命имяиз.rename()метод Переименование столбцов。 Можетк Кэтотметодпередачаодинсловарьобъект,Ключ из указывает, что вы хотите переименовать столбец из Этикетка.,И каждый ключ имеет новое имя.

Внизлапшаиздействоватьвстреча Воля'Book Value'Списокизимя Изменятьдля'BookValue',Удалите пробелы и разрешите символу атрибута использовать доступ к столбцу «изданные».

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-l1VpuxAy-1681365384141) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00192.jpeg)]

кэтотдобрый Способиспользовать.rename()Волявозвращатьсяодинновыйизфрейм данные, где столбец из переименован, и данныедаот исходных данных в копироватьиз. Следующее содержимое подтверждает, что исходный файл не был изменен.

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-forHycic-1681365384141) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00193.jpeg)]

Чтобы существовать без копирования, измените его на месте. данных,Доступно киспользоватьinplace=Trueпараметр。

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-irpOY6qa-1681365384141) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00194.jpeg)]

сейчассуществовать Доступно киспользовать.BookValueсвойстводоступданные。

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-07jiuO23-1681365384141) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00195.jpeg)]

использовать[]и.insert()добавить вновый Список

Доступно киспользовать[]оператор Воляновый Списокдобавить вприезжатьфрейм данных。 позволятьнасдобавить водинимядляRoundedPriceизновый Список,Должен Список ВолявыражатьPriceСписоксерединаценитьиз Округление。

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-Cd5lGgBF-1681365384142) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00196.jpeg)]

Панды делают это из WAYда,первыйотsp500серединавыбиратьPriceСписокизданные,Затем ВоляSeriesсерединаиз Местоиметьценить Четыре舍пять入。 Тогда панды ВоляновыйизSeriesикопироватьDataFrameВыравнивание,и Воля Чтодобавить вдляимядляRoundedPriceизновый Список。 В конце колонки приезжатьиндексиз добавлен новый столбец «Воля».

.insert()метод Можетиспользовать Всуществоватьидентификация Расположениедобавить вновый Список。 ВнизлапшасуществоватьSectorиPriceмеждувставлятьRoundedPriceСписок:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-9tl0qzRd-1681365384142) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00197.jpeg)]

Добавить столбцы по расширению

Доступно киспользовать.loc[]свойствоикусочекдобавить в Список。 Внизлапшапроходить КимядляPERизsp500изребенокнабордобавить вновый Список,и Воля Местоиметьценитьинициализациядля0Приходить Демоэтотодин点。

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-fx8Vn5HT-1681365384142) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00198.jpeg)]

иметьсейчасиметьданныеизSeriesтакже Можеткпроходитьэтотдобрый Способдобавить в。 Внизлапша ВоляPERСписокислучайныйданныеизпоследовательность Добавлять。 По этому выравниванию необходимо использовать целевой фрейм данныхтакой жеизиндекс。

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-wB6jcUZ8-1681365384142) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00199.jpeg)]

использовать соединение для добавления столбцов

[]оператори.insert()метод Все Сразуземля Исправлятьглаз标фрейм данных。 Если вам нужен новый фреймворк с дополнительными столбцами из данных(Сохранять持原Приходитьизпостоянный),но Доступно киспользоватьpd.concat()функция。 этотсоздание функция нового каркаса данных,Чтосередина МестоиметьобозначениеизDataFrameобъектвсев соответствии сканонический порядоксоединятьсуществовать Вместе。

Внизлапшаизкодсоздавать ПонятноодинновыйизDataFrame,где из столбца Включать округленное изцена. Затем,этоиспользоватьpd.concat()иaxis=1ПриходитьвыражатьданныйизDataFrameобъектотвечатьвдоль着Списокосьсоединять(ииспользоватьaxis=0из ХОРОШОпо сравнению с)。

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-qGy55C62-1681365384142) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00200.jpeg)]

существовать Нет. 11 глава(слить,Связанные и измененные данные) в Воля более подробное подключение имени.

Объединение может привести к дублированию имен столбцов. Для демоэтотдобрый Состояние,позволятьнас Тяжелыйновыйсоздаватьrounded_price,но Воля Что命имядляPriceСписок。

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-FGvuNhTv-1681365384143) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00201.jpeg)]

В настоящее время объединение Воля приводит к появлению дубликатов столбцов.

[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ZBTWisM4-1681365384143) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00202.jpeg)]

Интересный,ты Доступно киспользовать.Priceсвойство Поискэтотдва Список。

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-SyNkXx9Y-1681365384143) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00203.jpeg)]

еслихотетьсуществоватьсценасерединаполучатьидентификацияизPriceСписок,Затем вам нужно нажать «Расположение» вместо имени «Поиск».

Изменение порядка столбцов

Выберите столбцы в нужном порядке, вы можете изменить порядок столбцов. Ниже примените обратный столбец, чтобы продолжить демонстрацию.

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-wlSdU7Uv-1681365384143) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00204.jpeg)]

На самом деле, нет возможности изменить порядок столбцов на месте. Видетьздесь

Заменить содержимое столбца

проходитьиспользовать[]оператор ВоляновыйизSeriesназначен насейчасиметь Список,МожеткзаменятьDataFrameиз Внутри Позволять。 к Вниз Демо Понятноиспользоватьrounded_priceсерединаизPriceСписокзаменятьPriceСписок。

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-rWNsCISS-1681365384144) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00205.jpeg)]

Списокизданныетакже Доступно киспользоватькусочекзаменять(Сразуземля)。

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-yO9384TQ-1681365384144) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00206.jpeg)]

Удалить столбец

Доступно киспользоватьфрейм данныхизdelзакрыватьключ字или.pop()или.drop()методотDataFrameсередина Удалить столбец。 Эти различия в поведении немного отличаются:

  • delВоляотDataFrameсерединаудалитьSeries(На месте)
  • pop()Волятакой жечасудалитьSeriesивозвращатьсяSeries(такжеда На месте)
  • drop(labels, axis=1)Волявозвращатьсяодинуже Удалить столбецизновыйфрейм данных(оригинальныйDataFrameобъектеще нет Исправлять)

Внизлапша Демо Понятнокакиспользоватьdelотsp500данныеизкопироватьсерединаудалитьBookValueСписок:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-HH9R9BSF-1681365384144) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00207.jpeg)]

к Внизиспользовать.pop()методудалитьSectorСписок:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-aMyqzT4r-1681365384144) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00208.jpeg)]

.pop()методиз Преимуществасуществовать Вэтодлянаспредоставилнеожиданно возникнутьиз Список。

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-E1o9K99Y-1681365384145) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00209.jpeg)]

.drop()метод Можетиспользовать Вудалить ХОРОШОи Список。 хотетьиспользоватьэто Удалить столбец,пожалуйстаобозначениеaxis=1

[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-uj36kGEG-1681365384145) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00210.jpeg)]

Добавлен новый банк

использоватьDataFrameиз.append()методосуществлять ХОРОШОиздобавление。 дополнительныйпроцесс ВолявозвращатьсяодинновыйизDataFrame,ипервыйдобавить в ПриходитьсоригинальныйDataFrameизданные,Затем Сновадобавить в Нет.два ХОРОШОизданные。 Добавление не выполняет выравнивание и может привести к дублированию индексных меток.

к Внизкод Демо Понятнодополнительныйдваотsp500данныесерединанести ВыбиратьизDataFrameобъект. Нет.одинDataFrameЗависит от ХОРОШО(в соответствии с Расположение)0,1и2Группастановиться,Нет.дваиндивидуальныйDataFrameЗависит от ХОРОШО(в соответствии с Расположение)10,11и2Группастановиться。 два者середина Все Включать Расположение2виз ХОРОШО(с ЭтикеткаABBV),к Демодублировать индекс Этикеткаиз создан.

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-N51f6EY6-1681365384145) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00211.jpeg)]

добавлениесерединаиспользоватьизDataFrameобъектиз Списокнабор Нет必такой же。 Рамка результатов данных Воля Зависит отдва Списокизинабор Группастановиться,Недостатокиз СписокданныенаполнениеиметьNaN。 к Вниз Внутри Позволятьпроходитьиспользоватьиdf1такой жеизиндекссоздавать Нет.трииндивидуальныйфрейм данных,но Толькоиметьодин Списокизимя Нетсуществоватьdf1середина Приходитьиллюстрироватьэтотодин点。

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ngtcuWms-1681365384146) (https://gitcode.net/apachecn/apachecn-). ds-zh/-/raw /master/docs/learning-pandas-2e/img/00212.jpeg)]

сейчассуществовать,насдополнительныйdf3иdf1

[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-XH6ZFlfk-1681365384146) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00213.jpeg)]

ignore_index=Trueпараметр Можетиспользовать Вдополнительный,и无нуждатьсямощный制отDataFrameбронироватьиндекс。 Когдандексценитьиз意义Нетбольшойииты Тольконадеяться Воляиметь Порядок увеличенияизцелое числоизкаскадданныеиспользоватьделатьиндексчас,Это полезно:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-lFEXN2Dm-1681365384146) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00214.jpeg)]

пожалуйста, обрати внимание,результатDataFrameиметьпо умолчаниюизRangeIndex,иииндекс(Symbol))серединаизданныеужеотрезультатсерединанад全排удалять。

присоединиться к строке

Доступно киспользоватьpd.concat()функцияипроходитьобозначениеaxis=0Воля ПриходитьсмногоиндивидуальныйDataFrameобъектиз ХОРОШОонэтотсоединять。 вдоль ХОРОШОосьсуществоватьдваDataFrameобъектначальстворуководитьpd.concat()изпо умолчаниюдействоватьиз Способи.append()методтакой же。

Проведение реконструкции предыдущего из приложенного примера из двух наборов данных и воля их связанных, может доказать это.

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-CPS8evYu-1681365384147) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00215.jpeg)]

если МестоиметьDataFrameобъектсерединаиз Списокнабор Все Неттакой же,но Pandas ВоляиспользоватьNaNнаполнениеэтотнекоторыйценить。

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-wpco8mJV-1681365384147) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00216.jpeg)]

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-TvLBpYK7-1681365384147) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00217.jpeg)]

из исходного объекта построчно копировать приведет к дублированию изиндекс Этикетка. keysпараметр Можетиспользовать В帮助区分один Группа ХОРОШОисточникс哪индивидуальныйфрейм данных。 ВнизлапшапроходитьиспользоватьkeysКвыражатьисточникобъектизиндексдобавить водинуровеньруководить Демо:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-xCXV7HCv-1681365384148) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00218.jpeg)]

Мы будем в главе 6 Более подробно иерархические индексы изучены в главе «Работа с индексами».

Добавляйте и заменяйте строки, расширяя

также Доступно киспользовать.locсвойство Воля ХОРОШОдобавить вприезжатьDataFrame.locизпараметробозначениехотетьместо ХОРОШОизиндекс Этикетка。 если Этикетка Нетжитьсуществовать,ноиспользоватьданныйизиндекс Этикетка Воляценитьдополнительныйприезжатьфрейм данных。 Если Этикетка содержит существующее, Воля заменяет значение из в указанной строке.

к Вниз Примерполучатьsp500изребенокнабор,идобавить вс ЭтикеткаFOOиз ХОРОШО:

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-CiGcZUL9-1681365384148) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00219.jpeg)]

пожалуйста, обрати внимание,Добавляет или заменяет строку,Все это сделают Изменить.

использовать.drop()удалить ХОРОШО

DataFrameиз.drop()метод Можетиспользовать Вудалить ХОРОШО。 .drop()методполучатьхотетьудалитьизиндекс Этикетка Списокповерхность,ивозвращатьсяDataFrameизкопировать,Указанная строка удаляется.

[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-nBvqVzuN-1681365384148) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00220.jpeg)]

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-fPNYfmVm-1681365384148) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00221.jpeg)]

использовать Логический выборудалить строку

Логический выбортакже Можеткиспользовать ВотDataFrameсерединаудалить ХОРОШО。 Логический результат выборки Воля возвращает выражение как True из ХОРОШОиз копии. хотетьудалить ХОРОШО,Просто создайте выражение,дляхотетьудалитьиз ХОРОШОвозвращатьсяFalse,Затем Воля Долженповерхностьвыражениеотвечатьиспользовать Вфрейм данных。

Внизлапшаиз Пример ДемоудалитьPriceбольшой В300из ХОРОШО。 Сначала составьте выражение.

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-UTFAMXOB-1681365384148) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00222.jpeg)]

в соответствии с этим результатом мы сейчас существуем, знаем, что существует 10 ХОРОШОизценабольшой В 300. Чтобы удалить эти строки изфрейма данные, пожалуйста, выберите выберите из дополнения.

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-iDafyi1r-1681365384149) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00223.jpeg)]

использоватькусочекудалить ХОРОШО

кусочек Можетиспользовать Вотфрейм Удалить записи в данных. Это и Логический выбор аналогичен изпроцессу существования. В этом процессе мы выбрали все строки, кроме строки к, которую нужно удалить.

гипотезанасхотетьотsp500серединаудалять去удалятьвпередтрииндивидуальный Записыватькснаружииз Местоиметь Записывать。 осуществлятьэтот Задачаизкусокда[:3],Он возвращает первые три строки.

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-qvMiYgd8-1681365384149) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00224.jpeg)]

пожалуйста, запомни,Зависит от ВЭтокусочек,поэтомурезультатдаоригинальныйфрейм данныхизвид。 этотнекоторый ХОРОШО尚еще нетотsp500данныесерединаудалить,верноэтоттри ХОРОШОиз Изменять Воля Изменятьsp500серединаизданные。 Предотвратите эту ситуацию из Правильные меры да Сделайте копию фрагмента, в результате чего будет копировано указание строки из данного кадра. данных。

[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-KVM9REvG-1681365384149) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00225.jpeg)]

Подвести итог

существования В этой главе вы узналикакиспользовать Pandas DataFrameобъектосуществлять Несколькодобрыйобщийизданныедействовать,Специальный дапроходитьдобавить вилиудалить ХОРОШОи Список Приходить ИзменятьDataFrameструктураиздействовать。 также,Мы рассмотрели, как приезжать заменяет изданные в конкретной строке и столбце.

существовать Внизодинглавасередина,Мы Воля изучаем индексизиспользовать подробнее,Для этой цели можно использовать данные поиска в объекте pandas.

boy illustration
Неразрушающее увеличение изображений одним щелчком мыши, чтобы сделать их более четкими артефактами искусственного интеллекта, включая руководства по установке и использованию.
boy illustration
Копикодер: этот инструмент отлично работает с Cursor, Bolt и V0! Предоставьте более качественные подсказки для разработки интерфейса (создание навигационного веб-сайта с использованием искусственного интеллекта).
boy illustration
Новый бесплатный RooCline превосходит Cline v3.1? ! Быстрее, умнее и лучше вилка Cline! (Независимое программирование AI, порог 0)
boy illustration
Разработав более 10 проектов с помощью Cursor, я собрал 10 примеров и 60 подсказок.
boy illustration
Я потратил 72 часа на изучение курсорных агентов, и вот неоспоримые факты, которыми я должен поделиться!
boy illustration
Идеальная интеграция Cursor и DeepSeek API
boy illustration
DeepSeek V3 снижает затраты на обучение больших моделей
boy illustration
Артефакт, увеличивающий количество очков: на основе улучшения характеристик препятствия малым целям Yolov8 (SEAM, MultiSEAM).
boy illustration
DeepSeek V3 раскручивался уже три дня. Сегодня я попробовал самопровозглашенную модель «ChatGPT».
boy illustration
Open Devin — инженер-программист искусственного интеллекта с открытым исходным кодом, который меньше программирует и больше создает.
boy illustration
Эксклюзивное оригинальное улучшение YOLOv8: собственная разработка SPPF | SPPF сочетается с воспринимаемой большой сверткой ядра UniRepLK, а свертка с большим ядром + без расширения улучшает восприимчивое поле
boy illustration
Популярное и подробное объяснение DeepSeek-V3: от его появления до преимуществ и сравнения с GPT-4o.
boy illustration
9 основных словесных инструкций по доработке академических работ с помощью ChatGPT, эффективных и практичных, которые стоит собрать
boy illustration
Вызовите deepseek в vscode для реализации программирования с помощью искусственного интеллекта.
boy illustration
Познакомьтесь с принципами сверточных нейронных сетей (CNN) в одной статье (суперподробно)
boy illustration
50,3 тыс. звезд! Immich: автономное решение для резервного копирования фотографий и видео, которое экономит деньги и избавляет от беспокойства.
boy illustration
Cloud Native|Практика: установка Dashbaord для K8s, графика неплохая
boy illustration
Краткий обзор статьи — использование синтетических данных при обучении больших моделей и оптимизации производительности
boy illustration
MiniPerplx: новая поисковая система искусственного интеллекта с открытым исходным кодом, спонсируемая xAI и Vercel.
boy illustration
Конструкция сервиса Synology Drive сочетает проникновение в интрасеть и синхронизацию папок заметок Obsidian в облаке.
boy illustration
Центр конфигурации————Накос
boy illustration
Начинаем с нуля при разработке в облаке Copilot: начать разработку с минимальным использованием кода стало проще
boy illustration
[Серия Docker] Docker создает мультиплатформенные образы: практика архитектуры Arm64
boy illustration
Обновление новых возможностей coze | Я использовал coze для создания апплета помощника по исправлению домашних заданий по математике
boy illustration
Советы по развертыванию Nginx: практическое создание статических веб-сайтов на облачных серверах
boy illustration
Feiniu fnos использует Docker для развертывания личного блокнота Notepad
boy illustration
Сверточная нейронная сеть VGG реализует классификацию изображений Cifar10 — практический опыт Pytorch
boy illustration
Начало работы с EdgeonePages — новым недорогим решением для хостинга веб-сайтов
boy illustration
[Зона легкого облачного игрового сервера] Управление игровыми архивами
boy illustration
Развертывание SpringCloud-проекта на базе Docker и Docker-Compose