1. Панды ианализ данных
Добро пожаловать в Панды Учебное пособие»! существуют В этой книге мы, Воля, проводим соответствующее наше исследование. Pandas путешествие, это способ Python Язык программирования из анализа с открытым исходным кодом данныхбиблиотека. pandas Библиотекапредоставилиспользовать Python Создавайте высокопроизводительные и простые в использовании инструменты структурного анализа. pandas из языков статистического программирования R принести в Python много преимуществ,Специальный дафрейм данныхобъекти R Сумка(Напримерplyr
иreshape2
),и Воляони размещаютсуществовать Можносуществоватьвнутреннийиспользоватьиз Python в библиотеке.
В этой первой главе мы потратим некоторое время на понимание Pandas и как он адаптируется к большому анализу данныхизнуждаться。 Это сделает Pandas Заинтересованные читатели чувствуют, что они существуют, более широкий анализ данныесерединаизстатуса, не обязательно полностью сосредотачиваясь наиспользовать Pandas подробности. Цель состоит в том, чтобы научиться Pandas В то же время вы также понимаете, почему в хранилище существуют эти функции для поддержки выполнения анализа. данных Задача。
Итак, давайте войдём. В этой главе мы рассмотрим:
pandas это Python Библиотека, содержащая расширенные структуры данных и инструменты, созданные для помощи Python Программисты выполняют мощный анализ данных。 Pandas изконечная цельизда Помогите вам быстро обнаружитьданныесерединаизинформация,А Воляинформация определяется как основной смысл.
Уэс Мак Кинни начал разработку Pandas в 2008 году. Он был открыт в 2009 году. Pandas в настоящее время поддерживается и активно развивается различными организациями и участниками.
оригинальный дизайн Pandas приезжать, чтобы рассмотреть финансовые вопросы, особенно если это связано с данными временных операции рядов и способность работать с историческими запасами. Существует множество проблем, связанных с обработкой финансовой информации, вот некоторые из них:
Чтобы сделать это,Нужен инструмент,Позволяет нам выполнять поиск по одномерным и многомерным данным.,индекс,Чистый и опрятный,пластическая хирургия,слить,кусочек и выполнить различные анализы.,Сумказаключенный вдольданныеавтоматическое выравниваниеиз Чужакданные。 Общий набор индексных тегов. Это Pandas Там, где он родился, он имеет множество полезных и мощных функций, таких как:
Series
иDataFrame
объект,проходитьинтегрированныйиндексруководить Обработка данныхМощный набор функций, а также Python и Python Бесшовная интеграция других инструментов в экосистему позволила Pandas Широко используется во многих областях. Он широко используется в академических и деловых областях, включая финансы, нейронауки, экономику, статистику, рекламу и сетевой анализ. это стало наукой о Домашняя страница данных представляет данные, один из наиболее предпочтительных инструментов для выполнения операций и анализа.
В течение долгого времени Питон существовать Обработка данныхи Подготовить всегда было исключением,носуществоватьанализ данныхи Моделированиеаспектноисключение。 pandas помогает восполнить этот пробел, позволяя вам Python выполнить весь анализ рабочий процесс обработки данных без необходимости переключаться на более конкретный домен В из языка (например, Р). Это очень важно, потому что знакомство Python людей, чем R (дополнительный пакет статистики), полученный R из многих выражений данных и рабочих функций, полностью сохраняя при этом чрезвычайно богатый Python в экосистеме.
и IPython,Блокнот Юпитераи множество других Библиотек вместе взятых и множество других инструментов по сравнению с Всуществовать. Python в исполнении анализ данныеизсредасуществовать превосходит других с точки зрения производительности, продуктивности и возможностей совместной работы. Это привело к широкому распространению среди пользователей во многих отраслях. Pandas。
Мы живем в мире, где каждый день создается и хранится огромное количество информации. Эти данные поступают от большого количества информационных систем, устройств и датчиков. Почти все, что вы делаете, и проекты, которые вы для этого используете, генерируют данные, которые можно зафиксировать или зафиксировать.
Это во многом подтверждается повсеместным характером услуг, подключенных к сети, и массовым увеличением средств хранения данных. Это в сочетании с постоянным снижением затрат на хранение.,сделать захвати Хранение даже самого тривиальногоизданныевсе становятся эффективными。
Это привело к накоплению большого количества данных и Подготовлению к доступу. но,Данные распространяются по всему киберпространству.,на самом деленельзя назватьинформация。 Часто это коллекция записей о событиях, будь то финансовые записи, ваше взаимодействие с социальными сетями или персональный монитор здоровья, который отслеживает ваше сердцебиение в течение дня. Эти данные хранятся в различных форматах, в разбросанных местах, и их необработанный характер действительно дает много информации.
Логически весь процесс можно разделить на три основные предметные области:
Эти три дисциплины могут во многом пересекаться. Где заканчивается одна сторона и начинается другая, остается открытым для интерпретации. Для целей этой книги мы дадим этому определение в следующих разделах.
Данные распространяются по всей планете. Он хранится в разных форматах. Уровень его качества сильно варьируется. Следовательно, необходимо собрать существующие вместе с ВВоляданными и преобразовать их в пригодные для использования формы принятия решений из инструментов и процессов. Для этого требуются оперативные данные для анализа. Подготовить инструмент необходимо для выполнения множества различных задач и функций. К обязательным функциям этого инструмента относятся:
житьсуществоватьмного Обработка данныхинструмент。 Каждый проект в этом списке имеет различную поддержку, методы развертывания и пользовательский опыт. Эти инструменты включают реляционные базы данных (SQL Сервер, Oracle), электронные таблицы (Excel), системы обработки событий (например. Spark), а также более общие инструменты, такие как R и Pandas)。
анализ данныхдаотданныесоздавать смыслизпроцесс。 иметь количественный смыслизданныеобычно называетсяинформация。 анализ данныхдапроходитьсоздаватьданные Модельиматематика Модель Приходитьотданныесерединасоздаватьинформацияизпроцесс。 Его операции часто пересекаются, и различие между ними не всегда четкое. много Обработка инструмент данных также включает функцию анализа и анализа данныхинструментв целомнестидля Обработка данных Функция。
наука о данныхдаиспользоватьстатистикаианализ данныхпроцесс Приходить ПонятноразвязатьданныесерединаФеноменизпроцесс。 наука о Данные обычно начинаются с информации, а затем переходят к более сложному анализу информации. Эти области охватывают многие области, такие как математика, статистика, информатика, компьютерные науки, машинное обучение,Классификация,кластерный анализ,данныекопать,данные Библиотекаи Визуализация。 наука о данныхдамеждисциплинарныйиз。 Его подход к анализу предметной области часто сильно отличается и зависит от предметной области.
Pandas первыйсуществовать Обработка Отличная производительность в данных. Книга Воляиспользовать Pandas Соответствует всем требованиям, перечисленным ранее. Это Pandas Ядро также находится в центре внимания этой книги.
Стоит отметить, что у Pandas есть конкретная цель дизайна: подчеркнуть данные.
но Pandas предоставляет анализ выполнения данныеиз Множество функций. Эти функции обычно вращаются вокруг Описательная статистикаифинансовые потребностииз Функция(Например Актуальность)。
Поэтому панды сам не данаука о данныхинструмент Сумка。 Это скорее инструмент манипуляции с некоторыми аналитическими возможностями. Pandas Явно воля комплекс из статистики, финансов и других видов анализа оставлена на усмотрение других. Python библиотека, например SciPy, NumPy, scikit-learn и зависимости от библиотеки Graphics, например matplotlib и ggvis использовать Вданные Визуализация。
Этот фокус на самом деле Pandas относительно R и другие сильные стороны других языков, потому что Pandas Приложения могут использовать преимущества Python Сообщество существует в других местах. Уже создано и протестировано из мощного Python Обширная сеть фреймворков.
Основная цель этой книги — научить вас делать это тщательно. Pandas манипулировать данными. но есть и второстепенная, возможно, не менее важная цель, дашоу. Pandas Как адаптироваться к анализу данныеразделение/наука Домсуществовать в повседневной жизни из процесса.
Шаги, необходимые для анализа данных, описаны на веб-сайте Pandas:
Этот маленький списокэто очень ХОРОШО, исходное определение,но он не может охватить весь объем процесса и создать Pandas, используя множество реализованных функций. Следующее содержание Воля расширяет этот процесс.,И задать рамки всего пути.
предложенныйизпроцесс Воляназываетсяпоток данных,А существование представлено на картинке ниже:
Процесс устанавливает структуру, в которой В определяет логические шаги, которые необходимо предпринять при работе с данными. Теперь давайте кратко рассмотрим каждый этап процесса производства, использования и использования. Pandas изанализ участник данных Воля выполняет некоторые задания.
Важно понимать, что это не чисто линейный процесс. Лучше всего это делать интерактивно/гибко/итеративно.
Первым шагом в решении любой проблемы с данными является определение проблемы, которую необходимо решить. этот СразудаКонцепция,это подсказывает, что мы хотим сделатьидоказыватьизиметь значениеиз Концепция。 Концепция обычно включает в себя предположения о доступных для принятия обоснованных решениях и шаблонах.
Эти решения обычно принимаются в масштабах всего предприятия.,носуществовать Другие предметы(Напримернаукаи Исследовать)серединатакжедатаким образом。 Сейчас в тренде понимание операций бизнеса, поскольку на понимании данных часто можно заработать много денег.
но,Что мы обычно хотим сделатьиз Решать? Вот ответы на несколько часто задаваемых вопросов:
Этот список ни в коем случае не является исчерпывающим, но он охватывает значительный процент причин, по которым кто-либо может предпринять эти усилия. Чтобы получить ответы на эти вопросы, необходимо собрать и разобраться в связанных с ними вопросах. Это включает в себя определение данных, подлежащих изучению, преимуществ исследования, способа получения данных, критериев успеха и, в конечном итоге, способа предоставления информации.
Pandas Он сам по себе не предоставляет вспомогательных инструментов Концепции. но Как только вы освоите использование Pandas Благодаря знаниям и навыкам, вы естественным образом поймете, куда ездить. Pandas Как Воля может помочь вам предложить Идею. Потому что у вас есть мощный инструмент, с помощью которого можно построить множество сложных гипотез.
Если у вас появилась идея, вам нужно найти данные, чтобы попытаться подтвердить свою гипотезу. Эти данные могут поступать изнутри организации или от внешних поставщиков данных. Данные обычно доступны в виде заархивированных данных, а также доступны в живом виде (хотя живая обработка Известный своими инструментами обработки данных Pandas)。
Даже если они получены из источника данных, который вы создаете, или внутри вашей организации, данные часто бывают очень необработанными. Необработанные данные означают, что данные могут быть беспорядочными, иметь разные форматы и быть ошибочными; относительноподдерживаю тебяизанализировать,Это может быть неполным,Требуется ручное расширение.
В мире много бесплатных данных. Многие данные не бесплатны и на самом деле стоят больших денег. Некоторые из них доступны бесплатно через общедоступные API, другие доступны по подписке. Данные, за которые вы платите, обычно чище, но это не всегда так.
В обоих случаях Панды Все они предоставляют набор мощных и простых инструментов Виспользовать для Вот различных источников Поисковых данных, и эти данные могут иметь различные форматы. pandas Это также позволяет нам не только Поискданные, но и кпроходить. pandas Структуры данных обеспечивают исходную структуру ваших данных без необходимости вручную создавать сложное кодирование, которое может потребоваться другим инструментам или языкам программирования.
существовать Подготовитьпроцесссередина,уже Подготовить Так оригинальноданныекдляисследовать。 Подготовить работу обычно это Нет очень интересного процесса. Обычно при покупке данных изданных возникают различные проблемы, связанные с качеством. Вы можете потратить много времени на решение этих проблем с качеством, что обычно занимает очень мало времени.
Почему? Ну, причин много:
Подготовитьпроцесс направлен на решение этих проблем. Pandas для Подготовитьданные(обычно называетсяаккуратныйданные)предоставилмногоудобныйвыгодаизинструмент。 Эти функции включают обработку отсутствующих данных, преобразование типа данные, использование преобразования формата, изменение частоты измерений, воля из нескольких групп данных из данных соединений, отображение/преобразование символов воля в общее представление и группировка данных воля из интеллектуальных методов. Мы углубимся во все это.
Обдумывание предполагает возможность интерактивно нарезать кусочки данных,к Постарайтесь узнать это быстро. Обдумывание может включать в себя различные задачи,Например:
исследоватьда Pandas главное преимущество. Хотя Доступно киспользоватьбольшоймногоматематический язык программированияруководитьисследовать,но Каждый язык имеет свойизцеремонияуровень – существования Сколько Неисследованной секс-работы необходимо выполнить, прежде чем вы сможете это выяснить.
Когда IPython и/или Блокнот ЮпитераизЦикл чтения-оценки-печати(REPL)природа Вместеиспользоватьчас,Pandas Создадим небольшой церемонияизис по охране окружающей среды. pandas Выразительность синтаксиса позволяет кратко описывать сложные структуры манипулирования данными, а результаты каждой операции, выполняемой с данными, немедленно представляются для проверки. Это позволяет вам быстро определить достоверность того, что вы только что выполнили, без необходимости перекомпиляции и полного повторного запуска программы.
Стадия существования Моделирование, вы Воляисследоватьпроцессосноватьизнайти Формализация — это четкое объяснение шагов и структуры данных, необходимых для достижения желаемого значения включения в приезжающие. ЭтоМодель,да Две структуры данных к&от исходных данныхприезжают вашу информацию и вывод из комбинации шагов кода.
Моделированиепроцессда Итерироватьиз,существоватьэтотпроцесссередина,Вы можете просмотреть данные, чтобы выбрать изпеременные, поддерживающие анализ.,Организация переменнойк для процесса анализа входных данных,осуществлять Модельиправильный Конечно Модельоригинальная гипотезаизуровень поддержки。 Он может включать структурирование и формализацию, но также может сочетать в себе методы из различных областей анализа, таких как (но не ограничиваясь ими) статистика, обучение Исследование операций.
Для этого Панды Предоставляет широкий набор инструментов. существоватьэтотшагсередина,Тебе, Воля, нужно больше от работы,отисследоватьданныеприезжатьсуществоватьDataFrame
объектсередина Формализацияданные Модель,иправильный Сохранятьсоздаватьэтотнекоторый Модельизпроцесскраткий。 Кроме того, на основе С помощью Python вы можете воспользоваться его мощными возможностями для создания программ, автоматизирующих процессы от начала до конца. Созданная вами модель является исполняемой.
С аналитической точки зрения панды Предлагает множество функций, самая яркая из которых — изда против описания. статистикаинформацияиз Интегрированная поддержка, данные возможности позволяют решать многие виды задач. И потому что Pandas основан на Python из, поэтому, если вам нужны более продвинутые возможности анализа, вы можете легко получить доступ к его обширным Python Интеграция с другими частями научной среды.
Предпоследний этап процесса обычно представляет собой отчет, в котором ваши выводы будут представлены другим. Вам нужно будет создать убедительное и подробное описание вашего решения. Обычно доступно киспользовать Python серединаиз Различный Рисунокинструменти Руководствосоздавать Демо Рукопись Приходитьнадстановитьсяэтотдействовать。
Блокнот Юпитерадамощныйизинструмент,Доступно для вас Pandas Анализируйте и создавайте демонстрационные документы. Эти блокноты позволяют выполнять код и предоставляют богатые возможности Markdown Функции для аннотирования и описания выполнения в нескольких точках приложения. этотнекоторый Можетиспользовать Всоздавать Нет Часто эффективениз Можетосуществлять Демо Рукопись,Эти демо-рукописи визуально богаты фрагментами кода.,Стилизованный текст и графика.
Мы будем в главе 2 Глава «Беги Краткое введение в Панды" Блокнот Юпитера。
Важным аспектом исследований является обмен информацией и обеспечение воспроизводимости результатов исследования. люди часто говорят,Если другие исследователи не могут проверить ваши результаты,Тогда вы ничего не докажете.
Счастливая изда,Для тебя,проходитьиспользовать Pandas и Python, вы сможете легко воспроизвести свой анализ. Это можно сделать, поделившись драйвером Pandas Закодированный Python код и данные для завершения.
Блокнот Юпитера также предоставляет удобный способ упаковки кода и приложений и может кпроходить Установить Блокнот Юпитераи Легко поделиться с кем-либо еще. В Интернете существует множество бесплатных и безопасных сайтов для обмена файлами, которые позволяют создавать или развертывать Блокнот Юпитера поделиться.
Выкл. Вданные операции,Анализ инаукаиз Нет очень важен с небольшой да,этоэто Итерироватьпроцесс。 Хотя ранее обсуждалось, что естественный процесс существует в прямом направлении, но в конечном итоге вы волясуществовать этот процесс в прямом и обратном направлении. Например,существоватьисследоватьэтап,Выявить аномалии, связанные с проблемами чистоты, можно на этапе и Подготовить.,И нужно вернуться и исправить эти проблемы.
Этопроцессфуниз часть. Вы находитесь в приключении существования, чтобы решить первоначальные проблемы, получая при этом прогрессивное понимание существованияиспользоватьизданныеиз. Эти идеи могут побудить вас задать новые вопросы, более точные вопросы или понять, что ваш первоначальный вопрос не был тем вопросом, который нужно было задавать. Этот процесс действительно является путешествием, а не обязательно пунктом назначения.
Ниже представлена краткая карта различных этапов этого процесса. найти Изучите эти шаги в этой книге. Не волнуйтесь, если предыдущий процесс, шаг назад и глава сохраняются. Эта книга проведет вас шаг за шагом в логической последовательности. Pandas,и Можно получить из Рассмотрите соответствующие этапы из в каждой главе процесса прибытия.
шаги в процессе | Расположение |
---|---|
Концепция | Концепцияданаука о данныхсерединаиз Инновациипроцесс。 Вам нужна идея. Тот факт, что вы читаете эту статью, дает вам право, потому что вам нужно проанализировать некоторые данные и надеяться сделать это в будущем. |
Поиск | данныеиз Поискосновнойсуществовать Нет. 9 Описано в главе «Доступ к данным». |
Подготовить | данные Подготовитьосновнойсуществовать Нет. 10 Это описано в главе «Организация данных», но это общая тема на протяжении большей части этой главы. |
исследовать | обдумывать всю книгу из 3 глава“использоватьпоследовательностьэкспресс-синглпеременнаяданные”,прямойприезжать Нет. 15 Глава «Исторический анализ цен на акции». но самое нужное обсуждение из главы да 14 глава“Визуализация”и Нет. 15 Глава «Исторический анализ цен на акции», Начать смотреть анализ приезжать данныхизрезультат。 |
Моделирование | Моделированиеизфокусда Нет. 3 главаи“использовать последовательность пандэкспресс-синглпеременнаяданные”,Нет. 4 Глава «Использование фреймворка» таблица данныхсредств Разнообразныйданные”,Нет. 11 Глава «Состав, объединение и переосмысление данных», с. 13 Глава «Моделирование времени по хронологии», посвященная финансам из главы 15 Глава «Исторический анализ цен на акции». |
Демо | Демода Нет. 14 глава“Визуализация”изосновнойглазиз。 |
Повторение | Повторениеиз содержания на протяжении всей книги,Например Блокнот Юпитера приводит примеры. вблокнотидти на работу,По умолчанию,Ваш инструмент «Воляиспользовать Повторение»,А делиться блокнотом можно разными способами. |
изучение Pandas ианализ данных, вы столкнетесь со многими связанными с этим исследованиями, анализом концепций моделирования. Рассмотрим некоторые из этих понятий и их Pandas отношение.
существоватьполеиспользоватьданныечас,Вы столкнетесь с несколькими основными категориями приезжающих.,этотнекоторыйданныенуждатьсябудучи принужденнымдля Pandas структура данных. Их важно понимать, поскольку инструменты, необходимые для каждого типа, будут разными.
pandas по существу обрабатывает структурированные данные с помощью В, но предоставляет множество инструментов, облегчающих преобразование воля Нетструктурированных данных в средства, которыми мы можем манипулировать.
структурированныеданныедасуществовать записи или файлы, организованные в виде фиксированных полей любого типа.,Напримерсвязьданные Библиотекаиэлектронныйповерхностьсеткасерединаизданные。 Структурированные данные зависят от Вданной модели, организации данных и значения модели данных, а также от того, как обычно следует обращаться с данными. этот Сумкавключатьобозначениеданныеизтип(целое число,число с плавающей запятой,строка и т. д.),к И любые ограничения на данныеиз,Например, количество символов,Максимальное значение и минимальное значение или Ограничение на определенный набор значений из.
структурированныйданныеда Pandas Дизайн для использования изтипа данных。 какнас ВоляпервыйиспользоватьSeries
ЗатемиспользоватьDataFrame
Что ты видишьприезжатьизтаким образом,pandas Воляструктурированные данные организованы в один или несколько столбцов данных, каждый столбец имеет определенный тип. данных,Затем добавьте ноль или несколько строк данных и после этого.
Нетструктурированный данныеда не имеет какой-либо определенной организации изданных, и эти данные не разбиты конкретно на конкретные типы по строго определенным столбцам. Это доступно во многих типах информации, таких как фотографии и графические изображения, видео, данные потоковых датчиков, веб-страницы, PDF-файлы. Документы, PowerPoint Демонстрационные рукописи, электронные письма, записи в блогах, вики Документ текстовой обработки.
Pandas Нетструктурированные данные не могут быть обработаны напрямую, но они предоставляют множество от Нетструктурированных источников для извлечения структурированных данных. В качестве конкретного примера мы рассмотрим панд иметь Поисквеб-страницаи Воля Извлечение конкретного контентаприезжатьDataFrame
серединаизинструмент。
Половинаструктурированныйданные Подходящий Нетструктурированныйданные。 Ее можно рассматривать как своего рода структурированные, но в ней отсутствуют строгие изданные Модель структуры. JSON да Половинаструктурированныйданныеизформа。 ХОРОШО JSON С определенным форматом, но не всегда строго соблюдает конкретную схему данных. В большинстве случаев данные Воля представляют собой повторяемый шаблон и могут быть легко преобразованы в структурированныйтип. данных,Например pandas DataFrame
,нопроцесс может потребовать от вас предоставить некоторые рекомендации по указанию или обязательному типу данных.
в праве Pandas При выполнении моделирования данных мы Воля выполняем Моделирование на одной или нескольких переменных и ищем статистическую значимость между значениями или несколькими переменными из. переменнаяиз Определить недаязык программированиясерединаизпеременная,идастатистикапеременная№1。
переменнаяда может измерять или подсчитывать любую характеристику, количество иликоличество. переменнаяк названа так потому, что значения существовать могут различаться между единицами популяции, а значения могут меняться с течением времени. запасценаценить,возраст,пол,Операционные доходы и расходы,страна рождения,капитальные затраты,уровень класса,Цвет глаз и тип автомобиля дапеременнаяиз примера.
использовать Pandas час,мы встретимсяприезжать Несколько широкихизстатистикапеременнаятип:
категорияпеременнаяда Можетк Выбиратьиспользоватьограниченныйколичество(в целомдазафиксированныйколичество)из Можетспособныйценить№1изпеременная。 каждый Можетспособныйизценитьобычно называетсяуровень。 Pandas серединаизкатегорияпеременнаяиспользоватьCategoricals
выражать,Это Что-то вроде Pandas тип данные, изкатегорияпеременная в статистике. категорияпеременнаяот Примерdapol,социальный класс,группа крови,Страна/регион,наблюдатьвремяилиоценка(Например Шкала Лайкерта)。
непрерывныйпеременнаяэто Можетк Принимать неограниченно(Нет Можетчислоколичество)ценитьизпеременная。 Наблюдения могут принимать любые значения между некоторым набором действительных чисел. непрерывныйпеременнаяиз Пример Сумкавключатьвысокий,времяитемпература。 Pandas изнепрерывныйпеременный с использованием типов с плавающей запятой или целочисленных типов (Python Нативное (native) представление, обычно существующее, представляет собой конкретную переменную множественную выборку из коллекции.
Дискретныйпеременнаяэтопеременная,Чтосерединаизценитьбаза Внабор разныхизобщийценитьизсчитать。 Дискретная переменная не может давать оценку между любыми двумя переменными. Примеры дискретнойпеременной включают зарегистрированный автомобиль и количество детей, местонахождение предприятия и количество детей в семье, все из которых измеряют всю единицу (например, 1、2 или 3 ребенок). Дискретныйпеременнаяв целомсуществовать Pandas серединаиспользоватьцелое числовыражать(или Изредкаиспользоватьчисло с плавающей запятойвыражать),Он также обычно представлен двумя или несколькими переменными наборами выборок.
данные временных рядовда Pandas Первоклассная сущность в . Время Pandas Внутренняя изпеременная выборка добавляет важное дополнительное измерение. Обычно переменное время выборки не имеет значения. То есть время выборки не имеет значения. носуществовать Так происходит во многих случаях. Время посуществовать Определенный временной интервал образует Дискретнуюпеременную выборку, в которой наблюдения имеют естественный временной порядок.
времяпоследовательностьизстохастическая Модель обычно отражает тот факт, что наблюдения, близкие по времени, более тесно связаны, чем наблюдения, находящиеся далеко. Модели временных рядов обычно используют естественное одностороннее упорядочение времени, чтобы представить значения данного периода времени как полученные из прошлых значений, а не из будущих значений.
Pandas из распространенной ситуации — финансовые данные, где переменная представляет собой стоимость акций в том виде, в каком они существуют, изменяются в пределах фиксированных интервалов времени в течение дня. Мы часто хотим определить изменения в скорости изменения цен за определенный интервал времени. Нам также может потребоваться сопоставить цены нескольких акций за определенный интервал времени.
Это Pandas — важная и мощная функция, поэтому мы посвятим этой концепции целую главу.
существоватькнигаискусствосередина,Мы, Воля, изучаем только статистику и анализ. данныхизтехнологияпроцесс。 но обратите внимание изда на некоторые аналитические концепции, часть из которых дасуществовать Pandas Реализация, созданная непосредственно внутри компании. Другим нужно полагаться на другую библиотеку, например SciPy,носуществоватьи Pandas Вы также можете столкнуться с ними во время совместной работы, поэтому полезно их вызвать.
Качественный анализ – это научное исследование данных, которые можно наблюдать, но невозможно измерить. Основное внимание уделяется классификации качества данных. Примерами качественных данных могут быть:
Количественный анализ — это исследование фактических значений данных и фактическое измерение предметов в форме данных. Обычно это следующие значения:
Pandas В основном занимается количественными данными, предоставляя вам широкий спектр инструментов для представления наблюдаемых переменных значений. Pandas Не обеспечивает качественный анализ, но позволяет представить качественную информацию.
посмотреть на это под определенным углом,Статистика исследований переменнаяиз практики,Особенно да для тех переменнаяиз наблюдений. Многие статистические данные основаны наверноодининдивидуальныйпеременнаяизанализировать Приходите виз,этотназываетсяодинпеременнаяанализировать。 Самая простая форма одиночного переменного анализа — анализ данных. Он не обрабатывает причины или отношения, обычно описываемые с помощью В или агрегации данных, и существуют, где искать закономерности.
Разнообразныйанализироватьда Что-то вроде Моделированиетехнология,Среди них есть два или несколько влияний на результаты эксперимента из-за переменной выходной мощности. Множественный переменный анализ обычно связан с такими понятиями, как Актуальностьивозвращаться.,Это помогает нам понять взаимосвязь между несколькими переменными и то, как эти взаимосвязи влияют на результаты.
Pandas В основном предоставляет базовые функции анализа одиночных переменных. Эти функции обычно да Описательная статистические, хотя в рамках существования существует поддержка таких концепций, как ассоциация (поскольку они существуют и очень распространены в других областях финансов).
Доступно киспользовать StatsModels Выполните другую, более сложную статистику. Опять же, это не само по себе Pandas из слабых сторон, и это особенности дизайнерских решений, которые позволяют этим концепциям доминировать над другими специализированными Python обработка библиотеки.
Описательная статистикаинформациядаагрегация Учитывая набор данных из функции, обычно этот набор данных представляет собой одну переменную совокупность или выборку. Они описывают центральную тенденцию и зданные множества и меры формы, к и изменчивость и дисперсию и з меры.
Например,к Внизда Описательная статистикаинформация:
Как мы увидим, панды Series
иDataFrame
объектинтегрированный Понятновернобольшойколичество Описательная статистикаинформацияизподдерживать。
логическая статистикаи Описательная Статистически не существует, логично Статистика пытается сделать отданные выводы, не обобщая их. логическая Примеры статистики включают в себя:
Эти методы рассуждения обычно начинаются с Pandas Отложите использование других инструментов, например. SciPy и StatsModels。
стохастическая модельда. Форма статистического моделирования, состоящая из одной или нескольких случайных переменных, обычно включающих используемые данные. временных рядов。 стохастическая Моделирование расчетных результатов существует на основе шансов в пределах определенного прогнозируемого диапазона, чтобы прогнозировать различные ситуации в зависимости от условий.
Пример стохастического моделирования методом Монте-Карло. Моделирование Монте-Карло обычно используется для оценки финансового портфеля. Повторяющееся моделирование инвестиционных портфелей на рынке используется для моделирования эффективности портфелей. На моделирование влияют различные факторы и распределение вероятностей доходности компонентов.
Pandas длянаспредоставилDataFrame
серединастохастическая модельиз Базовыйданныеструктура,в целомиспользоватьданные временных рядов Приходить Учреждатьибегатьстохастическая модель。 Хотя киспользовать pandas и Python Напиши себе изстохастическое модели анализируют код, но существуют во многих случаях, кроме существования и з Библиотеки (например PyMC) может упростить такие задачи.
Байесовская статистика — это метод статистического вывода, полученный на основе теоремы Байеса, математического уравнения, основанного на простых аксиомах вероятности. Это позволяет аналитикам рассчитывать условные вероятности для любого интересующего условия. Условная вероятность – это вероятность события А при наступлении события Б.
Итак, с точки зрения вероятности, событие данных уже произошло и было собрано (потому что мы знаем вероятность). проходитьиспользовать Теорема Байеса,насудобный Можетквычислитьуженаблюдатьприезжатьизданныеданныйилик Это условиеиз Различныйзаинтересованныйизвещьиз Вероятность。
Байесовское моделирование выходит за рамки этой книги, но снова воспользуемся Pandas Хорошо работает с базовыми данными Модель, а затем использует их, например PyMC Подобные библиотеки использовались для реального анализа.
Актуальностьданаиболее распространенныйизстатистикаданные№1,прямойловить Учреждатьсуществовать Pandas DataFrame
середина。 Актуальностьэтоодинодинчисло,Опишите степень связи между двумя переменными,В частности, да описывает степень связи между этими двумя наблюдениями по продолжительности.
Типичным примером является определение того, насколько тесно две акции связаны друг с другом с течением времени. Если изменения близки, корреляция между двумя акциями высока, если нет заметной закономерности, то между ними нет корреляции. Этоиметьценаценитьизинформация,Можно найти виспользовать среди многих инвестиционных стратегий.
Степень корреляции между двумя акциями также может незначительно различаться в зависимости от временного интервала и интервала всего набора данных. К счастью, панды Имеет мощный функционал, позволяющий легко изменить эти параметры и повторно запустить ассоциацию. Далее в книге «Волясуществовать» несколько мест высоты. Актуальность。
возвращатьсяда Что-то вродестатистикаколичествостепень,использовать ВВероятно, из-запеременнаяикакой-то другойпеременнаямеждуизсвязьмощныйстепень。 Его можно использовать, чтобы понять взаимосвязь между переменной и отношением. Финансовые аспекты на примере понимания цен на сырьевые товары, вещей, которыми торгуют эти товары, и отношения к акциям компаний.
Первоначально один был построен прямо на Pandas серединаreturnModel, но ужеварп-сдвигприходите StatsModels в библиотеке. Это показывает Pandas Общие закономерности. Pandas Обычно некоторые концепции уже встроены в систему, и по мере их развития считается, что они наиболее эффективно вписываются в другие концепции. Python библиотека. Этохорошийдаплохой。 Первоначально непосредственно в pandas Используйте его очень хорошо, но когда вы обновляете новую версию pandas , это может сломать ваш код!
Pandas да Python Внутрианализ данныхинаука о Небольшой, но важный компонент экосистемы данных. Для справки, вот еще несколько важных моментов, на которые стоит обратить внимание. Python библиотека. Этот список не является исчерпывающим, но в нем описаны некоторые проблемы, с которыми вы можете столкнуться.
NumPy даиспользовать Python Базовый набор инструментов для научных вычислений, включенный в большинство современных Python В релизной версии 。 Фактически, он строит Pandas избазафундаментинструменткоробка,использовать Pandas Вы почти наверняка будете часто им пользоваться. NumPy Обеспечивает поддержку множества многомерных операций, которые имеют базовые операции и полезные функции линейной алгебры.
NumPy измножество функции изиспользовать Pandas Специальный да Pandas Series
объекттесно связанный。 Большинство наших примеров будут относиться к NumPy,но pandas Series
функцияда NumPy Плотный расширенный набор массивов, поэтому мы не будем углубляться в него, за исключением нескольких кратких случаев. NumPy подробности.
SciPy Предоставляет набор численных алгоритмов и наборов инструментов для конкретной предметной области, включая обработку сигналов, оптимизацию, статистику, и многое другое.
StatsModels это Python Модуль, который позволяет пользователям просматривать данные, оценивать статистические модели и выполнять статистические тесты. 。 Описательная Обширный список статистической информации, статистических тестов, функций построения графиков и статистики результатов, применимых к различным типам изданныхи каждого оценщика. Исследователи из разных областей могут найти StatsModels Полностью доволен своим Python Выполните статистические расчеты в данныхизнуждаться。
Особенности включают в себя:
scikit-learn даа типа NumPy,SciPy и matplotlib Сборка измашинное обучениебиблиотека. это анализ данныхсерединаизобщий Задачапредоставилпростойодинэффективныйизинструмент,Например Классификация,возвращаться,кластеризация,Уменьшение размерности,Выбор модели и предварительная обработка.
PyMC это Python Модуль, реализующий алгоритмы подбора байесовских статистических моделей, включая цепь Маркова Монте-Карло. Гибкость и масштабируемость делают его применимым для решения многих задач. В дополнение к основной функции выборки PyMC возвращаться Сумкавключатьиспользовать ВСовокупный выпуск,Рисунок,Диагностика согласия и конвергенции и метод.
Python Имеется богатый набор рамок. Самый популярный из двух да matplotlib ивозобновлятьиз seaborn 。
Matplotlib это Python 2D Рисуя Библиотеку, она поддерживает различные форматы печатных копий и кроссплатформенность в интерактивной среде, обеспечивая качество публикации с помощью графики. Matplotlib Можно найти в Python Скрипт, Питон и IPython shell,Блокнот Юпитера,Web Сервер приложений и четыре набора инструментов графического пользовательского интерфейса.
pandas тесно интегрирован с включенным matplotlib,СумкавключатьделатьдляSeries
иDataFrame
объектизчастьиз Функция,этотнекоторый Функциявстречаавтоматическийнастраиватьиспользовать matplotlib。 это не значит Pandas ограничивается только matplotlib。 Как мы увидим, это можно легко изменить на ggplot2 и seaborn и другие имена.
Seaborn этоиспользовать Всуществовать Python Создавайте привлекательные и информативные статистические графики из библиотеки. это основано на matplotlib построить, и я PyData Стек тесно интегрирован, включая поддержку NumPy и pandas Поддержка структуры данных, а также SciPy и StatsModels статистические процедуры. это обеспечивает выход за рамки matplotlib дополнительные функции, а также отображаются по умолчанию, чем matplotlib Более богатый и современный визуальный стиль.
В этой главе мы рассмотрели Pandas из Как это работает и Почему, Обработка данных/анализироватьинаука。 впервые изложенный Pandas Существование панд Место Включить функциональную и дополнительную обработку данных,анализироватьинаука о данныеизмежду понятиями отношения.
Тогда мы проводим анализ данныхпроцесс,к Определите, почему Pandas В . есть определенные особенности. Чтосередина Сумкавключать Поискданные,Данные об организации и очистке,руководитьисследовать,Затем установите официальную модель,Продемонстрируйте свои выводы и получите возможность делиться и воспроизводить результаты анализа.
Следующий,наспредставлять Понятноданныеистатистика Моделированиесерединас участиемизнесколько концепций。 Чтосередина Сумкавключать涵盖многообщийизанализироватьтехнологияиконцепция,Позвольте мне познакомить вас с этими техническими и концептуальными концепциями.,А существование поможет вам лучше ознакомиться с ним, поскольку он более подробно обсуждается в последующих главах.
Pandas Еще больше Python Библиотека часть экосистемы из доступных Анализ данныхинаука。 Хотя эта книга посвящена только Pandas, но вы встретите и другие библиотеки и познакомитесь с ними, так что вы познакомитесь с ними, когда вырастете.
нас Подготовитьначинатьиспользовать Pandas . В следующей главе мы начнем изучать Панды, полученные из Python и Pandas окружение начинается, верно Блокнот Юпитера для обзора, затем существование для глубокого погружения Pandas Series
иDataFrame
объект Извпередверно Чторуководитьбыстрыйпредставлять。 Pandas Последующие элементы имеют большую глубину.
В этой главе мы объясним, как установить Pandas и начните использовать его основные функции. Содержание этой книги основано на Ноутбуки IPython и Jupyterизформа式нестидля,поэтому,Мы также VolyaQuick используем оба инструмента.
В этой книге будут использованы Continuum из Anaconda наука Python Выпускать. Anaconda да Популярностьиз Python Дистрибутивы, в которых включаются бесплатные и платные компоненты. Anaconda Обеспечивается кроссплатформенная поддержка, в том числе Windows,Mac и Linux。 Anaconda из Базовой версии дистрибутива Установить Pandas,Ноутбуки IPython и Jupyter,поэтомуначиная Нетчастопростойодин。
В этой главе будут рассмотрены следующие темы:
Series
иDataFrame
быстрыйначинаяКнига Воляиспользовать Anaconda Python Версия 3,Специальный да 3.6.1。 На момент написания статьи Панды из Версия это 0.20.2。 По умолчанию Анаконда Установщик установит Python,IPython,Блокнот Юпитераи pandas。
Можно получить из Сайт Континуум Аналитикискачать Anaconda Python。 Web Сервер Воля распознает ваш браузер из операционной системы и предоставляет вам файлы для загрузки соответствующего программного обеспечения для этой платформы.
Когда вы откроете этот URL-адрес в своем браузере, я хотел бы посетить страницу, похожую на этот контент:
Нажмите на ссылку программы из Установить, подходящую для вашей платформы. Эта Воля предоставляет вам контент, похожий на страницы Вкизскачать:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-27cyNlu7-1681365384091) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00007.jpeg)]
скачать 3.x Установщик. Книга WillUseFromкогдавпередVersion Anaconda да 4.3.1, с Python 3.6.1:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-BPyvSL8c-1681365384092) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00008.jpeg)]
Эта ситуация часто меняется, и к тому времени, когда вы прочтете это, она, возможно, изменится.
Запустите программу, подходящую для вашей платформы из Установить,После завершения,Открыть командную строкуили Терминалиосуществлятьpython
Заказ。 Вы должны увидеть что-то похожее на следующее (в Mac Вот так на да):
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-OdwG9uMR-1681365384092) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00009.jpeg)]
ты Можеткпроходитьпроблемаexit()
выход оператора Python Устный переводчик:
существует Терминал или командная строка,ты Доступно киспользоватьpip show pandas
Заказпроверять Pandas из Установить Версия:
Уже установленоиз в настоящее время Версия проверена как 0.20.2。 Пожалуйста, убедитесь, что вы 0.20.2 иливыше Версия,потому что Воляиспользоватьэтот Версияидентификация В Pandas из Изменять.
сейчассуществовать,У нас уже есть все, что нам нужно,Продолжим использовать Ноутбуки IPython и Jupyter.
приезжать На данный момент у нас есть выполнение из командной строки или терминала Python。 Это Python Поставляется сизпо умолчаниюЦикл чтения-оценки-печати(REPL)。 этот Можеткиспользовать Приходитьбегатькнига Книгасерединаиз Местоиметь Пример,но Книга Воляиспользовать IPython Написание пакетов текста и кода Блокнот из заявления в Юпитера. Давайте кратко рассмотрим оба.
IPython использовать тебя Python Интерактивная работа из резервной копии Shell。 к этому Python Предоставляется по умолчанию REPL Сделаны некоторые улучшения.
Если вы хотите узнать более подробную информацию IPython,пожалуйста, проверьтедокумент。
начать IPython,Толькоот Заказ ХОРОШО/Терминалосуществлятьipython
Заказ。 При запуске вы увидите что-то похожее на следующее:
отображение подсказки вводаIn [1]:
。 каждый раз IPython REPL Когда предложение вводится в , цифры в подсказке увеличиваются.
такой же,тывходитьизлюбойидентификация条глазиз Результат:ВолякOut [x]:
начало,Чтосерединаx
исоответствующийизIn [x]:
из Сопоставление номеров。 На следующем скриншоте показано это:
in
иout
заявлениеизпара чисел ВПример Очень тяжелыйхотеть,потому что Местоиметь Пример Все ВолякIn [x]:
иOut [x]:
начало,После этого вы сможете продолжить обучение.
Обратите внимание, что эти цифры являются чисто непрерывными. Если следовать кодам в тексте и при вводе возникает ошибка или вводится другое предложение, то нумерация может быть неправильной (можно выйти и перезапустить IPython чтобы сбросить номер). Пожалуйста, используйте их исключительно в качестве справки.
Блокнот Юпитерада IPython блокнотиз Эволюция. Это с открытым исходным кодом Web отвечатьиспользовать,Позволяет создавать и публиковать живой код.,уравнение,Визуализацияиснижение цениздокумент。
Изначально IPython Ноутбуки ограничены Python。 Блокнот Юпитера был разработан, чтобы позволить использовать несколько языков программирования, включая Python,R,Julia,Scala и F#。
Если вы хотите узнать больше о Блокнот Юпитера,Пожалуйста, посетитеэта страница,существоватьэта страница на Воля отображает аналогичный контент со страниц Вк:
Блокнот Юпитера Можеткнезависимый В Python скачатьииспользовать。 Anaconda Установлено по умолчанию. начать Блокнот Юпитера,пожалуйстасуществовать Заказ ХОРОШОили Терминалначальствопроблемак Вниз Заказ:
$ Блокнот Юпитера
В целях демонстрации давайте посмотрим, как запустить пример кода, прилагаемый к тексту. от Packt загрузка код сайта, а затем извлеките файл Воля из каталога по вашему выбору. В каталоге существования вы увидите похожий контент ниже изк:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-Kd4PQj6l-1681365384094) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00015.jpeg)]
сейчассуществоватьпроблемаjupyter notebook
Заказ。 Вы должны увидеть что-то похожее на следующее:
Откроется страница браузера, показывающая Блокнот Юпитера Домашняя страница,Прямо сейчасhttp://localhost:8888/tree
。 Эта Воля открывает витрину эта страницаиз Web Окно браузера, похожее на содержимое Вк и список каталогов:
одинударять.ipynb
Связь Может Открытьблокнотстраница。 Если вы откроете эту главу, вы увидите содержимое, подобное следующему:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-Co5cCa9C-1681365384095) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00018.jpeg)]
Показать изблокнотда Jupyter и IPython генерироватьиз HTML。 Он состоит из ряда ячеек, которые могут быть одного из четырех типов: Code, Markdown, Raw. nbconvert или титул. Все примеры в этой книге представляют собой единицы со скидкой.
Jupyter Запустите по одному для каждого блокнота IPython Ядро. Включать Python Закодированный модуль существования выполняется в этом ядре, и результат такой: HTML Добавить в блокнот.
Двойной щелчок по любой ячейке сделает ее доступной для редактирования. 编辑надодин元сеткаиз Внутри Ронг Хоу,в соответствии сShift + Enter
,этотчас Jupyter/IPython Содержимое будет оценено и отображен результат.
Если вы хотите узнать больше о том, что составляет основу страницы, изблокнот формата,пожалуйста Видетьздесь。
Верхняя часть панели инструментов блокнот предоставляет вам множество функций для управления блокнотом. К ним относятся перемещение вверх и вниз, добавление и удаление ячеек. Также содержит основы для запуска устройства, повторного запуска устройства и перезапуска устройства. IPython Ядро из команды.
Чтобы создать новый блокнот, перейдите в раздел «Новый блокнот». -> Python3”:
Волясуществовать Новая вкладка в браузере для создания новой изолированной страницы. Его имя будет Без названия:
блокнот Включатьодин Подготовитьхорошийвходить Python из Код. существоватьодин元сеткасерединавходить1 + 1
ив соответствии сShift + Enter
осуществлять。
Блок был выполнен,результатпоказыватьдляOut [1]:
。 Jupyter Также открывается новая единица, где вы можете ввести дополнительные коды или скидки.
Блокнот Юпитера будет автоматически сохранять ваши изменения каждую минуту, но сохранять изменения вручную время от времени все равно полезно.
Давайте начнем использовать немного Панды и дайте краткое введение Pandas издваосновнойданныеструктураSeries
иDataFrame
。 Мы проверим следующее:
Series
DataFrame
DataFrame
Мы Воляиспользоватьиз каждого блока сначала Импорт панд и еще несколько полезных Python библиотека. Он также установит несколько опций для управления Pandas как Блокнот Вывод рендера в Юпитера. Код Включенияк гласит:
Первый оператор импортирует NumPy и Воля Библиотекасерединаизпроектвестииспользоватьдляnp.
。 В этой книге мы не будем обсуждать NumPy Проведите детальное возвышение, но иногда приходится его использовать.
Второй импорт использует Pandas В наличии нас Воляиспользоватьpd.
вперед缀вестииспользовать Библиотекасерединаизпроект。 from pandas import Series, DataFrame
заявление ВоляSeries
иDataFrame
объектявныйимпортироватьприезжатьобщая ситуацияимякосмоссередина。 Это подводит нас к Можно найти в Нетpd
из Состояние ВнизвестииспользоватьSeries
иDataFrame
。 префикс. этот Очень квадратныйудобный,Потому что мы часто будем их использовать,Это экономит много времени при наборе текста.
import datetime
заявлениевести入Понятноdatetime
Библиотека,Должен Библиотекав целомсуществовать Pandas Используется во Вданных временных рядов。 это Воля Сумкавключатьсуществоватькаждыйблокнотизимпортироватьсередина。
pd.set_option()
функциянастраиватьиспользовать Установить параметры,этотнекоторый选项通Знатьблокноткакпоказывать Pandas из вывода. Нет.одинсообщить статус ВоляSeries
иDataFrame
Результат:сейчасдляискусствокнигаи Нетда HTML。 Следующие две строки определяют максимальное количество выводимых столбцов и строк. final Опция устанавливает максимальное количество выводимых символов в строке.
ты Можно найти в этом URL Дополнительные параметры см. в。
увлеченныйиз Глаз Можетспособныйвстреча注意приезжатьэтотодин元сетка НетOut [x]:
。 И Нет всех единиц (или IPython оператор) будет генерировать выходные данные.
Если вы хотите использовать IPython заменять Блокнот Юпитера для последующих операций, затем Можно найти в IPython Shell Выполните этот код в . Например, вы можете просто вырезать и вставить код в ячейку. Это может выглядеть так:
IPython shell Будьте достаточно умны, чтобы понимать, что вы вставляете несколько строк и делаете соответствующие отступы. И обратите внимание, что в IPython shell серединатакже НетOut [x]:
。 pd.set_option
Нетвозвращатьсялюбой Внутри Позволять,поэтому Нет Комментарий。
Pandas Series
да Pandas из Базовыйструктура данных. последовательностьи NumPy множествосходство,но ЭТО ИЗ РАЗНИЦЫ существует В ИМЕЕТ индекс,Индекс позволяет расширить возможности поиска элементов.,И не просто даот нулевое стартовое значение измножествоиндекса.
к Внизот Python Список создает последовательность. :
Вывод включает в себя два столбца информации. Нет.одиндаиндекс,Нет.дваиндивидуальныйдаSeries
серединаизданные。 Выход из каждого представителя рядаиндексЭтикетка(существовать Нет.один Списоксередина),Затемпредставлятьи Должен Этикеткаассоциацияизценить。
Зависит от ВсоздаватьэтотSeries
часеще нетобозначениеиндекс(Следующий Воляхотетьосуществлятьиздействовать),поэтому pandas Автоматически создавать целочисленный индекс, индексиз Этикеткаот 0 Для начала для каждого элемента данных добавьте 1。
Затем,Доступно киспользовать[]
доступ оператораSeries
объектизценить,ипередача Местонуждатьсяценитьиз Этикетка。 к Вниз Внутри Позволятьполучать Этикетка1
изценить:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-HG0BAi21-1681365384097) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00025.jpeg)]
Это очень похоже на обычный доступ во многих языках программирования. но, как мы видим, приезжатьиз, индекс не обязательно от 0 Начать без увеличения 1, и может быть много типов данные, а не просто целые числа. Этот способ обеспечивает гибкие возможности индексации Pandas из Одна из великих сверхдержав.
в Python В списке можно указать несколько позиций, указав их из Этикетка. к Вниз Внутри Позволять Поиск Этикетка1
и3
начальствоизценить:
проходитьиспользоватьindex
параметриобозначениеиндекс Этикетка,Доступно киспользоватьиспользовать户Конечно义изиндекссоздаватьSeries
объект. ВнизлапшаизкодсоздаватьодинSeries
,чьи ценности одинаковы,Но индекс состоит из строковых значений:
сейчассуществовать,эти буквенно-цифровыеиндекс Этикетка МожеткдоступSeries
объектсерединаизданные。 к Вниз Внутри Позволять Поискиндекс Этикетка'a'
и'd'
начальствоизценить:
все еще Можеткпроходитьбаза В[0]изчисло РасположениевестииспользоватьэтотSeries
объектизэлемент。 :
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-HG6awP3G-1681365384098) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00029.jpeg)]
нас Доступно киспользовать.index
Проверка недвижимостиSeries
изиндекс:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-oOZrR0x4-1681365384099) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00030.jpeg)]
индексна самом делеэто Pandas объект, эти выходные данные показывают нам значение индексизации и виндексизтип данных。 существуют В этом случае обратите внимание на индекссерединаизтип данных(называетсяdtype
)даобъекти Нетданить。 Позже в этой книге мы изучим, как изменить эту настройку.
Series
существовать Pandas Обычное использование в из да означает дату/время индекса Этикетки, связанное с временем по очереди. Внизлапшапроходитьиспользоватьpd.date_range()
pandas создание диапазон дат функции, чтобы проиллюстрировать это:
Это Pandas серединасоздавать ПонятноодинназываетсяDatetimeIndex
изособенныйиндекс,Это Что-то вродеособенныйиз Pandas индекс,пройтиоптимизация Можетверносдатаивремяизданныеруководитьиндекс。
сейчассуществовать,позволятьнасиспользовать ДолжениндекссоздаватьодинSeries
。 Значение данных представляет собой высокую температуру в определенный день:
этотдобрыйсDateTimeIndex
изпоследовательностьназываетсявремяпоследовательность。
нас Доступно киспользоватьдатаделатьдлянить Приходить Запросидентификацияданныеизтемпература:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-NAXvU2VK-1681365384100) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00033.jpeg)]
дваSeries
объект Можеткпроходить Арифметические операции相互отвечатьиспользовать。 к Внизкодсоздавать Нет.дваиндивидуальныйSeries
ивычислитьдва者междуизтемпература Разница:
вернодва Нет标количествоценитьизSeries
объектруководить Арифметические операции(+,-,/,*,…)изрезультат Волявозвращаться ДругойодинSeries
объект.
От Виндекс не да целое число,поэтомунасвозвращаться Можеткпроходитьот 0 Начните со значения, чтобы найти цену:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ADSr7tHN-1681365384100) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00035.jpeg)]
Наконец, панды Приведен ряд описательных и статистических методов. Например,Следующий контент возвращает разницу температур от средней цены:
Pandas Series
может толькоикаждыйиндекс Этикеткаассоциацияодинценить。 Чтобы каждый индекс Этикетка имел несколько значений, мы можем киспользовать фрейм данных。 рамка данныхпредставлятьодинилимногоиндивидуальныйв соответствии синдекс Этикетка ВыравниваниеизSeries
объект. каждыйпоследовательность Волядафрейм В столбце есть один столбец, и каждый столбец может иметь связанное имя.
в каком-то смысле фрейм данныхпохожий Всвязьданные Библиотекаповерхность,Потому что это означает, что в одном столбце имеется несколько разнородных типов (но один тип для всех элементов в каждом соответствующем столбце).
к Внизсоздаватьприносить Есть две колонкиизDataFrame
объект,ииспользоватьтемператураSeries
объект:
производить изфрейм данные имеют два столбца,соответственноMissoula
иPhiladelphia
。 Эти столбцыдафрейм данныхсередина ВключатьизновыйSeries
объект,иметьоторигинальныйSeries
объекткопироватьизценить。
Доступно киспользоватьс именами столбцовили Списокимя Списокповерхностьизмножествоиндексустройство[]
доступDataFrame
объектсерединаиз Список。 к Внизкод ПоискMissoula
Список:
Внизлапшаизкод ПоискPhiladelphia
Список:
Списокимяиз Python Списки также можно использовать для возврата нескольких столбцов:
иSeries
объектпо сравнению с,DataFrame
объектжитьсуществоватьтонкийизразница。 Воля Списокповерхностьперешел кDataFrame
из[]
оператор Воля Поискобозначениеиз Список,иSeries
Воля Возвратная строка。
Если имя столбца не содержит пробелов,но Доступно киспользоватьсвойствостильруководитьдоступ:
фрейм данныхсерединакаждый Списокмеждуиз Арифметические операцииимногоиндивидуальныйSeries
начальствоиз Арифметические операциитакой же。 Для демо,Следующее обозначение атрибута codeuse вычисляет разницу между температурами:
Толькопроходитьиспользоватьмножествоиндексустройство[]
выражать Закон ВолядругойSeries
назначен наодин Список Прямо сейчас Может Воляновый Списокдобавить вприезжатьDataFrame
。 к Вниз Внутри ПозволятьсуществоватьDataFrame
серединадобавить в Понятностемпература Разницаизновый Список:
Можетпроходить.columns
свойстводоступDataFrame
серединаиз Списокимя:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-F9ms9LNW-1681365384103) (https://gitcode.net/apachecn/apachecn-). ds-zh/-/raw /master/docs/learning-pandas-2e/img/00044.jpeg)]
МожетккусочекDataFrame
иSeries
объектк Поискидентификацияиз ХОРОШО。 В следующую секунду приедет четвертая линия разницы температур изкусочек:
Доступно киспользовать.loc
и.iloc
свойство Поискфрейм данныеиз всей строки. .loc
правильный Сохранятьв соответствии синдекс Этикетка Находить,Чтосередина.iloc
использоватьот 0 Запуск из Расположение.
к Вниз Внутри Позволять Поискфрейм данныхиз Нет.два ХОРОШО:
пожалуйста, обрати внимание,этотрезультатуже Воля ХОРОШОКонвертироватьдляSeries
,фрейм данныхиз СписокимяужеперспективаприезжатьрезультатSeries
изиндекс Этикеткасередина。 Результаты показаны ниже:
Доступно киспользовать.loc
свойствопроходитьиндекс Этикеткаявныйдоступ ХОРОШО。 к Внизкодпроходитьиндекс Этикетка Поискодин ХОРОШО:
Доступно киспользоватьцелое число Расположение СписокповерхностьвыбиратьDataFrame
объектсерединаизидентификация ХОРОШО。 к ВнизотDifference
Списокизцелое число Расположение1
,3
и5
из ХОРОШОсерединавыбиратьценить:
[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-bKuuTASK-1681365384104) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00049.jpeg)]
Вы можете применить данныеиз логических выражений в каждой строке к Выберите строки фрейма данных。 к ВнизпоказыватьMissoula
Списоксерединабольшой В82
степеньизценить:
Затем Можетк Воляповерхностьвыражениеизрезультатотвечатьиспользовать Вфрейм данных(ипоследовательность)из[]
оператор,этоттолькопривести квозвращатьсяпроситьценитьдляTrue
изповерхностьвыражениеиз ХОРОШО:
Эта технология находится в pandas терминсерединаназываетсяЛогический выбор,это Воляструктурастановитьсябаза Видентификация Списоксерединаизценитьвыбирать ХОРОШОизбазафундамент(Напримерсуществовать SQL серединаиспользоватьWHERE
пунктиз Запрос – Но мы увидим, что он мощнее).
Pandas Библиотека удобно предоставляет различные источники данных в Поисковых Pandas объектиз Инструменты. В качестве простого примера рассмотрим Pandas к CSV Возможность загрузки данных формата.
книга Пример Воляиспользовать С этой книгойизкодdata/goog.csv
нестидляиздокумент,Содержимое этого файла представляет собой информацию об акциях Google с учетом временных финансовых показателей.
к Следующее предложениеиспользовать операционную систему (от Блокнот Юпитераили IPython Internal) отображает содержимое этого файла. Какая команда вам нужна, зависит от вашей операционной системы:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-kFCoIdmx-1681365384105) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00052.jpeg)]
Доступно киспользоватьpd.read_csv()
функция ВоляэтотнекоторыйинформациялегкийимпортироватьDataFrame
:
pandas не знает дату в первом столбце файла,ииуже ВоляDate
Полеиз Внутри Позволять Видетьдлянить。 Доступный киспользовак pandas заявлениеверноэтотруководитьпроверять,Должензаявлениекнитьформа式показыватьDate
Списокизтип:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-mk7MyUHK-1681365384105) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00055.jpeg)]
the pd.read_csv()
функцияизparse_dates
параметр Можетгид Pandas Как преобразовать данные напрямую в Pandas Объект даты. к Следующее уведомление Pandas ВоляDate
Списокиз Внутри Позволять КонвертироватьдлядействительныйизTimeStamp
объект:
Если мы проверим, действительно ли это,насвстреча看приезжать ДатаTimestamp
:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-FfC9bUS0-1681365384106) (https://gitcode.net/apachecn/apachecn-). ds-zh/-/raw /master/docs/learning-pandas-2e/img/00058.jpeg)]
К сожалению, здесь нет поля даты, как в фрейме данныхизиндекс. И даиспользовать значения по умолчанию из целочисленного индекса с отсчетом от нуля Этикетка:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ga8FnoUt-1681365384106) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00059.jpeg)]
пожалуйста, обрати внимание,этотсейчассуществоватьдаRangeIndex
,существоватьквпередиз Pandas Версия, это должен быть целочисленный индекс. Мы рассмотрим эту разницу позже в книге.
Доступно киспользоватьpd.read_csv()
функцияизindex_col
параметр Воля Чтозафиксированный,к указывает, какой столбец в файле Воля следует использовать в качестве индекса:
сейчассуществоватьиндексдаDateTimeIndex
,этоделатьнас Доступно киспользоватьдата Находить ХОРОШО。
Мы будем в главе 14 Углубленное изучение Предварительной обработки, носуществовать в главе «Визуализация», перед которой мы время от времени Pandas серединаизданныеруководитьбыстрый Визуализация。 использовать Pandas Создать данные Визуализация Нет очень просто. Местоиметьнуждаться Делатьиз Сразуданастраиватьиспользовать.plot()
метод。 ВнизлапшапроходитьрисоватьзапасданныеизClose
ценитьруководить Демо:
В этой главе мы устанавливаем Python из Anaconda Scientific Версия。 Это также установит pandas и Блокнот Юпитера, приготовься к твоей казни Обработка данныхианализироватьизсреда,и создано с помощью ВПредварительный просмотр,Представьте и поделитесь анализом и блокнотом.
Мы все еще правы Pandas Series
иDataFrame
объектруководить Понятнопредставлять,выставка Понятноодиннекоторый Базовый Функция。 На выставке показано, как выполнить некоторые основные операции, прежде чем углубляться во все детали, которые можно использовать для начала работы. Pandas。
существовать Следующийиз Несколькоглавасередина,нас Воляидти глубже ИсследоватьSeries
иDataFrame
издействовать,Внизодинглава ВоляфокуспредставлятьSeries
。
Series
да Pandas из Основные строительные блоки. Это означает один тип данныеиз — это одномерный набор значений, аналогичный Вмножествоиз. Обычно он измеряется с помощью В для одной переменной из нуля или многократного моделирования. хотяэтосмотреть Приходитькартинамножество,ноSeries
иметьассоциацияизиндекс,Индекс, доступный в базе ВЭтикетка, исполнение Нет, часто действителен из значения Поиск.
Series
возвращатьсявстречаавтоматическийосуществлятьсами Чтоон Pandas Сопоставьте свои объекты. Выровнять да Pandas Основная функция, при которой данныедасуществовать сопоставляет кратные значениям Этикетки перед выполнением какого-либо действия. Pandas объект. Это позволяет применять операции просто без явного кодирования соединения.
существоватькнигаглавасередина,нас Воля ИсследоватькакиспользоватьSeries
дляпеременнаяиз Измерение Моделирование,Включить использование индекса. Образец поиска.,кусочеки Запросданные,Выравнивание и повторная индексация по нескольким шаблонам.
В частности, в этой главе мы рассматриваем следующие темы:
Series
изиндексиценитьсвойствоSeries
объектизразмериформаSeries
часобозначениеиндексhead
,tail
иtake
доступценитьSeries
Мы начинаем эту главу со следующего оператора импортироватьиконфигурацию:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-AdkSyCZA-1681365384108) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00063.jpeg)]
Доступно киспользоватьмногодобрыйтехнологиясоздаватьSeries
。 Мы изучили следующие три:
Можно получить из Python СписокповерхностьсерединасоздаватьSeries
:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-8R8GnSwO-1681365384108) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00064.jpeg)]
числоиз Нет.один СписоквыражатьSeries
индекссерединаиз Этикетка。 Во втором столбце указано значение Включать. dtype: int64
выражатьSeries
серединаценитьизтип данныхдляint64
。
По умолчанию Панд-встреча создаст индекс,Должениндекс Зависит от0
начинатьизнепрерывныйвсемножествостановиться。 Это делает последовательность похожей на множество других языков программирования. Например, мы Можно найти вlabel 3
в Находитьценить:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-N1jBqtiL-1681365384108) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00065.jpeg)]
Найденное значение для дапроходить Этикетка вместо даот 0 Начать из Расположение продолжить. Мы рассмотрим это подробно позже в этой главе.
Доступно киспользовать Нетцелое числоизтип данных。 Создайте строковое значение изположения под k:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-8615Z3i0-1681365384108) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00066.jpeg)]
хотетьсоздавать Зависит отn
индивидуальныйтакой жеценитьv
изпоследовательность Группастановитьсяизпоследовательность,пожалуйстаиспользовать Python стенографияповерхностьсоздавать[v]*n
。 к Внизсоздавать2
изпятьценить:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-yC25BEPu-1681365384109) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00067.jpeg)]
Внизлапшада Что-то вродепохожийизстенографиятип,этоиспользовать Python Сокращение для использования каждого символа в качестве элемента списка:
Можно получить из Python словарьпрямойловитьинициализацияSeries
。 При использовании словаря в качестве индекса Этикетка используется словарь из ключа:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-0bsHvsKk-1681365384109) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00069.jpeg)]
инициализацияSeries
объектиз Различный NumPy Функция да А распространена на практике. Например, в следующем примереиспользуйте NumPy np.arange
функциясуществовать4
и8
междусоздаватьодинцелое числоценитьпоследовательность:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-B7FJO9Hp-1681365384110) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00070.jpeg)]
np.linspace()
методиз Функцияпохожий,но позволяет нам указать, что мы хотим существовать, чтобы создать изколичество значений между (и включительно) двумя указанными значениями.,И с указанным количеством шагов:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-FFeiWB01-1681365384110) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00071.jpeg)]
использоватьnp.random.normal()
генерировать Также существует набор случайных чисел.даочень распространенныйиз。 Кот Нормальное распределение предполагает пять случайных чисел:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-QfgED5yr-1681365384110) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00072.jpeg)]
также Доступно киспользовать создание скалярного значенияSeries
:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-7Ddbyoy3-1681365384111) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00073.jpeg)]
Series
толькоиметьодининдивидуальныйценить,Кажется, это деградирующая ситуация. но,существуют в некоторых случаях,это важно,Например,Воляпоследовательность при умножении на скалярное значение,Как показано ниже:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-dxY66vpy-1681365384111) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00074.jpeg)]
Под обложкой Панды Выбиратьценить2
иот Должен标количествоценитьсоздаватьодинSeries
,Чтоиндексиs
серединаизиндекссоответствовать,Затемпроходить ВыравниваниедваSeries
руководить乘Закон。 существования Далее в этой главе мы, Воля, еще раз рассмотрим этот пример более подробно.
.index
и.values
свойствокаждыйSeries
объектвсе Зависит отодиннекоторыйценитьиодининдекс Группастановиться。 Можеткпроходить.values
свойстводоступэтотнекоторыйценить:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-Tg8QH9c3-1681365384111) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00075.jpeg)]
результат — это объект массива NumPy, как показано ниже:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-6DCSvq4L-1681365384112) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00076.jpeg)]
Вне Винформации называется пункт из Воля. Мы не будем рассматривать это в этой книге. NumPy множество. от Исторически, Панды изправильныйсуществоватьза кулисамииспользовать NumPy массив, следовательно NumPy Раньше «множествосуществовать» было более важным, но эта опора на существование недавно была заменена на «удалить» в из Версии. Но для удобства, даже если базовое представление не NumPy множество,.values
такжевстречавозвращаться NumPy множество.
кроме того,Доступно киспользовать.index
Поиск Долженпоследовательностьизиндекс:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-pNh7zPdO-1681365384112) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00077.jpeg)]
Pandas создаватьизиндекстипдляRangeIndex
。 При существовании этого типа изиндекс не существует, этои предыдущая версия по сравнению с из Pandas Изменять. RangeIndex
объектпредставлятьиметьобозначениеstep
изотstart
приезжатьstop
ценитьизценитьобъем。 иквпередиспользоватьизInt64Index
По сравнению с Это работает для Pandas daiz.
RangeIndex
Толькоданас Воляхотетьисследоватьиз Что-то вродеиндекстип(Нет. 6 Большая часть подробностей в разделе «индексданные»).
Series
объектсерединаизпроектчисло Можеткпроходитьмногодобрыйтехнология Приходитьправильный Конечно,Чтосередина Нет.Что-то вродедаиспользовать Python len()
функция:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-e6PZKIjU-1681365384112) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00078.jpeg)]
проходитьиспользовать.size
свойство Можеткполучить то же самоеизрезультат:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-KfRMSjkW-1681365384112) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00079.jpeg)]
получатьSeries
размериз Другойформадаиспользовать.shape
свойство。 Это возвращает двоичный кортеж, но указывается только первое значение, представляющее размер:
[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-dkCQEWsZ-1681365384112) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00080.jpeg)]
Доступно киспользоватьструктура造устройствоизindex
параметрсуществоватьсоздаватьSeries
часобозначениеиндекссерединаиз Этикетка。 ВнизлапшасоздаватьодинSeries
и Волянитьназначен наиндексизкаждый Этикетка:
исследовать.index
свойство,Мы обнаружили, что индекс Вниз был создан:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-svm7okkz-1681365384113) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00082.jpeg)]
использоватьэтотиндивидуальныйиндекс,нас Можеткпроситьодинпохожийwho is the Dad?
извопрос:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-2ncsktyq-1681365384113) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00083.jpeg)]
.head()
,.tail()
и.take()
Pandas предоставил.head()
и.tail()
метод ПриходитьисследоватьSeries
серединавпередгид(голова)илиследовать(хвост)ХОРОШО。 По умолчанию,Они возвращают первые пять строк и последние пять строк.,но Доступно киспользоватьn
параметрруководить Изменять.
позволятьнасисследоватьк ВнизSeries
изиспользовать Закон:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-89JIhqtp-1681365384113) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00084.jpeg)]
Первые пять строк следующего содержания:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-lzZiHdTt-1681365384114) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00085.jpeg)]
Доступно киспользоватьn
параметр(илитолькопроходитьобозначениечисло)Приходить Изменятьпроектчисло:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-1ws7nOxa-1681365384114) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00086.jpeg)]
.tail()
возвращатьсянаконецпять ХОРОШО:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-NyG2VxdB-1681365384114) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00087.jpeg)]
обозначение5
кснаружиизчислочас,Это работает следующим образом:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ntTbOoEM-1681365384114) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00088.jpeg)]
.take()
методвозвращатьсяобозначениецелое число Расположениеиз ХОРОШОизпоследовательность:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-cTrb4YNV-1681365384115) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00089.jpeg)]
Series
серединаизценить Можеткпроходитьдвадобрыйчасто规метод Поиск:проходитьиндекс Этикеткаилиот 0 Запуск из Расположение. Pandas Для выполнения обоих поисков предусмотрено несколько методов. Давайте рассмотрим некоторые распространенные методы.
[]
оператори.ix[]
свойствов соответствии с Этикетка Находитьиспользовать[]
операторосуществлять Скрытый Этикетка Находить。 Обычно этот оператор соответствии Найдите значение, указанное в индексе Этикетка.
позволятьнасотиспользоватьк ВнизSeries
начинать:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-YwJqJYFg-1681365384115) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00090.jpeg)]
Найдите одну ценить только с необходимыми элементами.Используйтезиндекс Этикетку:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-V4f8vx0O-1681365384115) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00091.jpeg)]
список использоватьиндекс Этикетка может искать несколько элементов одновременно:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-vZybvmLT-1681365384115) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00092.jpeg)]
насвозвращаться Доступно киспользоватьпредставлять Расположениеизцелое число Приходить Находитьценить:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-vt09K9kQ-1681365384115) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00093.jpeg)]
Это чисто да, потому что индекс не использует целочисленную Этикетку. если Воляцелое числоперешел к[]
,и индекс имеет целочисленное значение,Затем введите Воля передает значение из и целое значение Этикеткаиз для сопоставления для выполнения поиска.
этот Доступный киспользовакSeries
руководить Демо:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-dYxsRF2V-1681365384116) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00094.jpeg)]
к Вниз Внутри Позволятьсуществовать Этикетка13
и10
и Нет Расположение13
и10
в Находитьценить:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-UJzMeV4H-1681365384116) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00095.jpeg)]
использовать[]
операторруководитьиз Находитьииспользовать.ix[]
свойствотакой же。 но,Начиная с версии Pandas 0.20.1,.ix[]
ужезаброшенныйиспользовать。 Причина прекращения поддержки заключается в том, что да путается при передаче целого числа оператору и зависит от разницы в типах операций Этикетки в Виндексе.
Чтов результатеда[]
или.ix[]
все Нет Можетиспользовать ВНаходить。 идаиспользовать.loc[]
и.iloc[]
свойство,Они явно найдены только Этикеткаили Расположение.
.iloc[]
в соответствии с Расположениеявный НаходитьДоступно киспользовать.iloc[]
Приходитьв соответствии с Расположение Находитьценить。 Ниже Демоиспользовать целое число в качестве параметра:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-s4gJlrhU-1681365384116) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00096.jpeg)]
Несмотря на то, что индекс имеет целое число Этикетка, Расположение будет найдено следующее:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-vzfSgVbc-1681365384116) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00097.jpeg)]
пожалуйста, обрати внимание,Если указано несуществующее существованиеиз Расположения (маленький В ноль или большой В номер позиции - единица),Тогда Воля выбрасывает исключение.
.loc[]
проходить Этикеткаруководитьявный Находитьтакже Можеткпроходитьиспользовать.loc[]
свойство Приходить Реальностьсейчасв соответствии с Этикетка Находить:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-24tHAGha-1681365384117) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00098.jpeg)]
использовать целое число. Этикетка без проблем:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-8qQOBq8N-1681365384117) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00099.jpeg)]
пожалуйста, обрати внимание,Когда доставки нетсуществоватьиндекссерединаизиндекс Этикеткачас,.loc[]
и.iloc[]
иметьдругойиз ХОРОШОдля。 В этом случае Панды ВолявозвращатьсяNaN
ценить,Без исключения:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-iZJao7x2-1681365384117) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00100.jpeg)]
ЧтодаNaN
? Мы Волясуществовать эту главу из более подробной информации о данном правительстве, но pandas использовать Он представляет собой недостающий номер данныхили, который невозможно найти в пройтииндексфинд найти приезжатьиз. Это также имеет значение для различных статистических методов, которые мы также рассмотрим позже в этой главе.
Pandas Series
поддерживатьназываетсякусочекиз Функция。 кусочекдаот Pandas объект в Поискданные подмножества мощного метода. проходитькусочек,нас Можеткв соответствии с Расположениеилииндекс Этикеткавыбиратьданные,и лучший контроль над генерацией элементов (вперед или назад) и интервалов (каждый элемент,друг друга) из порядка.
кусочексделаю обычныймножество[]
оператор(ки.loc[]
,.iloc[]
и.ix[]
)перегрузка,кприниматькусочекобъект。 кусочекобъектдаиспользоватьstart:end:step
грамматикасоздаватьиз,Представляет первый элемент,последний элементизкомпонентыкихотетьделатьдляstep
изкаждый项междуиз Приращение。
кусочекиз Каждый компонент не является обязательным,и опустить спецификатор фрагмента компонента,Предоставляет удобный способ выбора целых строк.
Для начала Демокусочек,нас Воляиспользоватьк ВнизSeries
:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-UQsgJyGs-1681365384118) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00101.jpeg)]
нас Доступно киспользоватьstart:end
делатьдлякусочеквыбиратьнепрерывныйизпроект。 к ВнизвыбиратьSeries
середина Расположение1
к5
изпятьпроект。 Зависит от Внасеще нетобозначениеstep
компоненты,поэтомупо умолчаниюдля1
。 Другойпожалуйста, обрати внимание,результатсередина Нет Включатьend
Этикетка:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-Pv6YrBCv-1681365384118) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00102.jpeg)]
Этот результат примерно эквивалентен следующему содержимому:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-QRTafMEE-1681365384118) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00103.jpeg)]
примерно эквивалентно,потому чтоверно.iloc[]
изиспользоватьвозвращатьсяисточниксерединаданныеизкопировать。 кусочка Ссылка на данныеиз в источнике. Исправлять Местопридетсякусочекиз Внутри Позволять Воля Источник влиянияSeries
。 нас Волясуществоватьпозжеизчастьсередина Сразу Кусочек ИсправлятьSeries
данные,Изучите этот процесс дальше.
проходитьобозначение2
шаг,часть возвращает все остальные элементы:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-rFnQsQTw-1681365384118) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00104.jpeg)]
как упоминалось ранее,кусочекиз Каждый компонент не является обязательным。 еслиупущениеstart
компоненты,норезультат Воляот Нет.один项начинать。 Например,к Внизда.head()
изаббревиатура:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-lmCpTxuv-1681365384119) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00105.jpeg)]
проходитьобозначениеstart
компонентыиупущениеend
,Можетквыбиратьидентификация Расположениеи Чтоназадиз Местоиметьпроект。 к Внизвыбиратьот4th
начинатьиз Местоиметьпроект:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-1cfRiiiC-1681365384119) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00106.jpeg)]
step
также Можно найти а именно два случая использования, чтобы пропустить элементы:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-43hGC12l-1681365384119) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00107.jpeg)]
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-vD2e5EGF-1681365384120) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00108.jpeg)]
использоватьstep
грузценить Воляобеспечить регрессрезультат。 к Вниз Демо Понятнокакобеспечить регрессSeries
:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-JZFw48De-1681365384120) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00109.jpeg)]
ценить-2
Воляотначинать Расположениевозвращаться Местоиметь Чтоонпроект,ик Напротивизпоследовательное направлениеSeries
изначинать工делать。 Внизлапшаиз Примервозвращаться Местоиметь Чтоонпроект,Сумкавключать Расположение4
виз ХОРОШО:
[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-MVltgwk0-1681365384120) (https://gitcode.net/apachecn/apachecn-). ds-zh/-/raw /master/docs/learning-pandas-2e/img/00110.jpeg)]
кусочекизstart
иend
изгрузценитьиметьособенныйзначение。 -n
изstart
грузценитьвыражатьнаконецn
ХОРОШО:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-WEVvwgXy-1681365384121) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00111.jpeg)]
-n
изend
грузценить Волявозвращатьсяудалятьнаконецn
ХОРОШОИзснаружииз Местоиметь ХОРОШО:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-k6pYHIhl-1681365384121) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00112.jpeg)]
грузstart
иend
分количество Можетккомбинацияиспользовать。 к Вниз Внутри Позволятьпервый Поискнаконец Четыре ХОРОШО,Затемотсередина Поискудалятьнаконецодин ХОРОШО(Прямо сейчасвпередтри ХОРОШО)Изснаружииз Местоиметь ХОРОШО:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-VkomK3jv-1681365384121) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00113.jpeg)]
Вы также можете выполнить измерение целых чисел с помощью Нетиндексизпоследовательность. Для демо,позволятьнасиспользоватьк ВнизSeries
:
использоватьэтотSeries
,верноцелое числоценитьруководитькусочек Воляв соответствии с Расположениенести Выбиратьпроект(как упоминалось ранее):
[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-oP8AmQO7-1681365384122) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00115.jpeg)]
но,Целочисленное значение WhenuseNet как компонент фрагмента,Pandas Воля, попытайтесь понять тип данных и по очереди, чтобы выбрать соответствующий пункт. Например,от'b'
приезжать'd'
изк Внизкусокчасть:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-lcnJMUmD-1681365384122) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00116.jpeg)]
проходитьиндекс ЭтикеткаверноSeries
данныеруководить Выровнять да Pandas Базовая концепция, а также одна из самых мощных концепций. Выравнивание Виндекс Этикетка обеспечивает автоматическое объединение нескольких последовательность объектов по соответствующим значениям. использоватьстандартныйизпроцесстехнология,Можно найти Сохраняйте большое количество данных о сопоставлении рабочей нагрузки, подверженных ошибкам, в нескольких коллекциях.
Для демо Выравнивание,позволятьнас ПодниматьодинсуществоватьдваSeries
объектсерединадобавить вценитьиз Пример。 позволятьнасотк ВниздваSeries
объектначинать,этоихпредставлятьодин Группапеременная(a
иb
)издва Неттакой жекнига:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ayKPr5a1-1681365384123) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00117.jpeg)]
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ApFHFyxc-1681365384123) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00118.jpeg)]
Теперь предположим, что мы хотим оценить и для каждого переменного значения. нас Можеткпростойодинземлявыражатьдляs1 + s2
:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-u7lkM1B5-1681365384123) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00119.jpeg)]
Pandas сопоставил все переменные измерения в каждой последовательности.,Воля Эти значения суммируются,Затемсуществоватьодинкраткийиззаявлениесередина Волякаждыйпеременнаяизобщийивозвращаться Даватьнас。
также Можетк Воля标количествоценитьотвечатьиспользовать ВSeries
。 результат Волядаиспользоватьобозначениеиздействовать Воля标количествоотвечатьиспользовать ВSeries
серединаизкаждыйценить:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-Q1RJmp7l-1681365384124) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00120.jpeg)]
Помните, я упоминал ранее о приезде,нас Волявозвращатьсясоздаватьиметь标количествоценитьизSeries
?? При выполнении таких операций Pandas Фактически будут выполнены следующие операции:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-j8ZH2pao-1681365384124) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00121.jpeg)]
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-JH0PSv74-1681365384124) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00122.jpeg)]
Нет.один步даот标количествоценитьсоздаватьодинSeries
,носглаз标Series
изиндекс。 Затем Воля乘Законотвечатьиспользовать ВдваSeries
объектиз Выравниваниеценить,То же от Виндекса,Они идеально выравниваются.
Индекс в из Этикетке не требует выравнивания. Если не выровнено, то Pandas ВолявозвращатьсяNaN
делатьдлярезультат:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-bwe1RPZ1-1681365384124) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00123.jpeg)]
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-68o9D6Uu-1681365384125) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00124.jpeg)]
По умолчанию,NaN
ценитьдалюбой Pandas Выравниваниеизрезультат,Чтосерединаиндекс Этикеткаи ДругойодинSeries
Нет Выравнивание。 и NumPy По сравнению с Это Pandas из Важные особенности. Если метки не выровнены, исключение не должно создаваться. Это помогает, когда чего-то не хватает, но это приемлемо. Обработка все еще продолжается, но Pandas проходитьвозвращатьсяNaN
Можеткпозволятьты Знатьжитьсуществоватьвопрос(но Нетодин Конечнодавопрос)。
Pandas Индекс не обязательно должен быть уникальным в из Этикетке. Выравниваниедействоватьна самом делесуществоватьдваSeries
серединаформастановиться Этикеткаиз Декартово произведение。 если1
последовательностьсерединаиметьn
индивидуальный Этикетка,и2
последовательностьсерединаиметьm
индивидуальный Этикетка,норезультатобщийсчитатьдляn * m
результатсерединаиз ХОРОШО。
Для демоэтотодин点,позволятьнасиспользоватьк ВниздваSeries
объект:
[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-bDONsXyw-1681365384125) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00125.jpeg)]
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-Wm0P3lXf-1681365384125) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00126.jpeg)]
Это произведет 6 индивидуальный'a'
индекс Этикетка,ки'b'
и'c'
изNaN
:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ddz8aAqR-1681365384126) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00127.jpeg)]
индексдлянаспредоставил Что-то вродебаза ВЧто ЭтикеткасуществоватьSeries
середина Находитьценитьиз Нет Часто эффективенизозначает。 но,еслитыдуматьбаза ВэтотнекоторыйценитьсуществоватьSeries
середина Находить条глаз,что делать?
Чтобы справиться с этой ситуацией, Pandas Нам предоставляется логический выбор. Логический выбор Волялогикаповерхностьвыражениеотвечатьиспользовать ВSeries
изценить,И существование возвращает новое логическое значение последовательности для каждого значения.,Эти логические значения представляют собой результат выражения. Затем,Долженрезультат Можетиспользовать Втольконести ВыбиратьрезультатдляTrue
изценить。
Для демо Логический выбор,позволятьнасот ВнизлапшаизSeries
начинатьиотвечатьиспользоватьбольшой Вбольшой Воператор Приходитьправильный Конечнобольшой Вилиждать В3
изценить:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-nhtrwrqi-1681365384126) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00128.jpeg)]
этот Воляпривести кSeries
иметьсоответствоватьизиндекс Этикетка,ииповерхностьвыражениеизрезультат Воляотвечатьиспользовать Вкаждый Этикеткаизценить。 ценитьизdtype
дляbool
。
Затем Доступно киспользовать Долженпоследовательностьоторигинальныйпоследовательностьсерединавыбиратьценить。 проходить Волялогическое значениерезультатпередачаприезжатьисточникиз[]
оператор Приходитьосуществлятьэтотвыбирать。
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-SLQR08zK-1681365384126) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00129.jpeg)]
Можеткв[]
операторсерединаосуществлятьлогика运算Приходитьпростой化грамматика:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-gBt3R7OL-1681365384127) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00130.jpeg)]
Неудачная изда, обычная из Python Синтаксис не может использовать несколько логических операторов. Например,к вызывает исключение:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-GSMqnsp7-1681365384127) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00131.jpeg)]
Существуют технические причины, по которым приведенный выше код не работает должным образом. решениедаиспользоватьдругойиз Способповерхностьдостигатьуравнение,существуют Добавляйте круглые скобки до и после каждого логического условия.,идляи/или(|
и&
)использоватьдругойизоператор:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-KSRnuuLY-1681365384127) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00132.jpeg)]
использовать.all()
метод Можеткправильный КонечноSeries
серединаиз Местоиметьценитьданетиданныйповерхностьвыражениесоответствовать。 Внизлапшаиз Внутри Позволять询просить Долженпоследовательностьсерединаиз Местоиметьэлементданет Всебольшой Вилиждать В0
:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-UFI7jMoY-1681365384127) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00133.jpeg)]
Если какое-либо значение удовлетворяет выражению,но.any()
метод ВолявозвращатьсяTrue
。 Внизлапшаиз Внутри Позволять询проситьданетиметьлюбойэлемент Маленький В2
:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-xoxYzRaN-1681365384128) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00134.jpeg)]
ты Можетквернорезультатвыбиратьиспользовать.sum()
метод Приходитьправильный Конечноиметьмногонемногопроектудовлетворитьповерхностьвыражение。 Этопотому чтокогдаданныйлогическое значениеценитьпоследовательность,Долженпоследовательностьиз.sum()
методвстреча ВоляTrue
Видетьдля1
иFalse
Видетьдля0
:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-kDKuordw-1681365384128) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00135.jpeg)]
существовать Pandas середина ТяжелыйновыйиндексдаделатьSeries
серединаизданныесопоставить группу Этикеткаизпроцесс。 Pandas использоватьэто Приходитьосуществлятьбольшойчасть Выравниваниепроцесс,поэтомудаодин项Базовыйдействовать。
Перереализованы следующие функции:
NaN
отметкаNaN
ценить)Легко переустановить,ТолькодляSeries
из.index
свойствораспространятьодинновыйиндекс Прямо сейчас Может。 Внизлапша Демо Понятнокэтотдобрый Способ ИзменятьSeries
изиндекс:
[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-jsp7803V-1681365384128) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00136.jpeg)] [Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-IWrPwxZh-1681365384129) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00137.jpeg)]
назначен на.index
свойствоиз Списокповерхностьсерединаизэлементчисло必须и ХОРОШОчислосоответствовать,нет Тогда Воля выбрасывает исключение. Тяжелыйновыйиндексвозвращаться Сразуземля Исправлять ПонятноSeries
。
проходитьиспользовать.reindex()
метод,Гибкое создание нового индекса. Ситуация да присваивает новый индекс,Номер Этикетки не соответствует:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-YKiJUHpy-1681365384129) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00138.jpeg)]
Следующий код использует набор с новыми значениями,потерянныйценитьи Тяжелый叠ценитьиз ЭтикеткадляSeries
Тяжелыйновыйподготовлениндекс:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-YKVaypJu-1681365384129) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00139.jpeg)]
закрывать В.reindex()
,иметь Несколько点нуждатьсяуказать。 первыйда.reindex()
методизрезультатдановыйизSeries
,и Нетда Сразуземля Исправлять。 новыйизSeries
иметьс Этикеткаизиндекс,нравитьсяперешел кфункциячас Местообозначение。 ВолядляоригинальныйSeries
серединажитьсуществоватьизкаждый Этикеткакопироватьданные。 еслисуществоватьоригинальныйSeries
серединапопытаться найти Нетприезжать Этикетка,но ВоляNaN
распространятьдля Долженценить。 наконец,ВоляудалитьSeries
серединас Нетсуществоватьновыйиндекссерединаиз Этикеткаиз ХОРОШО。
когдатыхотеть ВыравниваниедваSeries
квернодваSeries
серединаизценитьосуществлятьдействоватьноSeries
объект Нет Зависит от В某добрый原因Выравниваниеиз Этикеткачас,Повторный индекс также полезен. Обычная ситуацияда,одинSeries
иметьцелое числотипиз Этикетка,Еще одна строка,но значение избазового значения да такое же, как из (от удаленного источника при получении данных,этоточень распространенный)。 кк ВнизSeries
объектдляпример:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-7MEMoVKY-1681365384129) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00140.jpeg)]
хотядваSeries
середина Этикеткаиз То же значение,но Зависит от Вэтоихизтип данные разные, они выровнены Воля. Как только проблема обнаружена, ее можно легко устранить:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-TD4MS2dc-1681365384130) (https://gitcode.net/apachecn/apachecn-). ds-zh/-/raw /master/docs/learning-pandas-2e/img/00141.jpeg)]
.reindex()
методиметьпо умолчаниюдействовать,Прямо сейчассуществоватьисточникSeries
серединапопытаться найти Нетприезжать Этикеткачас,ВоляNaN
делатьдля Недостатокизценитьвставлять。 Доступно киспользоватьfill_value
параметр Изменятьэтотценить。 Внизлапшаиз Пример Демоиспользовать0
заменятьNaN
:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-pjg8pgY0-1681365384130) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00142.jpeg)]
когдаверноиметь序данные(Напримервремяпоследовательность)осуществлять Тяжелыйновыйиндексчас,Можеткосуществлять Вставлятьценитьилиценитьнаполнение。 существовать Нет. 10 глава“данные временных В «рядах» Воля более подробно обсуждает интерполяцию и дополнение, и следующий пример высоты иллюстрирует эту концепцию. позволятьнасотк ВнизSeries
начинать:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-DdHT6E0x-1681365384130) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00143.jpeg)]
Следующий пример иллюстрирует концепцию прямого заполнения.,обычно называетсяпоследнее известное значение。 ТяжелыйновыйиндексSeries
ксоздаватьнепрерывныйизцелое числоиндекс,ипроходитьиспользоватьmethod='ffill'
параметр,длялюбойновыйизиндекс Этикеткараспространять Первыйвпередуже ЗнатьизНе НЭН ценить:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-SpiMv3Bu-1681365384130) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00144.jpeg)]
индекс Этикетка1
и2
и Этикетка0
изкрасный,4
и5
от Этикетка3
изgreen
кикрасный6
приезжать5
изblue
соответствовать。
к Вниз Примериспользоватьmethod='bfill'
накладка назад:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-5Uk9wz6z-1681365384130) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00145.jpeg)]
Этикетка6
Нет Первыйвпередизценить,поэтому Воля ЧтонастраиватьдляNaN
; 4
настраиватьдля5
(blue
)изценить; 2
и1
настраиватьдля Этикетка3
(green
)изценить。
Series
из Сразуземля Исправлятьэтоспорныйизтема。 если Можетспособный,большинствохорошийосуществлятьвозвращатьсясновыйSeries
серединавыражатьиз ИсправлятьизновыйSeries
издействовать。 но,если необходимо,Может изменять значения и добавлять/удалять строки на месте.
проходитьдля尚Нетжитьсуществоватьизindex
Этикеткараспространятьценить,Можно найти впоследовательностьсерединадобавить водин ХОРОШО。 к ВнизкодсоздаватьодинSeries
объект,И добавьте к этой последовательности дополнительный элемент:
[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-4BXrn289-1681365384131) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00146.jpeg)]
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-Xub6CtWy-1681365384131) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00147.jpeg)]
Вы можете изменить его, присвоив конкретному индексу существование Этикетка из значения:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-QlqYp1qG-1681365384131) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00148.jpeg)]
Можеткпроходить Воляindex
Этикеткаперешел кdel()
функцияотSeries
серединаудалить ХОРОШО。 Внизлапша Демо Понятнокакудалитьсиндекс Этикетка'a'
из ХОРОШО:
[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-8HB5wE14-1681365384131) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00149.jpeg)]
хотетьдобавить виудалитьдискомфорт Когдазпроект,пожалуйстаиспользоватьpd.concat()
использовать Логический выбор Приходитьдобавить виудалить.
использоватькусочекиз Важно помнитьда,кусочекизрезультатдаоригинальныйSeries
извид。 проходитькусочекдействоватьрезультат Исправлятьценить Воля ИсправлятьоригинальныйизSeries
。
Рассмотрим следующий пример,Должен ПримервыбиратьSeries
серединаизвпереддваэлементи Воля Чтожитьмагазинсуществоватьновыйпеременнаясередина:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-pUw1oO5L-1681365384131) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00150.jpeg)]
Воляценитьназначен накусочекэлементизк Вниздействовать Воля ИзменятьоригинальныйSeries
серединаизценить:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-yeW09KrQ-1681365384132) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00151.jpeg)]
существования В этой главе вы узнали Pandas Series
объекткикак Воля Чтоиспользовать Ввыражатьпеременная Измерениеценитьизиндексвыражать。 насоткаксоздаватьиинициализацияSeries
и Чтоассоциацияиндексначинать,Затем Исследовать ПонятнокакодинилимногоиндивидуальныйSeries
объектсерединаманипулироватьданные。 Мы рассмотрели, как Выровнять по индексному тегуSeries
объекткикакв Применяйте математические операции над значениями правепиз. Затем мы проверили, как найти данные по индексу, к и как в. соответствии сданные (логическое выражение) выполняет запрос. Затем,нас Заканчивать Понятновернокакиспользовать Тяжелыйновыйиндекс Приходить Изменятьиндекси Выровнять данныеиз Исследовать。
существовать Внизодинглавасередина,ты Воляузнать, какиспользоватьDataFrame
кединыйизповерхностьсеткаструктуравыражатьмногоиндивидуальныйSeries
данные。
Pandas DataFrame
объект ВоляSeries
объектиз Функция Расширятьдлядваизмерение。 заменятьодининдивидуальныйценитьпоследовательность,фрейм данныеиз Каждая строка может иметь несколько значений, каждое значение представлено в виде столбца. Затем, каркас данныеиз Каждая строка может использоваться для наблюдения за несколькими связанными атрибутами, а каждый столбец может представлять разные типы.
фрейм данныеиз каждого столбца да Pandas Series
,иифрейм Данные можно рассматривать как форму данных, например, электронную таблицу или таблицу Библиотеки. ноэтотнекоторый比较и НетсимволобъединитьDataFrame
изхотетьпросить,Потому что кадр данных Pandas уникален из Нет, очень отличается по качеству,Напримерпредставлять СписокизSeries
объектизавтоматическийданные Выравнивание。
Это автоматическое выравнивание использует фрейм данные более эффективны, чем электронные таблицы или данные библиотеки, для проведения анализа пола. данных。 Объединив существующие строки и столбцы одновременно с функцией «сокращенныеиз», этот ифрейм Изданные данные для интерактивного просмотра и функции просмотра очень эффективны для того, чтобы найти то, что вам нужно.
существуют В этой главе мы, Воля, углубимся в Pandas DataFrame
。 Series
встреча熟悉многоконцепция,но добавим некоторые инструменты обработки данных для поддержки его работы. Конкретно,существоватькнигаглавасередина,Мы освещаем следующие темы:
Series
объекти CSV документсоздаватьDataFrame
Мы начинаем эту главу со следующего оператора импортироватьиконфигурацию:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-htdjQzXM-1681365384132) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00152.jpeg)]
Существует много видов создания фреймворков. данныхизметод。 Можно получить изодинилиодин Группамногоизмерениеданныенаборсоздаватьрамка данных。 Наше исследование технологий заключается в следующем:
Series
объектиз Python словарьсерединаизданныесуществуют При проверке всего этого,Еще мы Воля проверяем, как указывать имена столбцов,Как выполнить выравнивание во время инициализации Демо и посмотреть, как определить размер кадра данных.
фрейм данные могут быть представлены одномерными NumPy Целое число (диапазон от 1 приезжать 5) Создайте:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-pZesLpEH-1681365384132) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00153.jpeg)]
Первый столбец вывода показывает, что индексиз Этикетка создана. Создано Всуществовать без указания индекса, т.е. Pandas создавать Понятноодинбаза ВRangeIndex
из Этикетка,Этикеткаиз начинается с 0.
данныесуществовать Нет.два Списоксередина,Зависит отценить1
к5
Группастановиться。 данные Списокначальствонаправлениеиз0
да Должен Списокизимя。 существоватьсоздаватьфрейм данные, когда имя столбца не указано, pandas использоватьот 0 Начните с увеличения целых чисел для именования столбцов.
также Доступно киспользоватьмногоизмерение NumPy массив и создайте несколько столбцов:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-TcuGLIj5-1681365384132) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00154.jpeg)]
Доступно киспользовать.columns
свойстводоступDataFrame
из Список:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-WV5pIjqr-1681365384133) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00155.jpeg)]
Это показывает, что если имена столбцов не указаны, Pandas ВолясоздаватьодинRangeIndex
Приходитьвыражать Список。
Доступно киспользоватьcolumns
параметробозначение Списокимя。 Внизлапшасоздавать Понятноодиндва СписокDataFrame
,Представляем два города и две выборки температуры:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-MF6Na12I-1681365384133) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00156.jpeg)]
Доступно киспользоватьlen()
функцияпопытаться найтиприезжатьDataFrame
серединаиз ХОРОШОчисло:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-nvsmOXRN-1681365384133) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00157.jpeg)]
Доступно киспользовать.shape
свойствопопытаться найтиприезжатьDataFrame
изразмер:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-eII9N9qD-1681365384133) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00158.jpeg)]
Python словарь Можетиспользовать ВинициализацияDataFrame
。 использовать Python словарь, панды Воля использует ключи в качестве имен столбцов, а Воля использует каждый ключ из значения как изданные столбцы:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-KkvivW8g-1681365384134) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00159.jpeg)]
создаватьDataFrame
изчастоиспользоватьтехнологиядаиспользовать Воляиспользоватьделать ХОРОШОиз Pandas Series
объектиз Списокповерхность:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-oaScfzAk-1681365384134) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00160.jpeg)]
существуют В этом случае,каждыйSeries
представлятькаждый Городсуществоватьидентификация Измерениеинтервалвизодининдивидуальный Измерение。
Чтобы назвать столбец,нас Можеткпытатьсяиспользоватьcolumns
параметр:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-bT5yG15z-1681365384134) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00161.jpeg)]
Этот результат отличается от того, что мы могли ожидать,потому чтоэтотнекоторыйценитьужеиспользоватьNaN
наполнение。 Это можно исправить двумя способами. Нет.Что-то вродеда Воля Списокимяназначен на.columns
свойство:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-IqtwvKD5-1681365384134) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00162.jpeg)]
Еще один прием даиспользовать Python словарь,где ключ да имя столбца,каждыйключизценитьдаSeries
,Представляет показатель в этом конкретном столбце:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ykx5Ce1Q-1681365384134) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00163.jpeg)]
пожалуйста, обрати внимание,существовать СтроитьDataFrame
час,Воля ВыравниваниенестидляизSeries
。 Ниже добавлен третий город с разными значениями индекса, чтобы проиллюстрировать это:
[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-5xFBqLdJ-1681365384135) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00164.jpeg)]
Можеткпроходитьиспользоватьpd.read_csv()
функцияот CSV Файл считывает данные для создания фрейма данных.
pd.read_csv()
Волясуществовать Нет. 9 Проведите более обширное исследование в главе «Посещение данных».
Для демо Долженпроцесс,нас Воляотодин Включать S&P 500 Снимокиздокументсерединанагрузкаданные。Должендокументимядляsp500.csv
,Кусочек Вкод Сумкаизdata
глаз录середина。
Файл из первой строки Включает каждую переменную/столбец по имени, остальные 500 представляют ряды по 500 различных значений.
к Загрузите код ниже данных,При этом укажите, какой столбец в файле использовать Виндекс.,А нам нужны всего четыре конкретных столбца (0, 2, 3 и 7):
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-QqloEvNX-1681365384135) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00165.jpeg)]
использовать.head()
исследоватьвпередпять ХОРОШО,Покажите нам структуру ниже:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-SxxLEIHR-1681365384135) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00166.jpeg)]
Давайте проверим этот фреймворк данныеиз Некоторые свойства. оно должно было иметь 500 данные строки. Можеткпроходитьисследоватьфрейм длина данныхиз для проверки:
[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-FWeBHrJr-1681365384135) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00167.jpeg)]
мы хотим, чтобы это имело 500 ХОРОШОитри Списокизформа:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-dCpsBsmU-1681365384136) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00168.jpeg)]
Доступно киспользовать.size
свойствопопытаться найтиприезжатьфрейм данныхизразмер。 Это свойство возвращает фрейм данныхсерединаданныеценитьизколичество。 мы ожидаем 500 * 3 = 1,500:
[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-oI1S6Hnn-1681365384136) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00169.jpeg)]
Фрейм данныхизиндекс состоит из 500 акций из символов:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-YnZHtP5G-1681365384136) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00170.jpeg)]
Столбцы состоят из следующих трех имен:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-2DEJZUpw-1681365384136) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00171.jpeg)]
пожалуйста, обрати внимание,Хоть мы и указали при загрузке четыре столбца,Но результат всего лишь Включить три столбца,Потому что в одном из четырех столбцов исходного файла используется Виндекс.
фрейм данные состоят из строк и столбцов и имеют структуру данных, выбранную в определенной строке и столбце. этотнекоторыйвыбиратьиспользоватьиSeries
такой жеизоператор,Сумкавключать[]
,.loc[]
и.iloc[]
。
Несколько измерений,поэтомуотвечатьиспользоватьэтотнекоторыйизмерениестепеньизпроцесс略иметьдругой。 Мы воляпроходить сначала учимся выбирать столбцы, а затем строки, существовать выбирать строки и столбцы из комбинации к и исполь зовать Логический в одном операторе. выбор, чтобы проверить это.
Кроме того, панды Предоставляет конструкцию с Всуществовать, которую мы хотим проверить, выбирая одно скалярное значение в определенной строке и столбце. Этот метод важен и полезен, поскольку обеспечивает очень высокопроизводительный способ доступа к этим значениям.
использовать[]
операторвыбиратьDataFrame
идентификация Списоксерединаизданные。 этотиSeries
другой,существоватьSeries
середина,[]
обозначение Понятно ХОРОШО。 Можетк Воля[]
действоватьсимволперешел кодининдивидуальныйобъектилипредставлятьхотеть Поискиз Списокизобъект Списокповерхность。
к Вниз Внутри Позволять Поискимяназывается'Sector'
из Список:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ZGjKBNEw-1681365384136) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00172.jpeg)]
когдаотDataFrame
середина Поискодининдивидуальный Списокчас,результатдляSeries
:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-nU9SmwQi-1681365384137) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00173.jpeg)]
Привести указанный список имен столбцов можно к Поиск нескольких столбцов:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-i7eJidkf-1681365384137) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00174.jpeg)]
По В у него несколько столбцов,поэтомурезультатдаDataFrame
и НетдаSeries
:
[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-lveKt5HD-1681365384137) (https://gitcode.net/apachecn/apachecn-). ds-zh/-/raw /master/docs/learning-pandas-2e/img/00175.jpeg)]
Доступ к столбцам также можно получить с помощью атрибута кпроходить. Толькохотетьимя Нет Включатькосмос,DataFrame
Волядобавить впредставлять Каждый Списокимяизсвойство。 Внизлапшакэтотдобрый Способ ПоискPrice
Список:
[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-LxOPIoSp-1681365384137) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00176.jpeg)]
пожалуйста, обрати внимание,этотимядискомфортиспользовать ВBook Value
Список,Потому что в названии есть пробелы.
Доступно киспользовать.loc[]
проходитьиндекс Этикеткаценить Поиск ХОРОШО:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-1hbs7lcR-1681365384137) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00177.jpeg)]
также,Доступно киспользовать Этикетка Списокповерхность Поискмного ХОРОШО:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-sUmQJRyU-1681365384138) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00178.jpeg)]
Доступно киспользовать.iloc[]
в соответствии с Расположение Поиск ХОРОШО:
[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-jALCqBst-1681365384138) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00179.jpeg)]
Можно найти видентификация Этикеткаценитьизиндекссередина Находить Расположение,Затемиспользовать Долженценитьв соответствии с Расположение Поиск ХОРОШО:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-WU48ypO5-1681365384138) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00180.jpeg)]
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-exX6iwKj-1681365384138) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00181.jpeg)]
В качестве заключительного замечания этого раздела,также Доступно киспользовать.ix[]
руководитьэтотнекоторыйдействовать。 но этот метод устарел. иметьзакрывать Дажемногоподробныйинформация,пожалуйста Видетьздесь。
.at[]
и.iat[]
в соответствии с Этикеткаили Расположениеруководить标количество НаходитьДоступно киспользовать.at[]
проходить Этикетка Находитькаждыйиндивидуальный标количествоценить,А также передайте ему имена строк и столбцов:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-KSoEpqOw-1681365384139) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00182.jpeg)]
также Доступно киспользовать.iat[]
в соответствии с Расположение Находить标количествоценить,Также передайте строку Расположениеи столбец Расположение. Это Доступ к одному значению из предпочтительного метода,И может обеспечить высочайшую производительность:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ZlrtwYs3-1681365384139) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00183.jpeg)]
[]
операторруководитькусочексуществовать ЧтоиндексначальствокусочекDataFrame
существоватьграмматиканачальствоииспользоватьSeries
осуществлятьтакой жедействоватьтакой же。 поэтому,Мы Волясуществовать в этом разделе не упоминаем различные механизмы из деталей.,итолько查看отвечатьиспользовать ВDataFrame
из Несколькоиндивидуальныйпредставлятьсекс Пример。
использовать[]
операторруководитькусочекчас,Волясуществоватьиндекси Нет Списокначальствоосуществлятькусочек。 Первые пять строк следующего содержания:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-7Z1kEtde-1681365384139) (https://gitcode.net/apachecn/apachecn-). ds-zh/-/raw /master/docs/learning-pandas-2e/img/00184.jpeg)]
иик ВнизвозвращатьсяотABT
ЭтикеткаприезжатьACN
Этикетканачинатьиз ХОРОШО:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-P9kQREki-1681365384139) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00185.jpeg)]
кусочекDataFrame
такжеподходящийиспользовать В.iloc[]
и.loc[]
свойство。 использовать Эти свойства считаются лучшими практиками.
Доступно киспользовать Логический выбор для выбора строк. При применении Вфрейма данныхчас,Логический выборк может использовать несколько столбцов в изданных. Рассмотрите возможность запроса ниже,Должен Запрослоготипцена Низкий В100
из Местоиметьзапас:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-hAS6enid-1681365384139) (https://gitcode.net/apachecn/apachecn-). ds-zh/-/raw /master/docs/learning-pandas-2e/img/00186.jpeg)]
Затем Доступно киспользовать[]
оператор Воляэтотрезультатотвечатьиспользовать ВDataFrame
,ктольковозвращатьсярезультатдляTrue
из ХОРОШО:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-BYnhYCUA-1681365384140) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00187.jpeg)]
Доступно киспользоватьскобки Волямногоиндивидуальный Условное освобождениесуществовать Вместе。 к Вниз Внутри Позволять Поискценасуществовать6
и10
междуиз Местоиметьзапасизкодицена:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-whu8bRxJ-1681365384140) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00188.jpeg)]
Обычно используют несколько переменных выполнения выбора. Внизлапшапроходить НаходитьSector
дляHealth Care
иPrice
большой Вилиждать В100.00
из Местоиметь ХОРОШОПриходитьдоказыватьэтотодин点:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-5zCFrDXI-1681365384140) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00189.jpeg)]
Обычно выборка состоит из подмножества строк и столбцов. Внизлапшапроходитьпервыйвыбиратьчасть ХОРОШОЗатемвыбирать Местонуждатьсяиз Список Приходитьиллюстрироватьэтотодин点:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ziPYKx69-1681365384140) (https://gitcode.net/apachecn/apachecn-). ds-zh/-/raw /master/docs/learning-pandas-2e/img/00190.jpeg)]
существования В этой главе вы узналикаксоздавать Pandas DataFrame
объекткибаза ВРазличный Списоксерединаизиндексиценитьвыбиратьданныеиз Различныйметод。 этотнекоторый ПримериSeries
из Примерсходство,Доказательство,Зависит от ВDataFrame
иметь Списокиассоциацияиз Списокиндекс,поэтомуграмматикаиSeries
иметь Местодругой。
существовать Внизодинглавасередина,нас ВолядальшеиспользоватьDataFrame
идти глубже Исследоватьданныедействовать,и着Тяжелый ВверноDataFrame
структураи Внутри Позволятьруководить Исправлять。
Pandas Предоставляет мощный механизм манипуляций, который можно использовать для просмотра данных. этотдобрыйисследоватьв целомс участиемверноDataFrame
объектизструктураруководить Исправлять,к Удалите ненужные изданные,Изменятьсейчасиметьданныеиз Форматилиот Чтоон ХОРОШОили Списоксерединаизданныесоздаватьпроизводнаяданные。 В этих главах показано, как выполнять эти мощные и важные операции.
В частности, существование в этой главе мы представляем:
[]
и.insert()
добавить вновый Список.drop()
удалить ХОРОШОСледующий код Воля — это следующий пример Настроить Панды среда. Это также загрузит S&P 500 данныенабор,кудобный Можно найти в примере используйте его:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-qf5t8IUN-1681365384140) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00191.jpeg)]
Доступно киспользоватьподходящийкогда命имяиз.rename()
метод Переименование столбцов。 Можетк Кэтотметодпередачаодинсловарьобъект,Ключ из указывает, что вы хотите переименовать столбец из Этикетка.,И каждый ключ имеет новое имя.
Внизлапшаиздействоватьвстреча Воля'Book Value'
Списокизимя Изменятьдля'BookValue'
,Удалите пробелы и разрешите символу атрибута использовать доступ к столбцу «изданные».
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-l1VpuxAy-1681365384141) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00192.jpeg)]
кэтотдобрый Способиспользовать.rename()
Волявозвращатьсяодинновыйизфрейм данные, где столбец из переименован, и данныедаот исходных данных в копироватьиз. Следующее содержимое подтверждает, что исходный файл не был изменен.
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-forHycic-1681365384141) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00193.jpeg)]
Чтобы существовать без копирования, измените его на месте. данных,Доступно киспользоватьinplace=True
параметр。
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-irpOY6qa-1681365384141) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00194.jpeg)]
сейчассуществовать Доступно киспользовать.BookValue
свойстводоступданные。
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-07jiuO23-1681365384141) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00195.jpeg)]
[]
и.insert()
добавить вновый СписокДоступно киспользовать[]
оператор Воляновый Списокдобавить вприезжатьфрейм данных。 позволятьнасдобавить водинимядляRoundedPrice
изновый Список,Должен Список ВолявыражатьPrice
Списоксерединаценитьиз Округление。
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-Cd5lGgBF-1681365384142) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00196.jpeg)]
Панды делают это из WAYда,первыйотsp500
серединавыбиратьPrice
Списокизданные,Затем ВоляSeries
серединаиз Местоиметьценить Четыре舍пять入。 Тогда панды ВоляновыйизSeries
икопироватьDataFrame
Выравнивание,и Воля Чтодобавить вдляимядляRoundedPrice
изновый Список。 В конце колонки приезжатьиндексиз добавлен новый столбец «Воля».
.insert()
метод Можетиспользовать Всуществоватьидентификация Расположениедобавить вновый Список。 ВнизлапшасуществоватьSector
иPrice
междувставлятьRoundedPrice
Список:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-9tl0qzRd-1681365384142) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00197.jpeg)]
Доступно киспользовать.loc[]
свойствоикусочекдобавить в Список。 Внизлапшапроходить КимядляPER
изsp500
изребенокнабордобавить вновый Список,и Воля Местоиметьценитьинициализациядля0
Приходить Демоэтотодин点。
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-fx8Vn5HT-1681365384142) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00198.jpeg)]
иметьсейчасиметьданныеизSeries
также Можеткпроходитьэтотдобрый Способдобавить в。 Внизлапша ВоляPER
Списокислучайныйданныеизпоследовательность Добавлять。 По этому выравниванию необходимо использовать целевой фрейм данныхтакой жеизиндекс。
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-wB6jcUZ8-1681365384142) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00199.jpeg)]
[]
оператори.insert()
метод Все Сразуземля Исправлятьглаз标фрейм данных。 Если вам нужен новый фреймворк с дополнительными столбцами из данных(Сохранять持原Приходитьизпостоянный),но Доступно киспользоватьpd.concat()
функция。 этотсоздание функция нового каркаса данных,Чтосередина МестоиметьобозначениеизDataFrame
объектвсев соответствии сканонический порядоксоединятьсуществовать Вместе。
Внизлапшаизкодсоздавать ПонятноодинновыйизDataFrame
,где из столбца Включать округленное изцена. Затем,этоиспользоватьpd.concat()
иaxis=1
ПриходитьвыражатьданныйизDataFrame
объектотвечатьвдоль着Списокосьсоединять(ииспользоватьaxis=0
из ХОРОШОпо сравнению с)。
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-qGy55C62-1681365384142) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00200.jpeg)]
существовать Нет. 11 глава(слить,Связанные и измененные данные) в Воля более подробное подключение имени.
Объединение может привести к дублированию имен столбцов. Для демоэтотдобрый Состояние,позволятьнас Тяжелыйновыйсоздаватьrounded_price
,но Воля Что命имядляPrice
Список。
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-FGvuNhTv-1681365384143) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00201.jpeg)]
В настоящее время объединение Воля приводит к появлению дубликатов столбцов.
[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ZBTWisM4-1681365384143) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00202.jpeg)]
Интересный,ты Доступно киспользовать.Price
свойство Поискэтотдва Список。
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-SyNkXx9Y-1681365384143) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00203.jpeg)]
еслихотетьсуществоватьсценасерединаполучатьидентификацияизPrice
Список,Затем вам нужно нажать «Расположение» вместо имени «Поиск».
Выберите столбцы в нужном порядке, вы можете изменить порядок столбцов. Ниже примените обратный столбец, чтобы продолжить демонстрацию.
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-wlSdU7Uv-1681365384143) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00204.jpeg)]
На самом деле, нет возможности изменить порядок столбцов на месте. Видетьздесь。
проходитьиспользовать[]
оператор ВоляновыйизSeries
назначен насейчасиметь Список,МожеткзаменятьDataFrame
из Внутри Позволять。 к Вниз Демо Понятноиспользоватьrounded_price
серединаизPrice
СписокзаменятьPrice
Список。
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-rWNsCISS-1681365384144) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00205.jpeg)]
Списокизданныетакже Доступно киспользоватькусочекзаменять(Сразуземля)。
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-yO9384TQ-1681365384144) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00206.jpeg)]
Доступно киспользоватьфрейм данныхизdel
закрыватьключ字или.pop()
или.drop()
методотDataFrame
середина Удалить столбец。 Эти различия в поведении немного отличаются:
del
ВоляотDataFrame
серединаудалитьSeries
(На месте)pop()
Волятакой жечасудалитьSeries
ивозвращатьсяSeries
(такжеда На месте)drop(labels, axis=1)
Волявозвращатьсяодинуже Удалить столбецизновыйфрейм данных(оригинальныйDataFrame
объектеще нет Исправлять)Внизлапша Демо Понятнокакиспользоватьdel
отsp500
данныеизкопироватьсерединаудалитьBookValue
Список:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-HH9R9BSF-1681365384144) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00207.jpeg)]
к Внизиспользовать.pop()
методудалитьSector
Список:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-aMyqzT4r-1681365384144) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00208.jpeg)]
.pop()
методиз Преимуществасуществовать Вэтодлянаспредоставилнеожиданно возникнутьиз Список。
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-E1o9K99Y-1681365384145) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00209.jpeg)]
.drop()
метод Можетиспользовать Вудалить ХОРОШОи Список。 хотетьиспользоватьэто Удалить столбец,пожалуйстаобозначениеaxis=1
:
[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-uj36kGEG-1681365384145) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00210.jpeg)]
использоватьDataFrame
из.append()
методосуществлять ХОРОШОиздобавление。 дополнительныйпроцесс ВолявозвращатьсяодинновыйизDataFrame
,ипервыйдобавить в ПриходитьсоригинальныйDataFrame
изданные,Затем Сновадобавить в Нет.два ХОРОШОизданные。 Добавление не выполняет выравнивание и может привести к дублированию индексных меток.
к Внизкод Демо Понятнодополнительныйдваотsp500
данныесерединанести ВыбиратьизDataFrame
объект. Нет.одинDataFrame
Зависит от ХОРОШО(в соответствии с Расположение)0
,1
и2
Группастановиться,Нет.дваиндивидуальныйDataFrame
Зависит от ХОРОШО(в соответствии с Расположение)10
,11
и2
Группастановиться。 два者середина Все Включать Расположение2
виз ХОРОШО(с ЭтикеткаABBV
),к Демодублировать индекс Этикеткаиз создан.
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-N51f6EY6-1681365384145) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00211.jpeg)]
добавлениесерединаиспользоватьизDataFrame
объектиз Списокнабор Нет必такой же。 Рамка результатов данных Воля Зависит отдва Списокизинабор Группастановиться,Недостатокиз СписокданныенаполнениеиметьNaN
。 к Вниз Внутри Позволятьпроходитьиспользоватьиdf1
такой жеизиндекссоздавать Нет.трииндивидуальныйфрейм данных,но Толькоиметьодин Списокизимя Нетсуществоватьdf1
середина Приходитьиллюстрироватьэтотодин点。
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-ngtcuWms-1681365384146) (https://gitcode.net/apachecn/apachecn-). ds-zh/-/raw /master/docs/learning-pandas-2e/img/00212.jpeg)]
сейчассуществовать,насдополнительныйdf3
иdf1
。
[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-XH6ZFlfk-1681365384146) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00213.jpeg)]
ignore_index=True
параметр Можетиспользовать Вдополнительный,и无нуждатьсямощный制отDataFrame
бронироватьиндекс。 Когдандексценитьиз意义Нетбольшойииты Тольконадеяться Воляиметь Порядок увеличенияизцелое числоизкаскадданныеиспользоватьделатьиндексчас,Это полезно:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-lFEXN2Dm-1681365384146) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00214.jpeg)]
пожалуйста, обрати внимание,результатDataFrame
иметьпо умолчаниюизRangeIndex
,иииндекс(Symbol)
)серединаизданныеужеотрезультатсерединанад全排удалять。
Доступно киспользоватьpd.concat()
функцияипроходитьобозначениеaxis=0
Воля ПриходитьсмногоиндивидуальныйDataFrame
объектиз ХОРОШОонэтотсоединять。 вдоль ХОРОШОосьсуществоватьдваDataFrame
объектначальстворуководитьpd.concat()
изпо умолчаниюдействоватьиз Способи.append()
методтакой же。
Проведение реконструкции предыдущего из приложенного примера из двух наборов данных и воля их связанных, может доказать это.
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-CPS8evYu-1681365384147) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00215.jpeg)]
если МестоиметьDataFrame
объектсерединаиз Списокнабор Все Неттакой же,но Pandas ВоляиспользоватьNaN
наполнениеэтотнекоторыйценить。
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-wpco8mJV-1681365384147) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00216.jpeg)]
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-TvLBpYK7-1681365384147) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00217.jpeg)]
из исходного объекта построчно копировать приведет к дублированию изиндекс Этикетка. keys
параметр Можетиспользовать В帮助区分один Группа ХОРОШОисточникс哪индивидуальныйфрейм данных。 Внизлапшапроходитьиспользоватьkeys
Квыражатьисточникобъектизиндексдобавить водинуровеньруководить Демо:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-xCXV7HCv-1681365384148) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00218.jpeg)]
Мы будем в главе 6 Более подробно иерархические индексы изучены в главе «Работа с индексами».
также Доступно киспользовать.loc
свойство Воля ХОРОШОдобавить вприезжатьDataFrame
。 .loc
изпараметробозначениехотетьместо ХОРОШОизиндекс Этикетка。 если Этикетка Нетжитьсуществовать,ноиспользоватьданныйизиндекс Этикетка Воляценитьдополнительныйприезжатьфрейм данных。 Если Этикетка содержит существующее, Воля заменяет значение из в указанной строке.
к Вниз Примерполучатьsp500
изребенокнабор,идобавить вс ЭтикеткаFOO
из ХОРОШО:
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-CiGcZUL9-1681365384148) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00219.jpeg)]
пожалуйста, обрати внимание,Добавляет или заменяет строку,Все это сделают Изменить.
.drop()
удалить ХОРОШОDataFrame
из.drop()
метод Можетиспользовать Вудалить ХОРОШО。 .drop()
методполучатьхотетьудалитьизиндекс Этикетка Списокповерхность,ивозвращатьсяDataFrame
изкопировать,Указанная строка удаляется.
[Передача изображения по внешней ссылке не удалась. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-nBvqVzuN-1681365384148) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00220.jpeg)]
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-fPNYfmVm-1681365384148) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00221.jpeg)]
Логический выбортакже Можеткиспользовать ВотDataFrame
серединаудалить ХОРОШО。 Логический результат выборки Воля возвращает выражение как True из ХОРОШОиз копии. хотетьудалить ХОРОШО,Просто создайте выражение,дляхотетьудалитьиз ХОРОШОвозвращатьсяFalse
,Затем Воля Долженповерхностьвыражениеотвечатьиспользовать Вфрейм данных。
Внизлапшаиз Пример ДемоудалитьPrice
большой В300
из ХОРОШО。 Сначала составьте выражение.
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-UTFAMXOB-1681365384148) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00222.jpeg)]
в соответствии с этим результатом мы сейчас существуем, знаем, что существует 10 ХОРОШОизценабольшой В 300. Чтобы удалить эти строки изфрейма данные, пожалуйста, выберите выберите из дополнения.
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-iDafyi1r-1681365384149) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00223.jpeg)]
кусочек Можетиспользовать Вотфрейм Удалить записи в данных. Это и Логический выбор аналогичен изпроцессу существования. В этом процессе мы выбрали все строки, кроме строки к, которую нужно удалить.
гипотезанасхотетьотsp500
серединаудалять去удалятьвпередтрииндивидуальный Записыватькснаружииз Местоиметь Записывать。 осуществлятьэтот Задачаизкусокда[:3]
,Он возвращает первые три строки.
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-qvMiYgd8-1681365384149) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00224.jpeg)]
пожалуйста, запомни,Зависит от ВЭтокусочек,поэтомурезультатдаоригинальныйфрейм данныхизвид。 этотнекоторый ХОРОШО尚еще нетотsp500
данныесерединаудалить,верноэтоттри ХОРОШОиз Изменять Воля Изменятьsp500
серединаизданные。 Предотвратите эту ситуацию из Правильные меры да Сделайте копию фрагмента, в результате чего будет копировано указание строки из данного кадра. данных。
[Не удалось передать изображение по внешней ссылке. Исходный сайт может иметь механизм защиты от кражи. Рекомендуется сохранить изображение и загрузить его напрямую (img-KVM9REvG-1681365384149) (https://gitcode.net/apachecn/apachecn-ds). -zh/-/raw /master/docs/learning-pandas-2e/img/00225.jpeg)]
существования В этой главе вы узналикакиспользовать Pandas DataFrame
объектосуществлять Несколькодобрыйобщийизданныедействовать,Специальный дапроходитьдобавить вилиудалить ХОРОШОи Список Приходить ИзменятьDataFrame
структураиздействовать。 также,Мы рассмотрели, как приезжать заменяет изданные в конкретной строке и столбце.
существовать Внизодинглавасередина,Мы Воля изучаем индексизиспользовать подробнее,Для этой цели можно использовать данные поиска в объекте pandas.