С быстрым развитием эпохи Интернета платформы социальных сетей стали для людей важным средством передачи своих эмоций миру. Некоторые люди используют текстовый контент, изображения, аудио и видео, чтобы выразить свою точку зрения. С другой стороны, на основе Web Интернет-СМИ Текстовое общение может быть немного утомительным. Благодаря платформам социальных сетей каждую секунду в Интернете генерируется большое количество неструктурированных данных. Данные должны обрабатываться так же быстро, как данные генерируются, чтобы можно было своевременно понять психологию человека, и это можно сделать с помощью анализа тональности текста. Он оценивает отношение автора к проекту, агентству, человеку или месту: отрицательное, положительное или нейтральное. существуют Некоторые приложения требуют не только анализа настроений,Обнаружение эмоций также необходимо.,Это позволяет точно идентифицировать людей.изнастроение/психическое состояние。«В этой статье представлен обзор уровней анализа настроений, различных моделей анализ эмоций и настроений и текст Процесс понимания эмоций Наконец, в этой статье обсуждается процесс анализа эмоций и настроений. с которыми пришлось столкнуться」。
Понимание человеческого языка и создание человеческого языка — два направления исследований в области обработки естественного языка (НЛП). Однако первое является более сложным из-за двусмысленности, присутствующей в естественном языке. Распознавание речи, обобщение документов, ответы на вопросы, синтез речи, машинный перевод и использование других приложений. NLP。«Две ключевые области обработки естественного языка: анализ настроений и обнаружение эмоции. Хотя эти два имени иногда используются как синонимы, в некоторых аспектах они различаются. анализ настроенияда Метод оценки данных дапозитивный, негативный или данейтрализ》。
Взаимно Сравниватьпод,Обнаружение эмоцийда Метод выявления различных типов человеческих эмоций.,например, гнев、счастьеили разочарован。“Обнаружение эмоций”、«Аффективные расчет», «анализ настроений» и «распознавание эмоций» — все эти фразы иногда используются как синонимы. Поскольку Интернет-сервис улучшился,Люди используют социальные сети, чтобы выразить свои чувства. существовать в социальных сетях,Люди выражают свои чувства, аргументы и мнения так, как им заблагорассудится. также,Многие пользователи предоставляют отзывы и обзоры услуг на различных веб-сайтах электронной коммерции. Оценки и комментарии пользователей на различных платформах побуждают поставщиков и поставщиков услуг совершенствовать свои существующие системы, товары или услуги. сейчас,Почти каждая существующая отрасль или компания переживает ту или иную цифровую трансформацию.,Это генерирует большое количество структурированных и неструктурированных данных. Перед компанией стоит непростая задача — преобразовать неструктурированные данные в значимую информацию.,чтобы помочь им принять решения.
«В мире бизнеса поставщики используют Weibo, YouTube, Twitter. и Facebook и другие платформы социальных сетей для продвижения информации о продуктах и сбора клиентов. связь」。людиизпозитивныйобратная Связь помогает продавцам не только измерять удовлетворенность клиентов и отслеживать конкурентоспособные продукты.,И это также выгодно потребителям, которые хотят купить продукт. Анализ настроений помогает маркетологам лучше понять точку зрения клиентов.,Чтобы они могли внести необходимые изменения в свои продукты или услуги. Развитие социальных сетей облегчило и ускорило взаимодействие инвесторов на фондовом рынке. поэтому,Эмоции инвесторов могут повлиять на их инвестиционные решения,Эти решения могут быстро распространяться и распространяться по сети.,Фондовый рынок может существовать в определенной степени, меняясь (Ахмед 2020). Поэтому можно сказать, что эмоции и анализ настроения изменили то, как мы ведем бизнес.
«В здравоохранении Twitter и другие социальные сети в Интернете стали важным источником информации о здоровье для медицинских работников и граждан»。Например,люди Всегдасуществоватьподелиться своими Covid-19 Пандемия мыслей, мнений и чувств. Пациентов просят оставаться изолированными от своих близких, что вредит их психическому здоровью. Чтобы избавить пациентов от проблем с психическим здоровьем, таких как депрессия, практикующие врачи должны использовать автоматическое распознавание эмоций. настроений。людиобычно через нихиз Почтасуществовать Поделитесь ими на сайтеизчувства или убеждения,Если кто-то выглядит подавленным,Люди могут попросить их о помощи,Это предотвращает ухудшение состояния психического здоровья.
「существовать Область образования,Эмоции и переживания играют жизненно важную роль как для учителей, так и для учеников. Педагогические способности учителя зависят не только от его академической квалификации.,Это также зависит от его страсти, таланта и преданности делу».。Слушайте студентов сразуизобратная связьда Самый эффективный способ для учителей улучшить свои методы обучения. анализ настроенияиз Результаты помогают учителям и организациям принимать корректирующие меры. С момента появления социальных сетей образовательные учреждения все больше полагаются на Facebook и Twitter и другие социальные сети для маркетинга и рекламы. Студенты и опекуны проводят обширные онлайн-исследования и узнают больше о потенциальных существующих учреждениях, курсах и профессорах. Они используют блоги и другие форумы, чтобы общаться со студентами-единомышленниками и оценивать качество возможных колледжей и университетов. Поэтому применяйте эмоции и анализ «Настроения» могут помочь студентам существования выбрать лучшее из учебного заведения или преподавателя в процессе регистрации.
Анализ эмоциональных настроений имеет широкий спектр применения,Это можно сделать различными методами。«Технология анализа эмоциональных настроений делится на три типа: словарное обучение, глубокое обучение на основе машинного обучения»。каждыйметод Все Имеют свои преимущества и недостаткиточка。несмотря на различияизнастроениеираспознавание эмоцийтехнология,Исследователи все еще сталкиваются с серьезными проблемами,Это включает в себя обработку контекста, сарказм, выражение множества эмоций, распространение интернет-сленга, а также лексическую и синтаксическую двусмысленность. также,Поскольку стандартных правил передачи чувств не существует.,Некоторые люди выражают свои эмоции по-разному. поэтому,для исследователей,Разработка технологии, которая могла бы эффективно работать во всех областях, является огромной проблемой.
Многие люди во всем мире теперь используют блоги, форумы и сайты социальных сетей, такие как Twitter , Facebook, Weibo и т. д.), чтобы поделиться своим мнением с остальным миром. Социальные сети стали одним из самых эффективных средств коммуникации. В результате генерируется большой объем данных, называемый большими. данные и представил анализ настроений, чтобы эффективно и результативно анализировать эти большие данные。Для отрасли или организации,Понимание эмоций пользователей стало чрезвычайно важным. анализ настроений,часто называемый майнингом мнений,да Способ определить интерес автора или пользователя к темеизточка зрениядапозитивныйвозвращатьсядаотрицательныйизметод。«Анализ настроений определяется как процесс использования естественных методов обработки для получения значимой информации и семантики из текста, а также для определения отношения автора к тексту».,Такое отношение можетдапозитивныйиз、отрицательныйизили нейтральныйиз」。потому чтоанализ настроенияизглазизда определяет полярность и классифицирует текст мнения как положительный или отрицательный, поэтому анализ настроенийучаствует виз Набор Диапазон категорий данных не ограничивается положительными или отрицательными, они могут быть «согласны» или «несогласны», «хороши» или «плохи». его также можно использовать 5 Балльная шкала для количественной оценки: категорически не согласен, не согласен, нейтрально, согласен или полностью согласен. Например, Ye et al. 1 приезжать 5 из стран Европы и США из обзоров с применением анализа настроений. они будут 1 звезда или 2 Звездные отзывы связаны с негативной полярностью и будут 2 Комментарии выше звезд связаны с положительной полярностью. Гребнер и др. создали словарь для конкретной предметной области, состоящий из токенов со значениями настроений. Эти токены собираются на основе отзывов клиентов в сфере путешествий, чтобы классифицировать настроения в сфере путешествий от плохих до отличных. 5 звездный рейтинг.
Анализ тональности может выполняться на трех уровнях: уровне предложения, уровне документа и уровне аспекта. существуют уровень предложения или уровень фразы в анализе настроений,Документ или абзац разбит на предложения.,И определите каждое предложение по полярности. существуют Анализ на уровне документа для извлечения глобальных настроений из длинных текстов, содержащих избыточные и большие объемы。Среди них наиболее сложной задачей является классификация настроений на уровне документов.изаспектдарассмотреть словаифразамеждуизконтакт и весь контекстизсмысловая информация,Это требует более глубокого понимания сложной внутренней структуры эмоций и зависимых слов. существуют уровень аспекта,анализ настроениядасуществовать осуществляется при определенных аспектах. Например, скорость процессора очень высока, но цена продукта слишком высока. Здесь существуют два аспекта: скорость и стоимость. В предложении приезжать упоминается скорость, и поэтому он называется явным аспектом, тогда как стоимость да является неявным аспектом. Уровень аспекта из анализа настроений Сравнить Два других более сложны, поскольку трудно идентифицировать неявные характеристики.
«На самом деле анализ настроенийи Обнаружение Эмоции часто используются исследователями как взаимозаменяемые слова. Но да, они существуют по-разному. существовать анализ настроения, полярность (положительная, отрицательная, нейтральная) на основной акцент наточка,исуществовать Обнаружение эмоции, определяет эмоциональные или психические состояния (злой, счастливый, грустный и т. д.). анализ настроений Очень субъективно,и Обнаружение эмоции более объективны и точны»。
Эмоции являются неотъемлемой частью жизни человека. Эти эмоции влияют на принятие решений человеком и помогают нам лучше общаться с миром. Обнаружение Эмоции, также известные как распознавание эмоций, — это процесс идентификации различных чувств человека (например, радости, печали или гнева). Последние несколько лет исследователи усердно работали над автоматизацией распознавания эмоций. Однако некоторые физические нагрузки, такие как частота сердечных сокращений, дрожание рук, потливость и тон голоса, также могут передавать эмоциональное состояние человека, но обнаружить эмоции по тексту довольно сложно. Более того, с течением времени появляются различные двусмысленности и новые сленги или термины, что усложняет распознавание эмоций в тексте. Кроме того, Обнаружение эмоции не ограничиваются выявлением основных психологических состояний (радостность, грусть, злость, наоборот, часто доходят до приезжать); 6 уровень или 8 уровень, в зависимости от модели эмоций。
В английском языке слово «эмоция» появилось в семнадцатом веке и происходит от французского слова «эмоция», что означает физическое беспокойство. существовать 19 Несколько столетий назад страсть, желание и эмоции были классифицированы как психические состояния. существовать 19 века слово «эмоция» считалось психологическим термином. В существующей психологии комплекс чувственных состояний может привести к изменениям в мыслях, поведении, поведении и личности, называемых эмоциями. В широком смысле психологического или модельного. эмоции делятся на две категории: Габаритная модели классификации модели.
Многомерная модель Эта модель представляет эмоции на основе трех параметров: валентности, возбуждения и силы. Валентность представляет полярность, а возбуждение показывает, насколько захватывающе это ощущается. Например, депрессия более волнительна, чем радость. Мощность представляет собой ограничение эмоций. Эти параметры определяют положение психического состояния в двумерном пространстве, как показано на рисунке ниже.
Категориямодель эмоции, существование В этой модели эмоции определяются дискретно, например, гнев, счастье, печаль и страх. Эмоции подразделяются на четыре, шесть или восемь категорий в соответствии с конкретной моделью классификации. Например: Бритва Модель классифицирует эмоции на шесть категорий: печаль, радость, гнев, страх, любовь и удивление.
На изображении ниже изображены многочисленные эмоциональные состояния, которые можно встретить в различных моделях существования. Эти государства Plutchik Модель рисуется по четырем осям базовой модели. Как показано ниже,Наиболее часто используемые эмоциональные состояния в разных моделях включают гнев, страх, радость, удивление и отвращение. Это видно из рисунка,Эмоции по обе стороны оси не всегда противоположны друг другу. Например,грусть и счастье напротив друг друга,Но гнев недастрахизпротивоположный。
анализ настроенийи Обнаружение Процесс создания эмоций включает в себя сбор Набора данных、предварительная обработка、Извлечение Различные этапы, включая выводы, разработку и оценку модели, показаны на рисунке ниже.
Sentiment и Самый распространенный из Набор в области анализа настроений данныхдаSemEval、SST、ISEAR。SemEvalиSSTНабор данныесуществовать имеет разные варианты с точки зрения домена, размера и т. д. Среди них ИСЭАР да собрано от нескольких опрошенных, которые чувствовали одну из семи эмоций, существующих в определенных ситуациях. Набор данные в основном включают твиты, комментарии, отзывы, истории и т. д. Эмо Банк Набор данные собираются из новостей, блогов, писем и т. д. с использованием модели Valence, Arousal Dominance Model (VAD) и з Габаритная. модель. Многие исследования получают данные из сайтов социальных сетей, таких как Twitter, YouTube и Facebook, и отмечаются в литературе экспертами по языку и психологии. Данные, полученные с различных платформ социальных сетей, таких как публикации, блоги, сайты электронной коммерции, обычно неструктурированы, поэтому их необходимо структурировать, чтобы уменьшить привлечение внимания. признаки дополнительных операций.
В социальных сетях люди обычно выражают свои чувства и эмоции непринужденно. Таким образом, данные, полученные с этих платформ социальных сетей (посты, аудиты, комментарии, комментарии и критика), крайне неструктурированы, что затрудняет машинному анализу настроений. настроения. Поэтому предварительная обработка является критическим этапом очистки данных, поскольку качество данных существенно повлияет на многие методы после предварительной обработки. Набор организации данныхиз требуется предварительная обработка, включая токенизацию, удаление стоп-слов, POS Теги и т. д. Некоторые из этих методов предварительной обработки могут вызвать эмоциональный анализ. настроенияиз критической информации отсутствует и ее необходимо решать.
Токенизация — это процесс разбиения всего документа, абзаца или просто предложения на фрагменты слов, называемые токенами. Например, рассмотрим предложение «это place is so красивая» и после причастия,Оно станет «это», «место», «есть», «так», «красиво».,«Это соответствует китайскому причастию из»。Стандартизированный текст для данных о реализациииз Согласованность имеет решающее значение при преобразовании текста в стандартный формат.,Исправьте написание слов из и т. д.
Ненужные слова необходимо удалить, например артикль и некоторые предлоги, которые не помогают распознаванию эмоций и анализу настроений, и предлоги з. Например, стоп-слова, такие как «is», «at», «an» и «the», не связаны с тональностью, поэтому эти слова необходимо удалить, чтобы избежать ненужных вычислений.
Маркировка частей речи — метод идентификации разных частей речи в предложении. Этот шаг помогает обнаружить аспекты предложения, которые обычно описываются существительными или именными фразами, а эмоции выражаются прилагательными.
Есть два ключевых этапа: стемминг и лемматизация: предварительная обработка и лемматизация. При существовании слово преобразуется в корневую форму путем усечения суффикса. Например, термины «спорить» и «спорить» становятся «спорить». Этот процесс уменьшает потребность в вычислениях предложений. Лемматизация включает морфологический анализ для удаления инфекционных окончаний из токенов и преобразования их в основные словесные леммы. Например, слово «поймал» преобразуется в «поймать». Симеонидис Эксперимент и др. показал, что удаление чисел и лемматизация повышают точность, тогда как удаление знаков препинания не влияет на точность.
Машины понимают текст на основе чисел. Процесс сопоставления текста или слов с вещественными векторами называется векторизацией слов или встраиванием слов. Это своего рода Извлечение методика признаков, при которой документ разбивается на предложения, а затем на слова после этого строится карта признаков или матрица; В сгенерированной матрице существования каждая строка представляет предложение или документ, а каждый столбец признака представляет слово из словаря, а значение существования, хранящееся в ячейке карты признаков, обычно представляет собой количество слов из в предложении или документе. . Для проведения Извлечения признаки, один из наиболее прямых методов, использующих «мешок слов» (BOW), который определяет вектор счетчика фиксированной длины, в котором каждая запись соответствует слову в заранее определенном словаре слов. существующее предложение не существует в предопределенном словаре, то его количество равно 0, в противном случае счетчик больше или равен 1, в зависимости от того, сколько раз оно встречается в предложении. Вот почему длина вектора всегда равна длине слов, присутствующих в словаре. Преимущество этого метода заключается в простоте реализации, но он также имеет очевидные недостатки, поскольку приводит к разреженной матрице, потере порядка слов в предложении и неспособности уловить смысл предложения. Например, для представления значений из предопределённого словаря I, Hope, you, are, наслаждаюсь, читая текст "" you enjoying читаю", это значит да (0,0,1,1,1,1). Однако эти представления можно использовать посредством предварительной обработки текста и n-gram、TF-IDF улучшить.
N-gram Этот метод является отличным выбором для определения порядка слов в представлениях векторов предложений. существовать n-gram В векторном представлении текст представляется уникальным. n-gram иметь в виду n Сотрудничество групп смежных терминов или слов. н Значением может быть любое натуральное число. Например, рассмотрим предложение «чтобы teach is to touch a life forever”,n = 3 вызов trigram будет генерировать 'to teach is ','teach is to ','is to touch,''to touch a'',“touch a life”,«жизнь навсегда». так,может сохранять предложенияиззаказ。「N-gram Соотношение функций BOW методы работают лучше, потому что они охватывают синтаксические шаблоны, включая ключевую информацию. Однако, несмотря на n-gram сдержал словоиззаказ,но у него большие размерыи Разреженность данных」。
Частота термина — обратная частота документов, часто сокращается до TF-IDF, еще один широко используемый даиз Извлечение Метод признаков. Этот метод представляет текст в виде матрицы, где каждое число количественно определяет количество информации, которую эти термины несут в данном документе. На его основе создаются редкие термины существующих текстовых документов, содержащих много информации. частота слова да слово w Количество вхождений в документе, разделенное на слово в документе. W Общая численность ЦАХАЛа да log(общее количество документов (N), разделенное на слова w Общее количество появившихся документов (n)。«Ахуджа и др. применили шесть алгоритмов машинного обучения и использовали n = 2 из n-gram и TF-IDF существовать SS-tweet Набор данныхпродолжать Извлечение характеристики и сделать выводы TF-IDF Сравнивать n-gram Имеет лучшую производительность»。
Наличие больших объемов данных делает их более глубокими. Сеть обучения способна обнаруживать хорошие векторные представления. Встраивание слов на основе нейронной сети признаков Дополнительная информация。"существовать на основе нейронной сети из встраивания слов",Слова, имеющие одинаковую семантику или связанные друг с другом, представлены похожими векторами. Это предсказание слова «существовать» более популярно,Потому что оно сохраняет семантику слова из"。Зависит от Tomas Mikolov Руководитель исследовательской группы Google разработал инструмент под названием Word2Vec из модели встраивания слов. использовать Word2Vec, машина может понять, что векторное представление «королева» + «женщина» + «мужчина» совпадает с векторным представлением «король». На основе глубокого обучениеиз Модель встраивания слов из Другие примеры включают модель, разработанную исследователями Стэнфордского университета GloVe и Facebook запуск из FastText。GloVe Вектор скорости обучения Word2vec Быстрее. и Word2Vec вектор Взаимно Сравнивать,Векторы FastText имеют более высокую точность.,С помощью нескольких различных мер.
На изображении ниже показано, что используется для анализа. настроенийи Обнаружение эмоциииз Различных технологий, эти технологии условно делятся на словарные методы, машинные методы. метод обучения, основанный на глубоком метод обучения. Смешанные методы: статистика и машинные методы сочетание обученияиз позволяет преодолеть недостатки обоих методов. трансферное обучениетакжедамашинное обучение Подмножество, которое позволяет существующим другим аналогичным областям использовать предварительно обученные модели.
«На основе словаря/корпуса метода» На основе словаряизметоди На основе корпусаизметодда На основе словаря настроенийизметод,Этот класс методов поддерживает словарь/корпус,Каждому положительному и отрицательному слову присвоено значение тональности. Затем,Рассчитайте настроение всего предложения или документа, используя значение настроения из общего или среднего значения.
«На основе машинного обучениеизметод」 Весь набор данные разделены на две части для целей обучения и тестирования: данныхитест Набор данных。тренироваться Набор данныеда используется для обучения модели на основе информации путем предоставления различных экземпляров проекта из функций, а затем использования набора тестов. данные для просмотра обучения Набор Степень успешности обучения модели из данных. Обычно используется для анализа настроений измашинное. Алгоритм обучения относится к контролируемой классификации. Различные типы алгоритмов, необходимые для классификации настроений, могут включать в себя наивный Байес, машину опорных векторов. (SVM), дерево решений и т. д. Каждый алгоритм имеет свои плюсы и минусы.
«На основе глубокого обучениеизметод」 В последние годы в глубине Алгоритм обучения по-прежнему доминирует над другими традиционными методами анализа настроений. Эти алгоритмы не выполняют разработку функций без обнаружения эмоций или мнений в тексте. Существует много видов глубокого Алгоритм обучения, то есть рекуррентная нейронная сеть и сверточная нейронная сеть, может применяться для анализа настроений и дает Сравниватьмашинное Модель обучения обеспечивает более точные результаты.
«Миграция методов обучения гибридному подходу» трансферное обучениетакжедамашинное обучениеизчасть。существовать Большой Набор Модели, обученные на данных для решения одной проблемы, могут быть применены к другим связанным проблемам. Повторное использование предварительно обученных моделей, связанных с предметной областью, в качестве отправной точки может сэкономить время и дать более эффективные результаты.
 Оценка модели, в основном сравнение модели с базовой моделью на основе различных параметров. Нужна оценка метрика модели для количественной оценки производительности модели. Получает матрицу путаницы, которая обеспечивает подсчет правильных или неправильных суждений или прогнозов на основе известных фактических значений. Матрица показывает истинные положительные результаты на основе положительного класса и отрицательного класса на основе соответствия данных. (TP), ложноотрицательный (FN), ложноположительный результат (FP), истинно отрицательный (TN) ценить. На основе этих значений исследователи использовали точность, точность и полноту, F1. баллы и другие показатели для оценки эффективности их модели.
«Вопросы по орфографии и грамматике»。существовать Интернет-эра,Люди генерируют большие объемы данных в виде неформальных текстов. Сайты социальных сетей создают различные проблемы,К ним относятся орфографические ошибки и неправильное использование грамматики.
«недостаток ресурсов»。Например,Некоторые статистические алгоритмы требуют большогоиз Комментарий Набор данные. Однако сбор данных не сложный, а большой Набор данныеиз Ручная пометка занимает очень много времени и менее надежна.
«Интернет-сленг»。Например,Молодое поколение использует такие слова, как «LOL».,Значение: громко смеяться, чтобы выразить смех.,“FOMO”,Значение боязнь упустить,Выражает тревогу. Постоянно пополняющийся интернет-словарь сленга и существующий лексикон, а также модель обучения преодолевают огромные препятствия.
«Обнаружение иронии»。это стало эмоциейинастроение Утомительная задача в области тестированияиз Задача。люди Обычно используется Сатираизпредложения, выражающие ихизсердитый или разочарованный,Это да трудно обнаружить из-за. Сравнивать, например: «Ты такая красивая,Прекрасна, как фея»,В этом предложении,Отлично словами выражать положительные эмоции,Но на самом деле Комментарий Я думаю, что он уродлив。
«Множественные выражения эмоций»。Из многихточка зренияиз Трудно идентифицировать каждое из предложений в предложении.аспекти его перепискаизнастроениеилинастроение。Например,“существовать Это место выглядит мирным,Но в этом месте воняет». Это предложение показывает две эмоции: «отвращение» и «облегчение» в различных аспектах.
「Сравнивать из обнаружения полярности в предложении」。Например,Рассмотрим два предложения“Телефон A Сравнивать Телефон B Плохой» и «телефон B Сравнивать Телефон A Слово «разница» в обоих предложениях указывает на отрицательную полярность, но эти два предложения противоположны друг другу.