Анализ настроений - Советы по Excel

Анализ настроений в Excel! Существует бесплатная надстройка от Microsoft Labs, которая позволит вам проводить анализ тональности в Excel. Что, если вам придется просмотреть сотни комментариев к опросам, чтобы узнать, что люди думают о вашей компании? Excel может назначить вероятность, показывающую, насколько положительным или отрицательным является каждый комментарий.

Смотреть видео

  • Когда есть несколько вариантов выбора, легко дать количественную оценку данных опроса.
  • Вы можете использовать сводную таблицу, чтобы выяснить, какой процент имеет каждый ответ
  • Но как насчет ответов в свободной форме? Их сложно обработать, если у вас их сотни или тысячи.
  • Анализ настроений - это машинный метод прогнозирования положительного или отрицательного ответа.
  • Microsoft предлагает инструмент для анализа настроений в Excel - Машинное обучение Azure.
  • Традиционный анализ настроений требует, чтобы человек проанализировал и классифицировал 5% утверждений.
  • Традиционный анализ настроений не является гибким - вы будете перестраивать словарь для каждой отрасли.
  • Excel использует лексикон субъективности MPQA (читайте об этом на http://bit.ly/1SRNevt)
  • Этот общий словарь включает 5097 отрицательных и 2533 положительных слов.
  • Каждому слову присваивается сильная или слабая полярность.
  • Это отлично подходит для коротких предложений, таких как твиты или сообщения в Facebook.
  • Его можно обмануть двойным отрицанием
  • Чтобы установить, перейдите в Insert, Excel Store, найдите Машинное обучение Azure.
  • Укажите диапазон ввода и два пустых столбца для диапазона вывода.
  • Заголовок для диапазона ввода должен соответствовать схеме: tweet_text
  • Сопутствующая статья по адресу: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/

Стенограмма видео

Изучайте Excel из подкаста, эпизод 2062: анализ настроений в Excel

Ой, это была ночь Благодарения, и мы сидели за тыквенным пирогом, и Джес, наш друг, начал говорить о проведении анализа настроений в данных Twitter. И я сказал: «Эй, вы знаете, что в Excel есть способ проводить анализ настроений». И я понял, что у меня нет хорошего видео по этому или любого другого видео по этому поводу, поэтому это видео посвящено анализу тональности в Excel.

Теперь первый вопрос: что, черт возьми, такое сентиментальный анализ? И если вы проведете опрос своих клиентов, и у них есть выбор из нескольких вариантов, где они могут выбрать от 1 до 5, что ж, это действительно очень легко проанализировать. Вы можете просто создать небольшую сводную таблицу: Вставьте сводную таблицу, существующий рабочий лист прямо здесь, нажмите ОК. Мы хотим знать вопрос или ответ на вопрос, а затем, сколько ответов было на каждый из них, и это дает нам абсолютное число. Вы даже можете зайти сюда и изменить это с «Параметры поля» на «Показывать значения в процентах от общей суммы столбца», вот так.

Хорошо, поэтому вы можете видеть для каждого ответа, какой процент людей получил ответ. Хорошо, но анализ настроений предназначен для случаев, когда у вас есть действительно длинный ответ, в котором вы говорите: «Эй, хорошо, ну, вы знаете, расскажите, почему вы дали нам этот ответ?» И они, как вы знаете, используют предложения или абзацы. Что ж, если у вас их сотни или тысячи, кому-то очень трудно пройти через это, прочитать их все и понять, что происходит, хорошо?

Итак, есть два разных типа анализа настроений. Обычно в прошлом вы использовали алгоритм обучения под руководством человека. Итак, если у вас было 5 000 ответов, просмотрите 200 из них и выберите положительные и отрицательные слова и фразы. По сути, вы составляете словарь положительных и отрицательных слов; но, знаете, это было очень ограничивающе. Если вы сделали это для места, где ремонтировали автомобили, а затем у вас был другой клиент, вы знаете, который занимался чисткой ковров, эти два словаря совершенно разные. Вы должны снова и снова заниматься машинным обучением или обучением под руководством человека. Итак, Excel использует то, что называется лексиконом субъективности MPQA, и вы можете пойти в Google. Есть информация об этом - 5097 отрицательных слов, 2533 положительных слова. И так,он отлично подходит для коротких предложений, твитов или сообщений в Facebook. Но я заметил одну вещь: если кто-то пишет с двойным отрицанием, я не могу сказать, что не ненавижу эту функцию, ну, машинное обучение там не сработает. И, черт возьми, я проиграл. Я не могу сказать, счастливы они или нет.

Хорошо, вот что мы делаем. В Excel 2013 или Excel 2016 перейдите на вкладку «Вставка», перейдите в Магазин, когда появится поле поиска, выполните поиск машины Azure, и вы сразу же получите Машинное обучение Azure. Нажимаем Добавить. Хорошо, и здесь есть два разных инструмента: Titanic Survivor Predictor, это весело; и надстройка Excel для анализа тональности текста. Воспользуемся этим. Хорошо, вот пара вещей, которые вас сбивают с толку. Ваш заголовок: возьмите абзац, чтобы объяснить свой ответ. Он должен соответствовать схеме, а в схеме указано, что заголовок должен указывать tweet_text. Итак, здесь: tweet_text, конечно, учитывает регистр, хорошо. Затем закройте схему, а затем «Прогноз», ввод: от A1 до 100, Мои данные имеют заголовки, вывод: DataB1, Включите заголовки. Они дадут нам 2 столбца.Убедитесь, что у вас есть 2 пустых столбца; в противном случае он переопределит данные. У вас есть 2 варианта: несколько строк за раз или пакетом. Это всего сотня, так что это не имеет значения. Я выберу Predict и BAM! Просто так быстро.

Хорошо, теперь у нас есть 2 столбца: мы получаем тональность и оценку, хорошо. Итак, давайте представим здесь результаты в виде процентов с множеством десятичных знаков. Хорошо, 47.496, это значение изменяется от 0 до 100%. Около 100 - это очень положительно, а близкое к 0 - крайне отрицательно, хорошо? Итак, у нас есть одна, в которой есть небольшая проблема, сводящая меня с ума. Не могу найти решение, поэтому вы можете понять, почему это оценивается как крайне негативное. Давайте посмотрим на один из них, который оказался чрезвычайно позитивным. Хорошо, поэтому у нас есть несколько счастливых слов: пожалуйста и спасибо, восклицательные знаки и так далее. Это может способствовать получению высокого балла. Хорошо, так это идеально? Нет, но это даст вам быстрый способ сказать вам, знаете ли, сколько людей очень довольны или крайне отрицательно относятся к этим ответам.

И, конечно же, здесь мы можем сделать это с помощью сводной таблицы: Insert, Pivot Table, перейти к существующему рабочему листу прямо здесь, щелкнуть OK, и нас интересует тональность, а затем, возможно, со средним баллом для каждый из них. Поэтому мы изменим это значение в разделе «Параметры поля» на «Среднее», нажмите «ОК». И так, а может, даже Граф. Думаю, нам бы хотелось узнать графа, сколько людей. Итак, мы возьмем какое-нибудь другое поле, и, таким образом, мы знаем, сколько людей были отрицательными. Ох, сколько людей были нейтральными, сколько людей были позитивными и каков средний балл каждого из них.

Хорошо, поэтому, если у вас есть данные опроса и их можно выбрать из нескольких вариантов, легко использовать сводную таблицу, чтобы выяснить, какой процент имеет каждый ответ. Но для ответов в свободной форме это сложно обработать. Если у вас их сотни или тысячи, анализ тональности - это машинный метод прогнозирования положительного или отрицательного ответа. Microsoft предлагает для этого бесплатный инструмент. Работает в Excel 2013 или Excel 2016, называется Машинное обучение Azure. Обычно приходится вручную разбирать и классифицировать 5% заявлений. Это не гибко, вам нужно повторно классифицировать для каждого нового набора данных, но Excel использует этот лексикон субъективности MPQA. Это общий словарь. Это будет работать для коротких предложений, твитов, публикаций в Facebook. Меня могут обмануть двойные отрицания. Так что просто зайдите в магазин Excel,найдите Машинное обучение Azure. Укажите вход и два столбца для диапазона вывода. Не забудьте изменить заголовок, чтобы он соответствовал схеме, tweet_text, в данном конкретном случае.

Хорошо, поехали. В следующий раз, когда у вас будет большой объем данных для анализа, воспользуйтесь Машинным обучением Azure, бесплатной надстройкой для Excel 2013. Спасибо, что заглянули, мы увидимся в следующий раз на другом сетевом трансляции от.

Скачать файл

Загрузите образец файла здесь: Podcast2062.xlsm

Интересные статьи...