Análisis de sentimiento: consejos de Excel

Tabla de contenido

Análisis de sentimiento en Excel! Hay un complemento gratuito de Microsoft Labs que le permitirá realizar análisis de sentimientos en Excel. ¿Qué sucede si tiene que leer cientos de comentarios de encuestas para ver qué piensa la gente de su empresa? Excel puede asignar una probabilidad que muestre qué tan positivo o negativo es cada comentario.

Ver video

  • Es fácil cuantificar los datos de la encuesta cuando se trata de opciones múltiples.
  • Puede usar una tabla dinámica para averiguar qué porcentaje tiene cada respuesta
  • Pero, ¿qué pasa con las respuestas de texto de forma libre? Estos son difíciles de procesar si tiene cientos o miles de ellos.
  • El análisis de sentimientos es un método basado en una máquina para predecir si una respuesta es positiva o negativa.
  • Microsoft ofrece una herramienta que hace análisis de sentimientos en Excel: Azure Machine Learning.
  • El análisis de sentimiento tradicional requiere que un humano analice y categorice el 5% de las declaraciones.
  • El análisis de sentimiento tradicional no es flexible: reconstruirá el diccionario para cada industria.
  • Excel usa el Léxico de subjetividad MPQA (lea sobre eso en http: // bit. Ly / 1SRNevt)
  • Este diccionario genérico incluye 5.097 palabras negativas y 2.533 positivas.
  • A cada palabra se le asigna una polaridad fuerte o débil
  • Esto funciona muy bien para oraciones cortas, como tweets o publicaciones de Facebook.
  • Puede ser engañado por dobles negativos
  • Para instalar, vaya a Insert, Excel Store, busque Azure Machine Learning
  • Especifique un rango de entrada y dos columnas en blanco para el rango de salida.
  • El encabezado del rango de entrada debe coincidir con el esquema: tweet_text
  • Artículo complementario en: http://sfmagazine.com/post-entry/may-2016-excel-sentiment-analysis/

Transcripción del video

Aprenda Excel de Podcast, Episodio 2062: Análisis de sentimientos en Excel

Oh, oye, era una noche de Acción de Gracias y estábamos sentados alrededor del pastel de calabaza y Jes, amigo nuestro, comenzó a hablar sobre hacer análisis de sentimientos en los datos de Twitter. Y dije: "Oye, sabes que Excel tiene una forma de realizar análisis de sentimientos". Y me di cuenta de que no tenía un buen video sobre este o cualquier video sobre esto, así que este video trata sobre hacer análisis de sentimientos en Excel.

Ahora la primera pregunta es, ¿qué diablos es el análisis de sentimientos? Y si realiza una encuesta a sus clientes y ellos tienen una selección de opción múltiple donde pueden elegir de 1 a 5, bueno, eso es realmente muy fácil de analizar. Puede crear una pequeña tabla dinámica: Insertar tabla dinámica, Hoja de trabajo existente aquí mismo, haga clic en Aceptar. Queremos saber la pregunta allí o la respuesta a la pregunta, y luego cuántas respuestas hubo para cada una, y eso nos da el número absoluto. Incluso puede ingresar aquí y cambiar esto de Configuración de campo para Mostrar valores como un% del total de la columna, así.

Muy bien, para que pueda ver para cada respuesta qué porcentaje de las personas obtiene una respuesta. De acuerdo, pero el análisis de sentimientos es para cuando tienes una respuesta muy larga en la que dices: "Oye, está bien, ya sabes, dinos por qué nos diste esa respuesta" Y ellos, ya sabes, usan oraciones o párrafos. Bueno, si tienes cientos o miles de estos, es muy difícil que alguien los lea todos y averigüe qué está pasando, ¿de acuerdo?

Entonces, hay dos tipos diferentes de análisis de sentimientos. Normalmente, en el pasado se utilizaba un algoritmo de aprendizaje supervisado por humanos. Entonces, si tuvieras 5,000 respuestas, revisa, ya sabes, 200 de esas y elige las palabras y frases positivas y negativas. Básicamente, estás construyendo un diccionario de palabras positivas y negativas; pero, ya sabes, esto fue muy limitante. Si hiciste esto para un lugar que reparaba autos y luego tuviste un cliente diferente, ya sabes, que limpiaba alfombras, esos dos diccionarios son completamente diferentes. Tienes que hacer el aprendizaje automático o el aprendizaje supervisado por humanos una y otra vez. Entonces, Excel usa esto llamado MPQA Subjetivity Lexicon y puedes ir a Google. Tiene la información al respecto: 5097 palabras negativas, 2533 palabras positivas. Y entonces,funciona muy bien para oraciones cortas o tweets o publicaciones de Facebook. Pero una cosa que he notado es que si alguien escribe en doble negativo, no puedo decir que no odio esta función, bueno, el aprendizaje automático fallará allí. Y diablos, fallo. No puedo decir si están felices o no.

Muy bien, esto es lo que hacemos. En Excel 2013 o Excel 2016, vaya a la pestaña Insertar, vaya a la Tienda, cuando aparezca el cuadro de búsqueda, busque Azure Machine y obtendrá Azure Machine Learning allí mismo. Hacemos clic en Agregar. Muy bien, y aquí hay dos herramientas diferentes: el Titanic Survivor Predictor, que es divertido; y el complemento de Excel de análisis de sentimiento de texto. Usemos ese. Muy bien, aquí hay un par de cosas que te harán tropezar. Su título: tome un párrafo para explicar su respuesta. Debe coincidir con el esquema y el esquema dice que el encabezado tiene que decir tweet_text. Entonces, aquí arriba: tweet_text, por supuesto, asuntos sensibles a mayúsculas y minúsculas, está bien. Y luego cierre el Esquema, y ​​luego Predecir, Entrada: A1 a 100, Mis datos tienen encabezados, Salida: DatosB1, Incluya los encabezados. Nos van a dar 2 columnas.Asegúrese de tener 2 columnas en blanco allí; de lo contrario, anulará los datos. Tiene 2 opciones: unas pocas filas a la vez o como un lote. Esto es solo cien, por lo que realmente no importa. ¡Elegiré Predecir y BAM! Así de rápido.

Muy bien ahora, obtenemos 2 columnas: obtenemos un Sentimiento y una Puntuación, de acuerdo. Entonces, representemos los puntajes aquí como porcentajes con un montón de lugares decimales. Muy bien, 47.496, esto va de 0 a 100%. Cerca de 100 es extremadamente positivo, cerca de 0 es extremadamente negativo, ¿de acuerdo? Así que aquí tenemos uno en el que hay un problema menor, me vuelve loco. No puedo encontrar la solución, por lo que puede ver por qué está siendo calificado como extremadamente negativo. Veamos uno que resulte extremadamente positivo. Muy bien, para que lo sepas, tenemos algunas palabras felices aquí: por favor y gracias, signos de exclamación, etc. Eso podría estar contribuyendo a la puntuación más alta. Muy bien, ¿es perfecto? No, pero le dará una manera rápida y rápida de decirle, ya sabe, cuántas personas están extremadamente felices o extremadamente negativas con esas respuestas.

Y, por supuesto, nuevamente, aquí podemos hacer esto con una tabla dinámica: Insertar, Tabla dinámica, ir a una Hoja de trabajo existente aquí mismo, hacer clic en Aceptar, y estamos interesados ​​en el Sentimiento, y luego tal vez con el Puntaje promedio es para cada uno de esos. Así que cambiaremos esto en Configuración de campo para que sea un promedio, haga clic en Aceptar. Y así, o tal vez incluso un conde. Supongo que nos gustaría conocer al Conde, cuántas personas. Entonces, tomaremos otro campo, y entonces, sabemos cuántas personas fueron negativas. Oh, cuántas personas fueron neutrales, cuántas personas fueron positivas y cuál fue el puntaje promedio de cada una de ellas.

De acuerdo, si tiene datos de encuestas y es una opción múltiple, una tabla dinámica fácil de usar para averiguar qué porcentaje tiene cada respuesta. Pero las respuestas de texto de formato libre son difíciles de procesar. Si tiene cientos o miles de ellos, el análisis de sentimientos es un método basado en una máquina para predecir si una respuesta es positiva o negativa. Microsoft ofrece una herramienta gratuita para ello. Funciona en Excel 2013 o Excel 2016, denominado Azure Machine Learning. Por lo general, es necesario revisar y categorizar el 5% de las declaraciones manualmente. No es flexible, debe volver a categorizar para cada nuevo conjunto de datos, pero Excel está utilizando este Léxico de subjetividad MPQA. Es un diccionario genérico. Funcionará para oraciones cortas, tweets, publicaciones de Facebook. Me pueden engañar los dobles negativos. Así que vaya a Excel Store,busque Azure Machine Learning. Especifique una entrada y dos columnas para un rango de salida. No olvide cambiar el encabezado para que coincida con el esquema, tweet_text, en este caso particular.

Muy bien, ahí tienes. La próxima vez que tenga una gran cantidad de datos para analizar, consulte el uso de Azure Machine Learning, el complemento gratuito para Excel 2013. Gracias por visitarnos, nos vemos la próxima vez para otro netcast de.

Descargar archivo

Descargue el archivo de muestra aquí: Podcast2062.xlsm

Articulos interesantes...