Descripción de palabras
La idea del motor de palabras Descriptivas surgió cuando estaba construyendo el motor para Palabras Relacionadas (es como un tesauro, pero te da un conjunto mucho más amplio de palabras relacionadas, en lugar de solo sinónimos). Mientras jugaba con vectores de palabras y la API» HasProperty » de conceptnet, me divertí un poco tratando de obtener los adjetivos que comúnmente describen una palabra. Al final me di cuenta de que hay una forma mucho mejor de hacer esto: ¡analizar libros!
Proyecto Gutenberg fue el corpus inicial, pero el analizador consiguió codiciosas y codiciosas y terminé de alimentación alrededor de 100 gigabytes de archivos de texto – en su mayoría de ficción, incluyendo muchas obras contemporáneas. El analizador simplemente mira a través de cada libro y extrae las diversas descripciones de los sustantivos.
Esperemos que sea algo más que una novedad y que algunas personas lo encuentren útil para escribir e intercambiar ideas, pero una pequeña cosa interesante es comparar dos sustantivos que son similares, pero diferentes de alguna manera significativa , por ejemplo, el género es interesante: «mujer» versus «hombre» y «niño»versus » niña». En un análisis rápido inicial, parece que los autores de ficción tienen al menos 4 veces más probabilidades de describir a las mujeres (en comparación con los hombres) con términos relacionados con la belleza (con respecto a su peso, características y atractivo general). De hecho, «hermosa» es posiblemente el adjetivo más utilizado para las mujeres en toda la literatura mundial, lo que está en línea con la representación unidimensional general de las mujeres en muchas otras formas de medios. Si alguien quiere investigar más sobre esto, hágamelo saber y puedo darle muchos más datos (por ejemplo, hay alrededor de 25000 entradas diferentes para «mujer», demasiadas para mostrarlas aquí).
El azul de los resultados representa su frecuencia relativa. Puede pasar el cursor sobre un elemento durante un segundo y aparecerá la puntuación de frecuencia. La clasificación de «unicidad» es predeterminada, y gracias a my Complicated Algorithm™, los ordena por la unicidad de los adjetivos para ese sustantivo en particular en relación con otros sustantivos (en realidad es bastante simple). Como era de esperar, puedes hacer clic en el botón «Ordenar por Frecuencia de uso» para ver los adjetivos por su frecuencia de uso para ese sustantivo.