Describing Words
The idea for the Describing Words engine came when I was building the engine for Related Words (it’s like a thesaurus, but gives you a much larger set of related words, rather than just synonyms). Enquanto brincava com vetores de palavras e a API” HasProperty ” da conceptnet, eu me diverti um pouco tentando obter os adjetivos que comumente descrevem uma palavra. Finalmente percebi que há uma maneira muito melhor de fazer isso: livros de análise!
Project Gutenberg was the initial corpus, but the parser got greedier and greedier and I endeding it somewhere around 100 gigabytes of text files-mostly fiction, including many contemporary works. O analisador simplesmente olha através de cada livro e tira as várias descrições de substantivos.
esperançosamente é mais do que apenas uma novidade e algumas pessoas realmente vão achar útil para a sua escrita e brainstorming, mas uma coisa pequena para tentar é comparar dois substantivos que são semelhantes, mas diferentes de alguma forma significativa – por exemplo, o sexo é interessante: “mulher” contra “homem ” e” rapaz “contra ” rapariga”. Em uma análise rápida inital, parece que os autores de ficção são pelo menos 4x mais propensos a descrever mulheres (em oposição aos homens) com termos relacionados à beleza (em relação ao seu peso, características e atratividade geral). Na verdade,” bela ” é possivelmente o adjetivo mais amplamente utilizado para as mulheres em toda a literatura do mundo, o que está em consonância com a representação geral unidimensional das mulheres em muitas outras formas de mídia. Se alguém quer fazer mais pesquisa sobre isso, deixe-me saber e eu posso dar-lhe muito mais dados (por exemplo, há cerca de 25000 entradas diferentes para “mulher” – muitos para mostrar aqui).
a azuleza dos resultados representa a sua frequência relativa. Você pode pairar sobre um item por um segundo e a pontuação de frequência deve aparecer. A ordenação de “singularidade” é padrão, e graças ao meu algoritmo complicado™, Ele ordena-os pela singularidade dos adjetivos para esse substantivo em particular em relação a outros substantivos (na verdade, é bastante simples). Como seria de esperar, você pode clicar no botão “Ordenar por frequência de Uso” para adjetivos por sua frequência de uso para esse substantivo.