Popisující Slova
myšlenka pro Slova Popisující motoru přišel, když jsem stavěl motor pro Související Slova (je to jako slovíčkaření, ale dává vám mnohem širší soubor související slova, spíše než jen synonyma). Při hraní s slovní vektorů a „HasProperty“ API conceptnet, že jsem měl trochu legrace se snaží získat přídavná jména, která běžně popisují slovo. Nakonec jsem si uvědomil, že existuje mnohem lepší způsob, jak toho dosáhnout: analyzovat knihy!
Projekt Gutenberg byl původní korpus, ale parser dostal lačnější a lačnější a skončil jsem krmení je někde kolem 100 gb textových souborů – převážně beletrie, včetně mnoha současných děl. Analyzátor jednoduše prohlédne každou knihu a vytáhne různé popisy podstatných jmen.
Doufejme, že to je více než jen novinkou, a někteří lidé budou skutečně užitečné pro jejich psaní a brainstorming, ale jeden šikovný malý věc je pokusit se porovnat dvě podstatná jména, která jsou podobná, ale liší se v některých významných způsobem – například pohlaví je zajímavé: „žena“ versus “ muž „a“ chlapec „versus“dívka“. Na inital rychlé analýzy se zdá, že autoři fikcí, jsou alespoň 4x více pravděpodobné, že k popisu ženy (oproti mužům) s krásou-souvisejících podmínek (pokud jde o jejich hmotnost, funkce a obecné atraktivity). Ve skutečnosti, „krásný“ je možná nejvíce široce používané adjektivum pro ženy v celé světové literatuře, což je docela v souladu s obecnými zjednodušený zastoupení žen v mnoha jiných mediálních forem. Pokud chce někdo provést další výzkum, dejte mi vědět a mohu vám poskytnout mnohem více údajů (například existuje asi 25000 různých záznamů pro „ženu“ – příliš mnoho na to, aby se zde ukázalo).
modrost výsledků představuje jejich relativní frekvenci. Můžete se vznášet nad položkou na sekundu a skóre frekvence by se mělo objevit. „Jedinečnost“ třídění je výchozí, a to díky mé Komplikované Algoritmus™, nařizuje jim přídavná jména‘ jedinečnost, že konkrétní podstatné jméno ve vztahu k ostatním podstatná jména (ve skutečnosti je to docela jednoduché). Jak byste očekávali, můžete kliknout na tlačítko „Seřadit podle frekvence použití“ na přídavná jména podle jejich frekvence použití pro toto podstatné jméno.