単語の記述
単語の記述エンジンのアイデアは、関連する単語のエンジンを構築していたときに来ました(シソーラスのようなものですが、類義語ではなく、関連する単語のはるかに広いセットを提供します)。 単語ベクトルとconceptnetの”HasProperty”APIを使って遊んでいる間、私は一般的に単語を記述する形容詞を取得しようとしていました。 最終的に私はこれを行うためのはるかに良い方法があることに気付きました:本を解析します!
Project Gutenbergは最初のコーパスでしたが、パーサーは貪欲で貪欲になり、私は100ギガバイトのテキストファイルのどこかにそれを供給することになりました。 パーサーは、単に各本を見て、名詞の様々な説明を引き出します。
うまくいけば、それは単なる目新しさ以上のものであり、一部の人々は実際に彼らの書き込みやブレーンストーミングに役立つでしょうが、試してみてくださ: “女性”対”男”と”少年”対”女の子”。 初期の迅速な分析では、フィクションの著者は、美しさに関連する用語(体重、特徴、一般的な魅力について)で(男性とは対照的に)女性を記述する可能性が 実際には、”美しい”は、おそらく他の多くのメディア形式での女性の一般的な一次元表現と非常に一致している世界の文学のすべての女性のための最 誰かがこれをさらに研究したい場合は、私に知らせてください、そして私はあなたにもっと多くのデータを与えることができます(例えば、「女性」には約25000の異なるエントリがあります-ここに表示するには多すぎます)。
結果の青さは、それらの相対的な頻度を表します。 あなたは第二のための項目の上にマウスを置くことができ、周波数スコアがポップアップ表示されます。 「一意性」ソートはデフォルトであり、私の複雑なAlgorithm™のおかげで、他の名詞に対するその特定の名詞に対する形容詞の一意性によってそれらを順序付け ご想像のとおり、「使用頻度で並べ替える」ボタンをクリックして、その名詞の使用頻度で形容詞にすることができます。