単語の記述

単語の記述

単語の記述エンジンのアイデアは、関連する単語のエンジンを構築していたときに来ました(シソーラスのようなものですが、類義語ではなく、関連する単語のはるかに広いセットを提供します)。 単語ベクトルとconceptnetの”HasProperty”APIを使って遊んでいる間、私は一般的に単語を記述する形容詞を取得しようとしていました。 最終的に私はこれを行うためのはるかに良い方法があることに気付きました:本を解析します!

プロジェクト-グーテンベルクは最初のコーパスでしたが、パーサーは貪欲で貪欲になり、私は100ギガバイトのテキストファイルのどこかにそれを供給することになりました。 パーサーは、単に各本を見て、名詞の様々な説明を引き出します。

うまくいけば、それは単なる新規性以上のものであり、一部の人々は実際に彼らの執筆やブレーンストーミングに役立つでしょうが、試してみるべき1つのきちんとした小さなことは、似ているが、いくつかの重要な方法で異なる二つの名詞を比較することです-例えば、性別は面白いです: “女性”対”男”と”少年”対”女の子”。 初期の迅速な分析では、フィクションの著者は、美しさに関連する用語(体重、特徴、一般的な魅力について)で(男性とは対照的に)女性を記述する可能性が 実際には、”美しい”は、おそらく他の多くのメディア形式での女性の一般的な一次元表現と非常に一致している世界の文学のすべての女性のための最 誰かがこれをさらに研究したい場合は、私に知らせてください、そして私はあなたにもっと多くのデータを与えることができます(例えば、「女性」には約25000の異なるエントリがあります-ここに表示するには多すぎます)。

結果の青さは、それらの相対的な頻度を表します。 あなたは第二のための項目の上にマウスを置くことができ、周波数スコアがポップアップ表示されます。 「一意性」ソートはデフォルトであり、私の複雑なAlgorithm™のおかげで、他の名詞に対するその特定の名詞に対する形容詞の一意性によってそれらを順序付け ご想像のとおり、「使用頻度で並べ替える」ボタンをクリックして、その名詞の使用頻度で形容詞にすることができます。

コメントを残す

メールアドレスが公開されることはありません。

Previous post 減量:体重を減らすために10アーユルヴェーダの救済
Next post 中国のきのこの鶏の調理法