agrégation: Calculer des statistiques récapitulatives des sous-ensembles de données

Détails

aggregate est une fonction générique avec des méthodes pour les trames de données et les séries chronologiques.

La méthode par défaut, aggregate.default, utilise la méthode des séries chronologiques si x est une série chronologique, et contraint sinon x à une trame de données et appelle la méthode des trames de données.

aggregate.data.frame est la méthode de trame de données. Si x n’est pas une trame de données, elle est contrainte à une, qui doit avoir un nombre de lignes non nul. Ensuite, chacune des variables (colonnes) de x est divisée en sous-ensembles de cas (lignes) de combinaisons identiques des composants de by, et FUN est appliqué à chacun de ces sous-ensembles avec d’autres arguments dans qui lui sont passés. Le résultat est reformaté en un bloc de données contenant les variables by et x. Celles issues de by contiennent les combinaisons uniques de valeurs de regroupement utilisées pour déterminer les sous-ensembles, et celles issues de x les résumés correspondants pour le sous-ensemble des variables respectives dans x. Si simplify est vrai, les résumés sont simplifiés en vecteurs ou matrices s’ils ont une longueur commune d’un ou supérieure à un, respectivement ; sinon, des listes de résultats récapitulatifs selon les sous-ensembles sont obtenues. Les lignes avec des valeurs manquantes dans l’une des variables by seront omises du résultat. (Notez que les versions de R antérieures à 2.11.0 nécessitaient que FUN soit une fonction scalaire.)

aggregate.formula est une interface de formule standard pour aggregate.data.frame.

aggregate.ts est la méthode des séries chronologiques et nécessite que FUN soit une fonction scalaire. Si x n’est pas une série chronologique, elle est contrainte à une. Ensuite, les variables de x sont divisées en blocs appropriés de longueur frequency(x) / nfrequency, et FUN est appliqué à chacun de ces blocs, avec d’autres arguments (nommés) dans qui lui sont passés. Le résultat renvoyé est une série chronologique avec une fréquence nfrequency contenant les valeurs agrégées. Notez que cela est plus logique pour un résultat trimestriel ou annuel lorsque la série originale couvre un nombre entier de trimestres ou d’années: en particulier, l’agrégation d’une série mensuelle en trimestres commençant en février ne donne pas de série trimestrielle classique.

FUN est passé à match.fun, et il peut donc s’agir d’une fonction ou d’un symbole ou d’une chaîne de caractères nommant une fonction.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.

Previous post Taille des Framboises noires: Comment Tailler les framboises noires
Next post Conditions d’admission