À propos de cette calculatrice
Le calculateur de covariance calcule la covariance de deux ensembles de données, X et Y, une mesure de la direction dans laquelle elles changent ensemble. Une covariance positive indique que les deux variables ont tendance à évoluer dans le même sens, une covariance négative indique qu'elles ont tendance à évoluer dans des sens opposés et une covariance proche de 0 indique que la covariance linéaire n'est pas évidente.
La covariance de la population est généralement cov(X,Y)=Σ(xᵢ-μx)(yᵢ-μy)/n, et la covariance de l'échantillon utilise n-1 comme dénominateur. La valeur de la covariance est affectée par l'unité de la variable, elle est donc souvent utilisée avec le coefficient de corrélation.
Cet outil convient à l'apprentissage statistique, à l'analyse de données, aux portefeuilles d'actifs financiers et au traitement de données expérimentales. En saisissant deux colonnes de données, vous pouvez vérifier rapidement la moyenne, le produit des écarts et les résultats de covariance.
Ce que cela calcule
The covariance calculator measures whether two variables tend to increase together or move in opposite directions. Positive covariance means same-direction movement; negative covariance means opposite movement.
Formule
Sample covariance: cov(X, Y) = sum((x_i - x_mean)(y_i - y_mean)) / (n - 1). Population covariance uses n as the denominator.
Entrées
- Values in the X data set.
- Values in the Y data set.
- The two data sets must be paired and have the same length.
Exemple
| X | Y | Meaning |
|---|---|---|
| 1, 2, 3 | 2, 4, 6 | Strong same-direction movement |
| 1, 2, 3 | 6, 4, 2 | Opposite movement |
| 1, 2, 3 | 5, 5, 5 | Y does not vary |
Comment interpréter le résultat
The sign of covariance shows direction, but the magnitude depends on units. To compare strength of linear association, use the correlation coefficient.
Erreurs courantes
- Do not compare covariance magnitudes directly across different units.
- Both data sets must have the same length.
- Sample and population covariance use different denominators.
Comment utiliser
Entrez respectivement la colonne de données X et la colonne de données Y, en vous assurant que les deux ensembles de données ont la même quantité et correspondent un à un dans le même ordre. Sélectionnez la covariance de la population ou la covariance de l'échantillon et cliquez sur Calculer.
Par exemple, X=[1,2,3], Y=[2,4,6], les deux ensembles de données changent complètement dans le même sens, la covariance est donc positive. Si Y=[6,4,2], la covariance est négative.
Si les deux ensembles de données sont de longueurs différentes ou s'il y a des caractères méconnaissables, les données doivent d'abord être nettoyées. Après le calcul, le nuage de points ou le coefficient de corrélation peuvent être combinés pour déterminer davantage la force de la relation linéaire.
Fonctions principales
Prend en charge le calcul de covariance pour deux ensembles de données de longueur égale.
Faites la distinction entre la covariance de la population et la covariance de l'échantillon, et aidez à comprendre la moyenne, l'écart, le produit des écarts et la direction commune du changement.
Il convient à l'analyse statistique, au portefeuille financier, aux données expérimentales et au prétraitement de l'apprentissage automatique pour faciliter la vérification rapide des calculs manuels ou des résultats de tableaux.
Cas d’utilisation
En statistique, la covariance est utilisée pour décrire si deux variables ont tendance à augmenter ensemble ou si l'une augmente et l'autre diminue, et constitue la base de l'analyse de corrélation.
En finance, la covariance entre les rendements des actifs est utilisée pour mesurer le risque du portefeuille. Plus la covariance de deux actifs est élevée, plus ils ont tendance à augmenter et à diminuer ensemble et plus l'effet de diversification des risques est faible.
Dans l'apprentissage automatique et la science des données, les matrices de covariance sont utilisées dans l'analyse en composantes principales, l'analyse propre, la distribution normale multivariée et la réduction de la dimensionnalité des données.