Tracer un polygone et un histogramme de distribution. Construction de polygones, histogrammes, cumulats, ogives. Comment créer un logo polygonal dans CorelDraw

Soit un échantillon extrait de la population générale, et N.-É. 1 observé N.-É. Une fois, N.-É. 2 - N.-É. 2 fois, x à - n à fois et est la taille de l'échantillon. Valeurs observées N.-É. 1 est appelé variantes, et la séquence de variantes écrite dans l'ordre croissant - séries de variantes .

Le nombre d'observations des variantes est appelé la fréquence, et son rapport à la taille de l'échantillon est appelé la fréquence relative.

Définition. Loi statistique (empirique) de la distribution de l'échantillon, ou simplement distribution statistique de l'échantillon appeler la séquence de la variante et les fréquences correspondantes n je ou fréquences relatives.

La distribution statistique de l'échantillon est commodément présentée sous la forme d'un tableau de distribution de fréquence, appelé séries statistiques à distribution discrète :

(la somme de toutes les fréquences relatives est égale à un).

Exemple 1... En mesurant dans des groupes homogènes de sujets, les échantillons suivants ont été obtenus : 71, 72, 74, 70, 70, 72, 71, 74, 71, 72, 71, 73, 72, 72, 72, 74, 72, 73, 72,74 (fréquence cardiaque). Sur la base de ces résultats, compilez une série statistique de distributions de fréquences et de fréquences relatives.

Solution. 1) Série statistique de distribution de fréquence :

Contrôle : 0,1 + 0,2 + 0,4 + 0,1 + 0,2 = 1.

Polygone de fréquences appelée ligne brisée, les segments avec lesquels les points sont connectés Pour construire un polygone de fréquence sur l'axe des abscisses, des options sont tracées N.-É. 2, et en ordonnée - les fréquences correspondantes n je. Les points sont reliés par des segments et obtiennent un polygone de fréquence.

Polygone des fréquences relatives s'appelle une ligne brisée, les segments qui relient les points. Pour construire un polygone de fréquences relatives sur l'axe des abscisses, des options sont tracées N.-É. i, et en ordonnée les fréquences correspondantes w je. Les points sont reliés par des segments et obtiennent un polygone de fréquences relatives

Exemple 2. Construisez un polygone de fréquence et un polygone de fréquence relative selon l'exemple 1.

Solution: En utilisant la série de distribution statistique discrète compilée dans l'exemple 1, nous construisons un polygone de fréquence et un polygone de fréquence relative :


2. Série de distribution d'intervalles statistiques. graphique à barres.

Une série statistique discrète (ou fonction de distribution empirique) est généralement utilisée lorsqu'il n'y a pas trop d'options différentes dans l'échantillon, ou lorsque la discrétion est essentielle pour le chercheur pour une raison ou une autre. Si la caractéristique de la population générale X, qui nous intéresse, est distribuée de façon continue ou si sa discrétion est peu pratique (ou impossible) à prendre en compte, alors les options sont regroupées par intervalles.


La distribution statistique peut également être spécifiée sous la forme d'une séquence d'intervalles et de leurs fréquences correspondantes (comme la fréquence correspondant à l'intervalle, la somme des fréquences qui tombent dans cet intervalle est prise).

1.R (swing) = X max -X ​​min

2. k- nombre de groupes

3. (formule Sturges)

4.a = x min, b = x max

Il est pratique de représenter le regroupement résultant sous la forme d'un tableau de fréquences, appelé séries de distribution d'intervalles statistiques :

Intervalles regroupements ...
Fréquences ...

Un tableau similaire peut être formé en remplaçant les fréquences n je fréquences relatives.

Ils se présentent sous forme de séries de distribution et sont établis sous forme .

Une série de distribution est un type de regroupement.

Série de diffusion- représente une distribution ordonnée des unités de la population étudiée en groupes selon un certain attribut variable.

Selon la caractéristique sous-jacente à la formation d'une série de distributions, il existe attributif et variationnel rangs de distribution :

  • Attributif- appeler la série de distribution, construite selon des caractéristiques qualitatives.
  • Les séries de distribution construites dans l'ordre croissant ou décroissant des valeurs d'une caractéristique quantitative sont appelées variationnel.
La série de variation de la distribution se compose de deux colonnes :

La première colonne répertorie les valeurs quantitatives de l'attribut variable, appelées options et sont indiqués. Option discrète - exprimée sous forme d'entier. L'option d'intervalle va de et à. Selon le type de variantes, vous pouvez construire une série de variation discrète ou d'intervalle.
La deuxième colonne contient nombre d'options spécifiques exprimé en termes de fréquences ou de fréquences :

Fréquences- ce sont des nombres absolus indiquant combien de fois une valeur donnée d'une caractéristique se produit dans l'ensemble, qui dénotent. La somme de toutes les fréquences doit être égale au nombre d'unités de l'ensemble de la population.

Fréquences() Sont des fréquences exprimées en pourcentage du total. La somme de toutes les fréquences exprimée en pourcentage doit être égale à 100 % en fractions de un.

Représentation graphique des séries de distribution

Les séries de distribution sont clairement représentées à l'aide de représentations graphiques.

Les séries de distribution sont représentées comme suit :
  • Polygone
  • Histogrammes
  • Cumule
  • Ogives

Polygone

Lors de la construction d'un polygone, les valeurs de la caractéristique variable sont tracées sur l'axe horizontal (axe des abscisses) et les fréquences ou fréquences sont tracées sur l'axe vertical (axe des ordonnées).

Le polygone de la fig. 6.1 construit sur la base du microrecensement de la population de la Russie en 1994.

6.1. Répartition des ménages par taille

État: Les données sur la répartition des 25 salariés d'une des entreprises par catégories tarifaires sont données :
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Tâche: Construisez une série de variations discrètes et affichez-la graphiquement sous la forme d'un polygone de distribution.
Solution:
Dans cet exemple, les options sont le niveau de salaire de l'employé. Pour déterminer les fréquences, il est nécessaire de calculer le nombre d'employés avec la catégorie de salaire correspondante.

Le polygone est utilisé pour les séries à variation discrète.

Pour construire un polygone de distribution (Fig. 1), le long de l'axe des abscisses (X), nous reportons les valeurs quantitatives de l'attribut variable - options, et le long de l'axe des ordonnées - fréquences ou fréquences.

Si les valeurs d'une caractéristique sont exprimées sous forme d'intervalles, une telle série est appelée intervalle.
Lignes d'intervalle les distributions sont représentées graphiquement sous forme d'histogrammes, de cumulés ou d'ogives.

Tableau statistique

État: Les données sur le montant des dépôts de 20 personnes dans une banque (mille roubles) 60; 25 ; 12 ; Dix; 68 ; 35 ; 2 ; 17 ; 51 ; neuf; 3 ; 130 ; 24 ; 85 ; 100 ; 152 ; 6 ; dix-huit; 7; 42.
Tâche: Tracez une série de variation d'intervalle à intervalles égaux.
Solution:

  1. La population initiale se compose de 20 unités (N = 20).
  2. En utilisant la formule de Sturgess, nous déterminons le nombre requis de groupes utilisés : n = 1 + 3,322 * lg20 = 5
  3. Calculons la valeur de l'intervalle égal: i = (152 - 2) / 5 = 30 mille roubles
  4. Divisons la population initiale en 5 groupes avec un intervalle de 30 000 roubles.
  5. Les résultats du regroupement sont présentés dans le tableau :

Avec un tel enregistrement d'une caractéristique continue, lorsque la même valeur apparaît deux fois (comme la limite supérieure d'un intervalle et la limite inférieure d'un autre intervalle), alors cette valeur se réfère au groupe où cette valeur agit comme la limite supérieure.

graphique à barres

Pour construire un histogramme le long de l'abscisse, les valeurs des limites des intervalles sont indiquées et, sur leur base, des rectangles sont construits dont la hauteur est proportionnelle aux fréquences (ou parties).

En figue. 6.2. montre un histogramme de la répartition de la population de la Russie en 1997 par tranches d'âge.

Riz. 6.2. Répartition de la population de la Russie par tranches d'âge

État: La répartition des 30 salariés de l'entreprise par la taille du salaire mensuel est donnée

Tâche: Affichez graphiquement la série de variation d'intervalle sous forme d'histogramme et de cumul.
Solution:

  1. La frontière inconnue du (premier) intervalle ouvert est déterminée par la valeur du deuxième intervalle: 7000 - 5000 = 2000 roubles. Avec la même valeur, on trouve la limite inférieure du premier intervalle : 5000 - 2000 = 3000 roubles.
  2. Pour construire un histogramme dans un repère rectangulaire, selon l'axe des abscisses, on laisse de côté les segments dont les valeurs correspondent aux intervalles de la série variétale.
    Ces segments servent de base inférieure et de fréquence correspondante (fréquence) - la hauteur des rectangles formés.
  3. Construisons un histogramme :

Pour construire des cumuls, il faut calculer les fréquences cumulées (fréquences). Elles sont déterminées par sommation séquentielle des fréquences (fréquences) des intervalles précédents et sont notées S. Les fréquences accumulées montrent combien d'unités de la population ont une valeur de l'attribut pas plus que celle considérée.

Cumulé

La distribution d'une caractéristique dans la série de variation par fréquences accumulées (parties) est représentée à l'aide de cumuls.

Cumulé ou la courbe cumulative, contrairement au polygone, est construite à partir des fréquences ou parties accumulées. Dans ce cas, les valeurs de l'attribut sont placées sur l'axe des abscisses et les fréquences ou fréquences accumulées sont placées sur l'axe des ordonnées (Fig. 6.3).

Riz. 6.3. Répartition cumulée des ménages par taille

4. Calculons les fréquences cumulées :
La fréquence du genou du premier intervalle est calculée comme suit : 0 + 4 = 4, pour le second : 4 + 12 = 16 ; pour le troisième : 4 + 12 + 8 = 24, etc.

Lors de la construction des cumuls, la fréquence cumulée (fréquence) de l'intervalle correspondant est affectée à sa limite supérieure :

Ogiva

Ogiva est construit de la même manière que le cumulatif, à la seule différence que les fréquences accumulées sont placées sur l'axe des abscisses et les valeurs des attributs sont placées sur l'axe des ordonnées.

Une variété de cumulés est la courbe de concentration ou le graphique de Lorentz. Pour tracer la courbe de concentration, une échelle d'échelle en pourcentage de 0 à 100 est appliquée aux deux axes d'un système de coordonnées rectangulaires. Les fréquences accumulées sont indiquées en abscisse, et les valeurs accumulées de la fraction (en pourcentage) par le volume de l'élément sont indiqués en ordonnée.

La distribution uniforme de la caractéristique correspond à la diagonale du carré sur le graphique (Fig. 6.4). Avec une distribution inégale, le graphique est une courbe concave selon le niveau de concentration du trait.

6.4. Courbe de concentration

À la suite du traitement et de la systématisation des matériaux statistiques primaires, une série d'indicateurs statistiques numériques sont obtenus qui caractérisent certains aspects des phénomènes à l'étude. Ces séries sont dites statistiques.

Les séries statistiques sont de deux types : les séries de distribution et les séries dynamiques (Fig. 1).

Séries statistiques

Série Distribution Série Dynamique

Variation attributive

Discret Continu

(Intervalle)

Figure 1 - Types de séries de distribution

Les séries de distribution sont des séries qui caractérisent la distribution des unités de la population pour une raison quelconque (par exemple, la distribution des équipements de production par type et durée de vie). Une série de distribution se compose de deux éléments : une variante - les valeurs d'un attribut de regroupement et les fréquences - le nombre de répétitions des variantes individuelles des valeurs d'attribut.

Une série de distribution est un regroupement dans lequel un seul indicateur est utilisé pour caractériser des groupes classés par la valeur d'une caractéristique - le nombre de groupes.

Les fréquences présentées en termes relatifs sont appelées fréquences et sont désignées.

Par exemple, au lieu du nombre absolu de travailleurs avec une certaine catégorie, vous pouvez définir la proportion de travailleurs dans cette catégorie. Les fréquences peuvent être exprimées en fractions d'unité ou en pourcentage. Le remplacement des fréquences par des fréquences permet de comparer la série de variations avec un nombre différent d'observations.

Par la nature de la variation, on distingue des traits discrets et continus. Les caractéristiques discrètes diffèrent les unes des autres par une valeur finie, c'est-à-dire qu'elles sont données sous la forme de nombres discontinus. Par exemple, la catégorie de salaire des travailleurs, le nombre d'enfants dans la famille, le nombre de travailleurs dans l'entreprise. Les signes continus peuvent différer les uns des autres d'une quantité arbitrairement petite et prendre des valeurs dans certaines limites. Par exemple, les salaires des travailleurs, le coût des immobilisations de l'entreprise.



La série attributive de distribution est formée par un critère qualitatif (répartition des travailleurs par profession, voitures par marques). La série de variation de la distribution est formée par un critère quantitatif. Il se compose d'une variante et de fréquences. Dans un nombre discret de distributions, les variantes individuelles ont certaines valeurs (répartition des travailleurs par catégorie). Dans les cas où le nombre de variantes d'une caractéristique discrète est suffisamment grand, ainsi que lors de l'analyse de la variation d'une caractéristique continue, lorsque les valeurs de cette caractéristique dans des unités individuelles peuvent ne pas être répétées du tout, des séries de distribution d'intervalle sont construites . L'intervalle indique certaines limites des valeurs de l'attribut variable et est indiqué par les limites supérieure et inférieure de l'intervalle.

Il existe des séries de distribution avec des fréquences absolues, relatives et cumulées. Les fréquences accumulées sont dites cumulatives.

Si la série de variation est donnée avec des intervalles inégaux, alors pour une compréhension correcte de la nature de la distribution, il est nécessaire de calculer la densité de distribution. La densité de distribution est le nombre d'unités de population par unité de la valeur de l'intervalle de l'attribut de regroupement. Distinguer la densité absolue () et relative () :

où est la fréquence ;

- la gravité spécifique ;

- la taille de l'intervalle.

Les séries de distribution peuvent avoir une forme à un, deux et plusieurs sommets. Parmi les distributions unimodales, il existe des distributions symétriques et asymétriques (asymétriques), pointues et à sommet plat.

La représentation graphique des séries de distribution facilite leur analyse et permet de juger de la forme de la distribution.

Pour la représentation graphique d'une série discrète, un polygone de distribution est utilisé. Le polygone est le plus souvent utilisé pour représenter des lignes discrètes. Un polygone de fréquences est une ligne polygonale dont les segments relient des points avec des coordonnées (xi, mi), où xi sont les variantes de l'échantillon et mi sont les fréquences correspondantes. Si le polygone est tracé en fonction des données de la série d'intervalles, alors les milieux des intervalles correspondants sont pris comme abscisse des points.

Pour construire un polygone dans un système de coordonnées rectangulaires à une échelle choisie arbitrairement, les valeurs de l'argument (options) sont tracées sur l'axe des abscisses et les valeurs de fréquence sont tracées sur l'axe des ordonnées. L'échelle est choisie de telle sorte que la clarté nécessaire et la taille souhaitée du dessin soient fournies. Ensuite, des points de coordonnées (xi, mi) sont construits et reliés séquentiellement par des segments de ligne droite.

Figure 2 - Polygone de distribution

Les histogrammes sont utilisés pour représenter graphiquement des séries de variation d'intervalle. Il est construit comme suit : des segments égaux sont tracés sur l'axe des abscisses, qui, à l'échelle acceptée, correspondent à la taille des intervalles de la série de variation. Sur les segments, des rectangles sont construits, dont les aires sont proportionnelles aux fréquences (ou particularités) de l'intervalle.

Un histogramme peut être converti en un polygone de distribution si les milieux des sommets des rectangles sont reliés par des segments de ligne. Les deux points extrêmes des rectangles sont fermés selon l'axe des abscisses au milieu des intervalles dans lesquels les fréquences (particulières) sont égales à zéro. Lors de la construction d'un histogramme pour une série de variation avec des intervalles inégaux, les indices de densité d'intervalle (absolus ou relatifs) doivent être tracés le long de l'axe des ordonnées. Dans ce cas, les hauteurs des rectangles de l'histogramme correspondront à la valeur de la densité de distribution.

Figure 3 - Histogramme

Avec une augmentation du nombre d'observations de la même population, le nombre de groupes dans la série d'intervalles augmente, ce qui conduit à une diminution de la taille de l'intervalle. Dans ce cas, la ligne brisée a tendance à se transformer en une courbe lisse, appelée courbe de distribution. La courbe de distribution caractérise sous une forme généralisée la variation de la caractéristique et les modèles de distribution de fréquence au sein d'une population de qualité unique.

La courbe de fréquence cumulée ou cumulée, contrairement au polygone, est tracée en fonction des fréquences ou fréquences cumulées. Dans ce cas, les valeurs de l'attribut sont placées sur l'axe des abscisses, et les fréquences ou fréquences accumulées sont placées sur l'axe des ordonnées (Figure 4).

Fréquence cumulée, c'est-à-dire le nombre de valeurs comprises dans cet intervalle et dans toutes les précédentes.

Figure 4 - Cumul (courbe de fréquence cumulée)

Il convient de noter que la courbe de fréquence accumulée ne diminue en aucune partie.

Prenons un exemple de construction d'un groupement dans les exemples 1 et 2.


Exemple 1

Le chiffre d'affaires et les coûts de distribution de trente entreprises commerciales pour la période de référence s'élevaient à (mille roubles):

Commerces, p/p Chiffre d'affaires Frais de traitement

Pour déterminer la relation entre la taille du chiffre d'affaires et les coûts de distribution, regroupez les magasins par la taille du chiffre d'affaires, formant cinq groupes de magasins à intervalles égaux. Dans chaque groupe et dans son ensemble, comptez :

1) le nombre de magasins ;

2) la taille du chiffre d'affaires - au total et en moyenne par magasin ;

3) les coûts de distribution - au total et en moyenne par magasin ;

4) la structure du chiffre d'affaires des marchandises par groupes et la structure des coûts de distribution ;

5) le niveau des coûts de distribution

E/S = Frais de traitement × 100 %.
Chiffre d'affaires

6) Prendre une décision dans les tables de développement et de groupe. Tirer des conclusions, indiquer le type de regroupement. Tracez un histogramme et convertissez-le en polygone. Tracez le cumul (courbe de fréquence cumulée).

Solution:

Composons une série de variations de distribution, en ordonnant les magasins par chiffre d'affaires du plus grand au plus petit.

Commerces, p/p Chiffre d'affaires Frais de traitement Commerces, p/p Chiffre d'affaires Frais de traitement
7 341 160
11 456 242 19 1199 635
5 1326 623

Définissons la taille de l'intervalle :

, où

i est la taille de l'intervalle ;

Xmax, Xmin - les valeurs maximales et minimales de la fonctionnalité (1700 et 341, respectivement).

L'intervalle sera :

Définissons les limites des intervalles :

Nous allons répartir les entreprises selon les intervalles choisis (tableau de développement) :

Déterminons dans chaque groupe et en général le volume de chiffre d'affaires - au total et en moyenne pour un magasin et les coûts - au total et en moyenne pour un magasin, pour lequel nous établirons un tableau de regroupement :

Groupes d'entreprises par chiffre d'affaires Nombre d'entreprises dans le groupe Chiffre d'affaires total du groupe Chiffre d'affaires moyen du groupe Coûts de distribution totaux par groupe Frais de distribution moyens pour le groupe Niveau des coûts de distribution par groupe,%
UNE (1) (2) (3)=(2)/(1) (4) (5)=(4)/(1) (6)=(4)/(2)*100
341-612,8 398,5 50,44
612,8-884,6 744,5 345,5 46,41
884,6-1156,4 998,75 482,625 48,32
1156,4-1428,2 1262,5 49,82
1428,2-1700 687,417 43,65
Le total 34679/30= 1155,97 15843/30= 528,1 528,1/1155,97*100 = 45,68

Sur la base des calculs, nous allons construire un histogramme et un polygone.

Lors de la construction d'un histogramme, les valeurs de l'attribut (les limites des intervalles) sont tracées le long de l'axe X et les fréquences le long de l'axe Y. Pour l'intervalle correspondant, un rectangle est construit dont la hauteur correspond à la fréquence de la caractéristique (figure 5).

Figure 5 - Histogramme

L'histogramme peut être converti en polygone, si les milieux des bords supérieurs du rectangle sont reliés par une ligne droite (Figure 6).

Figure 6 - Polygone de distribution

Nous construirons également une courbe de fréquence cumulée ou cumulée. Dans ce cas, le long de l'axe X, nous reportons les intervalles de l'attribut et le long de l'axe Y - les fréquences accumulées (il s'agit du nombre d'unités de population qui ont des valeurs d'attribut inférieures à celle spécifiée). Les fréquences cumulées sont calculées dans le tableau.

La courbe de fréquence cumulée est illustrée à la figure 7.

Figure 7 - Courbe des fréquences cumulées

Sortir: Le chiffre d'affaires total du premier groupe est de 797 mille roubles, dans le deuxième - 4467 mille roubles, dans le troisième - 7990 mille roubles, dans le quatrième - 2525 mille roubles, dans le cinquième - 18 900 mille roubles. Le chiffre d'affaires moyen par magasin du premier groupe est de 398,5 mille roubles, dans le deuxième - 744,5 mille roubles, dans le troisième - 998,75 mille roubles, dans le quatrième - 1262,5 mille roubles, dans le cinquième - 1 575 mille roubles.

Les coûts de distribution totaux dans le premier groupe sont de 402 mille roubles, dans le deuxième - 2073 mille roubles, dans le troisième - 3861 mille roubles, dans le quatrième - 1258 mille roubles, dans le cinquième - 8249 mille roubles. Les coûts de distribution moyens dans le premier groupe sont de 201 mille roubles, dans le deuxième - 345,5 mille roubles, dans le troisième - 482,625 mille roubles, dans le quatrième - 629 mille roubles, dans le cinquième - 687,417 mille roubles.

Sur la base des valeurs obtenues, on peut conclure qu'il existe une relation directe entre la taille du chiffre d'affaires et les coûts de distribution moyens : avec une augmentation de la taille du chiffre d'affaires, les coûts de distribution moyens augmentent. Sur la base de l'analyse du niveau des coûts de distribution, on peut conclure que les entreprises les plus compétitives du cinquième groupe, puisque leur niveau de coûts est inférieur à la moyenne.

Exemple 2

D'après le tableau, construisez la série de distribution des ménages en calculant le nombre de ménages inclus dans certains groupes :

a) par le nombre de personnes vivant ensemble (1,2,3,4 et plus)

b) par le revenu moyen par habitant par mois (formant 5 groupes à intervalles égaux)

c) par le statut d'emploi du chef de famille.

P/p Non. Membres de la famille Statut de chef de ménage selon le lieu de travail
1. Travail indépendant
2. Pour embaucher
3. Pour embaucher
4. Pour embaucher
5. Pour embaucher
6. Pas de travail
7. Pas de travail
8. Travail indépendant
9. Pas de travail
10. Pour embaucher
11. Pour embaucher
12. Pour embaucher
13. Travail indépendant
14. Pour embaucher
15. Pour embaucher
16. Pour embaucher
17. Pour embaucher
18. Pas de travail
19. Pas de travail
20. Travail indépendant
21. Pas de travail
22. Pour embaucher
23. Pour embaucher
24. Pour embaucher
25. Pour embaucher
26. Pour embaucher
27. Travail indépendant
28. Pas de travail
29. Pour embaucher
30. Pour embaucher
Le total - -

Solution:

Construisons la série de distribution des ménages en calculant le nombre de ménages inclus dans certains groupes :

Le nombre total de familles avec différents statuts de chef de famille selon le lieu d'emploi est présenté dans le tableau. Dans ce cas, le regroupement est basé sur un critère qualitatif. Le nombre de groupes coïncide avec le nombre de signes : travail indépendant, travailleur indépendant, sans travail.

Le nombre total de chefs de famille ayant un statut différent selon le lieu d'activité (ca Le nombre total de familles ayant un statut différent des chefs de famille selon le lieu d'emploi est présenté dans le tableau. à embaucher, sans emploi.

Le regroupement par le nombre de personnes vivant ensemble (1,2,3,4 et plus) est présenté dans le tableau. Dans ce cas, le regroupement est basé sur une caractéristique discrète quantitative.

Ainsi, 33 % de toutes les familles enquêtées sont composées de trois personnes. 13% des familles se composent de 4 personnes ou plus. La part des familles composées de 1 personne - 17%, de 2 personnes - 37%.

Construisons un regroupement selon le revenu moyen par habitant par mois (formant 5 groupes à intervalles égaux) ;

Au stade initial, nous classerons les séries de la plus petite à la plus grande :

Numéro de foyer Revenu mensuel moyen par habitant, roubles Numéro de foyer Revenu mensuel moyen par habitant, roubles

Déterminer la taille de l'intervalle par la formule :

, où

i est la taille de l'intervalle ;

n est le nombre de groupes (dans ce problème il y a 5 groupes) ;

Xmax, Xmin - la valeur maximale et minimale de la caractéristique.

L'intervalle sera :

Séparons les ménages selon les intervalles alloués :

Ce sera la série de distribution d'intervalle.

Figure 8 - Histogramme de distribution

Ainsi, dans 50% de tous les ménages enquêtés, le revenu moyen par habitant varie de 4 800 roubles à 7 460 roubles par personne. Un revenu de 2 140 à 4 800 roubles par personne est observé dans 16% de toutes les familles. Un revenu de 7460 à 10120 roubles par personne est observé dans 20% de toutes les familles interrogées. La part des familles dont le revenu moyen par habitant est de 10 120 à 12 780, ainsi que de 12 780 à 15 440 roubles, est de 7 %.


Questions d'autotest

Représentation graphique des séries de variations

Une représentation graphique de la relation entre les valeurs permet de visualiser cette relation. Les graphiques peuvent servir de base pour découvrir de nouvelles propriétés, relations et modèles.

Les graphiques les plus courants pour afficher des séries de variations, c'est-à-dire la relation entre les valeurs d'une caractéristique et les fréquences correspondantes ou les fréquences relatives, sont le polygone, l'histogramme et le cumulatif.

Polygone le plus souvent utilisé pour représenter des séries discrètes. Pour construire un polygone dans un système de coordonnées rectangulaires, les valeurs de l'argument, c'est-à-dire les variantes, sont portées sur l'axe des abscisses à une échelle choisie arbitrairement, et les valeurs des fréquences ou des fréquences relatives sont également portées sur l'axe des ordonnées. dans une échelle choisie arbitrairement. L'échelle est choisie de telle sorte que la clarté nécessaire soit fournie et que le dessin ait la taille souhaitée. De plus, dans ce système de coordonnées, des points sont tracés, dont les coordonnées sont des paires des nombres correspondants de la série de variation. Les points résultants sont reliés séquentiellement par des segments de ligne droite. Le point extrême "gauche" est relié à un point de l'axe des abscisses dont l'abscisse est à gauche du point considéré à la même distance que l'abscisse du point le plus proche à droite. De même, le point extrême "droit" est également relié au point de l'axe des abscisses.

Cumulé sert à la représentation graphique de la série de variation cumulée. Pour le tracer, les valeurs de l'argument sont tracées sur l'axe des abscisses, et les fréquences cumulées ou les fréquences relatives cumulées sont tracées sur l'axe des ordonnées. L'échelle sur chaque axe est choisie arbitrairement. On trace ensuite des points dont les abscisses sont égales aux options (dans le cas des séries discrètes) ou aux bornes supérieures des intervalles (dans le cas des séries à intervalles), et les ordonnées sont égales aux fréquences correspondantes (cumulées fréquences). Ces points sont reliés par des segments de droite. La ligne brisée résultante est le cumulatif.

Polygone de fréquence

Soit une série de distribution écrite à l'aide d'un tableau :

Image 1.

Définition 1

Polygone de fréquence- une ligne brisée qui relie les points $ (x_m, n_m) $ ($ m = 1,2, \ dots, m) $.

C'est-à-dire que pour construire un polygone de fréquences, il est nécessaire de tracer les valeurs de la variante sur l'axe des abscisses et les fréquences correspondantes sur l'axe des ordonnées. Les points résultants sont reliés par une ligne brisée :

Figure 2. Polygone de fréquence.

En plus de la fréquence habituelle, il y a aussi le concept de fréquence relative.

On obtient le tableau suivant de répartition des fréquences relatives :

Figure 3.

Définition 2

Polygone de fréquence relative- une ligne brisée qui relie les points $ (x_m, W_m) $ ($ m = 1,2, \ dots, m) $.

C'est-à-dire que pour construire un polygone de fréquence, il est nécessaire de tracer les valeurs de la variante sur l'axe des abscisses et les fréquences relatives correspondantes sur l'axe des ordonnées. Les points résultants sont reliés par une ligne brisée :

Figure 4. Polygone des fréquences relatives.

Histogramme de fréquence

A la notion de polynôme pour les valeurs continues s'ajoute la notion d'histogramme.

Notez que l'aire d'un de ces rectangles est $ \ frac (n_ih) (h) = n_i $. Par conséquent, l'aire de la figure entière est égale à $ \ sum (n_i) = n $, c'est-à-dire égale à la taille de l'échantillon.

Définition 4

Histogramme de fréquence relative- une figure en escalier constituée de rectangles de base - des intervalles partiels de longueur $ h $ et de hauteurs $ \ frac (W_i) (h) $ :

Figure 6. Histogramme des fréquences relatives.

Notez que l'aire d'un de ces rectangles est $ \ frac (W_ih) (h) = W_i $. Par conséquent, l'aire de la figure entière est $ \ sum (W_i) = W = 1 $.

Exemples de la tâche de construction d'un polygone et d'un histogramme

Exemple 1

Soit la distribution de fréquence de la forme :

Figure 7.

Construire un polygone de fréquences relatives.

Construisons d'abord une série de distribution de fréquences relatives par la formule $ W_i = \ frac (n_i) (n) $

Vous avez aimé l'article ? A partager avec des amis :