\documentclass{article}
\usepackage[utf8]{inputenc}
\renewcommand{\ttdefault}{lmtt}
\usepackage{fltpoint} %pour les calculs de z, à charger avant le reste,sinon erreur
\usepackage{amsmath,amssymb,makeidx}
\usepackage{graphicx}
\usepackage{fourier-orns}
\usepackage{epsfig}
\usepackage{fancybox}
\usepackage{pifont}
\usepackage{tabularx}
\usepackage[normalem]{ulem}
\usepackage{pifont,bbding}
\usepackage{tabularx}
\usepackage{multirow}
\usepackage{textcomp} 
\usepackage{lscape}
\usepackage[french]{babel}
\usepackage{fltpoint}
\usepackage{pstricks,pst-plot,pst-3dplot,pst-grad,pst-tree,pst-math,pst-eucl,pst-text}
\usepackage{pstricks-add}

\everymath{\displaystyle}
\newcommand{\euro}{\eurologo{}}
\newcommand{\R}{\mathbb{R}}
\newcommand{\N}{\mathbb{N}}
\newcommand{\D}{\mathbb{D}}
\newcommand{\Z}{\mathbb{Z}}
\newcommand{\C}{\mathbb{C}}
\newcommand{\ds}{\displaystyle}
\newcommand{\cd}[1]{\shadowbox{\begin{minipage}{\textwidth} #1 \end{minipage}}}
\newcommand{\fb}[1]{\fbox{\begin{minipage}{\textwidth} #1 \end{minipage}}}
\newcommand{\Ci}[1]{\Tcircle{#1}}         % cercle
\newcommand{\vect}[1]{\overrightarrow{#1}}
\newcommand{\Ouv}{$(O;\vec u,\vec v)$}
\newcommand{\Oij}{$(O;\vec \imath,\vec \jmath)$}

\makeatletter
\def\maketitle{%
  \null
\Large
\begin{center} \ovalbox{
\begin{tabular}{c}
\textsc{\@title~\@date}\\
{\@author}
\end{tabular}
}
\end{center}
}
\renewcommand\section{\@startsection {section}{1}{\z@}%
                                   {-3.5ex \@plus -1ex \@minus -.2ex}%
                                   {2.3ex \@plus.2ex}%
                                   {\normalfont\Large\sc}}
\renewcommand\subsection{\@startsection {subsection}{6}{\z@} {-1.7ex \@plus -.5ex \@minus -.1ex}{1.3ex \@plus.1ex} {\normalfont\Large\bf}}
\makeatother
\renewcommand{\thesection}{\arabic{section}.}

\newenvironment{Def}[1][Définition.]{\begin{trivlist}
\item[\hskip \labelsep {\bfseries #1}]}{\end{trivlist}}

\newenvironment{Thm}[1][Théorème.]{\begin{trivlist}
\item[\hskip \labelsep {\bfseries #1}]}{\end{trivlist}}

\newenvironment{Df}[1][Définition.]{\begin{trivlist}
\item[\hskip \labelsep {\bfseries #1}]}{\end{trivlist}}

\newenvironment{Mt}[1][Méthode.]{\begin{trivlist}
\item[\hskip \labelsep {\bfseries #1}]}{\end{trivlist}}

\newenvironment{Th}[1][Théorème.]{\begin{trivlist}
\item[\hskip \labelsep {\bfseries #1}]}{\end{trivlist}}

\newenvironment{Ex}[1][Exemple.]{\begin{trivlist}
\item[\hskip \labelsep {\bfseries #1}]}{\end{trivlist}}

\newenvironment{Pp}[1][Propriété.]{\begin{trivlist}
\item[\hskip \labelsep {\bfseries #1}]}{\end{trivlist}}

\newenvironment{Rq}[1][Remarque.]{\begin{trivlist}
\item[\hskip \labelsep {\bfseries #1}]}{\end{trivlist}}

\newenvironment{Pv}[1][Preuve.]{\begin{trivlist}
\item[\hskip \labelsep {\bfseries #1}]}{\end{trivlist}}

\newenvironment{Nt}[1][Notation.]{\begin{trivlist}
\item[\hskip \labelsep {\bfseries #1}]}{\end{trivlist}}

\pagestyle{empty}
\setlength{\hoffset}{-18pt}   
\setlength{\oddsidemargin}{0pt}  % Marge gauche sur pages impaires  
\setlength{\evensidemargin}{9pt}  % Marge gauche sur pages paires  
\setlength{\marginparwidth}{54pt}  % Largeur de note dans la marge  
\setlength{\textwidth}{481pt}  % Largeur de la zone de texte (17cm)  
\setlength{\voffset}{-18pt}  % Bon pour DOS  
\setlength{\marginparsep}{7pt}  % Séparation de la marge  
\setlength{\topmargin}{0pt}  % Pas de marge en haut  
\setlength{\headheight}{13pt}  % Haut de page  
\setlength{\headsep}{10pt}  % Entre le haut de page et le texte  
\setlength{\footskip}{27pt}  % Bas de page + séparation  
\setlength{\textheight}{25cm}  % Hauteur de la zone de texte (25cm)  

\title{Chapitre 6 : Statistiques}
\date{~-28-01-11-}
\author{Première S 1, 2010-2011, Y. Angeli}

\begin{document}
\Large
\renewcommand{\labelitemi}{$\star$}
\maketitle
\vspace{-0.5cm}
\section{Introduction, vocabulaire}
Les statistiques sont une branche des mathématiques dont le but est de décrire des échantillons (importants) de données numériques par quelques grand\-eurs, en vue d'une interprétation. Une première approche consiste à dégager deux nombres à partir d'un échantillon : une valeur centrale et une valeur mesurant la dispersion de la série. \\

\noindent $\bullet$ La \textit{population} désigne l'ensemble étudié. Un \textit{individu} est un élément de cet ensemble, et l'\textit{effectif total} $N$ est le nombre d'individus de la population.\\
$\bullet$  Le {\it caractère} ou la {\it variable statistique} $x$ désignent la propriété étudiée.\\
$\bullet$ Le terme $x_i$ de la série statisitique est la valeur prise par le caractère $x$ pour l'individu numéro $i$ de la population.\\
$\bullet$ Les  {\it modalités} $a_1,...,a_k$ sont différentes valeurs prises par le caractère $x$.\\
$\bullet$ L'{\it effectif} $n_j$ d'une modalité $a_j$ représente le nombre d'individus de la population dont le caractère vaut $a_j$. (c'est-à-dire le nombre de fois que $a_j$ apparaît parmi les $x_i$). En particulier : $N=n_1+...+n_k$\\
$\bullet$ La {\it fréquence} $f_j$ d'une modalité $a_j$ est le quotient $\frac {n_j}N$. C'est le pourcentage de la population dont le caractère vaut $f_j$.\\
$\bullet$ Le {\it mode} de la série est la modalité qui a le plus grand effectif.\\
$\bullet$ L'{\it étendue} est la différence entre la plus grande et la plus petite modalité.\\

Le mode et l'étendue sont un exemple naïf (et trop imprécis) de valeur centrale - paramètre de dispersion pour qualifier une série.
\begin{Ex} Le tableau suivant recense les salaires annuels bruts en kilo euros de vingt salariés d'une entreprise :

{ \normalsize
\noindent\begin{tabular}{|l|llllllllllllllllllll|}
\hline 
Salaire $x_i$ &21 &22 &22 &81 &37 &24 &24 &23 &23 &24 &23 &22 &22 &23 &37 &23 &21 &23 &24 &24\\
\hline
\end{tabular}
}\\

\noindent\begin{minipage}[c]{0.43\linewidth}
Population=\dotfill\\
Caractère=\dotfill\\
Effectif total=\dotfill\\
Mode=\dotfill\\
Étendue=\dotfill\\
\end{minipage}
\begin{minipage}[c]{0.57\linewidth}
\begin{tabular}{|l|p{0.5cm}|p{0.5cm}|p{0.5cm}|p{0.5cm}|p{0.5cm}|p{0.5cm}|}
\hline
Modalités & & & & & & \\
\hline
Effectif & & & & & & \\
\hline
Fréquence & & & & & & \\
\hline
Cumul des Freq. & & & & & & \\
\hline
\end{tabular}
\end{minipage}
\end{Ex}
\newpage
\section{Moyenne et écart-type}
La moyenne et l'écart-type sont un exemple de valeur centrale et de paramètre de dispersion d'une série.\\
\noindent \cd{ La \textit{moyenne} de la série $x_1,...,x_N$ dont les modalités sont $(a_1,n_1),...(a_k,n_k)$ est \\
$\bar x=\frac{x_1+...+x_N}N=\frac1 N\sum_{i=1}^Nx_i=\frac1 N\sum_{j=1}^kn_ka_k$\\
La \textit{variance} est la moyenne des carrés des écarts à la moyenne :\\
${\rm Var}(x)=\frac{(x_1-\bar x)^2+...+(x_n-\bar x)^2}N=\frac 1N\sum_{i=1}^N(x_i-\bar x)^2=\frac 1N\left(\sum_{i=1}^Nx_i^2\right)-\bar x^2$\\
L'\textit{écart-type} est la racine carrée de la variance : $s(x)=\sigma(x)=\sqrt{{\rm Var}(x)}$} 
\begin{Ex} Dans l'exemple du paragraphe 1, calculer :\\

\noindent\begin{minipage}[c]{0.33\linewidth}
$\bar x=$\dotfill\\.\dotfill
\end{minipage}
\begin{minipage}[c]{0.5\linewidth}
${\rm Var}(x)=$\dotfill\\.\dotfill
\end{minipage}
\begin{minipage}[c]{0.16\linewidth}
$s(x)=$\dotfill\\.\dotfill
\end{minipage}\\

\noindent On suppose que le dirigeant gagne 41 kilo euros au lieu de 81. On a alors : \\

\noindent \begin{minipage}[c]{0.33\linewidth}
$\bar x=$\dotfill\\.\dotfill
\end{minipage}
\begin{minipage}[c]{0.5\linewidth}
${\rm Var}(x)=$\dotfill\\.\dotfill
\end{minipage}
\begin{minipage}[c]{0.16\linewidth}
$s(x)=$\dotfill\\.\dotfill
\end{minipage}\\

On en conclue que la moyenne et l'écart-type sont sensibles aux valeurs extrêmes de la série.
\end{Ex}
\begin{Pp} La moyenne et l'écart-type vérifient :
\begin{itemize}
\item si la série $x$ est composée des sous-séries $y$ et $z$ d'effectifs respectifs $p$ et $q$ alors on a $\bar x=\frac {p\bar y+q\bar z}{p+q}$.
\item Si $f:x\mapsto ax+b$ est une transformation affine, la série des $y_i=ax_i+b$ vérifie $\bar y=a\bar x+b$ et $s(y)=|a|s(x)$.
\end{itemize}
\end{Pp}
\begin{Pv} Si on associe à chaque terme $x_i$ de la série un point $M_i$ d'abscisse $x_i$ sur un axe gradué $(O;\vec\imath)$, la moyenne $\bar x$ est l'abscisse de l'isobarycentre des $M_i$. La première formule est une conséquence de l'associativité du barycentre, et la seconde de son comportement par rapport aux homothéties et aux translations.
\end{Pv}
\begin{Ex} La moyenne des salaires des 7 femmes travaillant dans l'entreprise de l'exemple $1$ est de 30K\euro~par an. Quelle est la moyenne du salaire des hommes ?\dotfill
\end{Ex}\newpage
\section{Médiane et intervalle interquartile}
La médiane et l'intervalle interquartile sont un autre exemple de valeur centrale et de paramètre de dispersion d'une série.\\

\noindent\cd{On considère une série $x_1,...,x_N$ dont les termes sont rangés dans l'ordre croissant. Sa médiane est le terme central $x_{\frac{N+1}2}$ si $N$ est impair ou la moyenne des deux termes centraux $x_{\frac N2}$ et $x_{1+\frac N2}$ si $N$ est pair. Le \textit{premier quartile} $Q_1$ est la médiane de la première moitié de la série (les $x_i$ pour $i<(N+1)/2$) et le \textit{troisième quartile} $Q_3$ est la médiane de la seconde moitié de la série (les $x_i$ pour $i>(N+1)/2$). L'\textit{intervalle interquartile} est la différence $Q_3-Q_1$.
}
\begin{Ex} Dans l'exemple du paragraphe 1,\\
\noindent\begin{minipage}[c]{0.25\linewidth}
$Med=$\dotfill
\end{minipage}
\begin{minipage}[c]{0.25\linewidth}
$Q_1=$\dotfill
\end{minipage}
\begin{minipage}[c]{0.25\linewidth}
$Q_3=$\dotfill
\end{minipage}
\begin{minipage}[c]{0.25\linewidth}
$Q_3-Q_1=$\dotfill
\end{minipage}\\
\noindent On suppose que le dirigeant gagne 41 kilo euros au lieu de 81. On a alors : \\
\noindent\begin{minipage}[c]{0.25\linewidth}
$Med=$\dotfill
\end{minipage}
\begin{minipage}[c]{0.25\linewidth}
$Q_1=$\dotfill
\end{minipage}
\begin{minipage}[c]{0.25\linewidth}
$Q_3=$\dotfill
\end{minipage}
\begin{minipage}[c]{0.25\linewidth}
$Q_3-Q_1=$\dotfill
\end{minipage}\\
On en conclue que la médiane et l'intervalle interquartile sont peu sensibles aux valeurs extrêmes.
\end{Ex}
\begin{Pp} Soit $x$ une série statistique de premier quartile $Q_1$, médiane $M$ et troisième quartile $Q_3$. Soit $f:x\mapsto ax+b$ une fonction affine. Alors la médiane de la série des $y_i=ax_i+b$ est $aM+b$ et son intervalle interquartile $|a|(Q_3-Q_1)$.
\end{Pp}
\begin{Pv} si $a>0$ la fonction affine est strictement croissante donc les $y_i$ sont rangés par ordre croissant. La médiane est le terme $y_{\frac{N+1}2}=ax_{\frac{N+1}2}+b=aM+b$ si $N$ est impair, et $(y_{\frac{N}2}+y_{1+\frac N2})/2=(ax_{\frac{N}2}+b+ax_{1+\frac N2}+b)/2=aM+b$ si $N$ pair. On étudie de même les cas où $a<0$ et $a=0$.
\end{Pv}
\begin{Df} Le {\it diagramme} en boîte d'une série statistique se construit ainsi :
\begin{center}
\normalsize
\newrgbcolor{qrqrqr}{0 0 0}
\psset{xunit=1.0cm,yunit=1.0cm,algebraic=true,dotstyle=*,dotsize=3pt 0,linewidth=0.8pt,arrowsize=3pt 2,arrowinset=0.25}
\begin{pspicture*}(2,-1)(9,2.5)
\psaxes[xAxis=true,yAxis=true,labels=none,Dx=1,Dy=1,ticksize=-2pt 0,subticks=2]{->}(0,0)(2,-1)(9,2.5)
\psline[linewidth=1.6pt,linecolor=qrqrqr](3,1)(3,2)
\psline[linewidth=1.6pt,linecolor=qrqrqr](3,1.5)(3.67,1.5)
\psline[linewidth=1.6pt,linecolor=qrqrqr](6.19,1.5)(7.54,1.5)
\psline[linewidth=1.6pt,linecolor=qrqrqr](4.72,2)(4.72,1)
\psline[linestyle=dotted,linecolor=qrqrqr](3,1)(3,0)
\psline[linestyle=dotted,linecolor=qrqrqr](3.67,1)(3.67,0)
\psline[linestyle=dotted,linecolor=qrqrqr](4.72,1)(4.72,0)
\psline[linestyle=dotted,linecolor=qrqrqr](6.19,1)(6.19,0)
\psline[linestyle=dotted,linecolor=qrqrqr](7.54,1)(7.54,0)
\psline[linewidth=1.6pt,linecolor=qrqrqr](3.67,2)(6.19,2)
\psline[linewidth=1.6pt,linecolor=qrqrqr](6.19,2)(6.19,1)
\psline[linewidth=1.6pt,linecolor=qrqrqr](6.19,1)(3.67,1)
\psline[linewidth=1.6pt,linecolor=qrqrqr](3.67,1)(3.67,2)
\psline[linewidth=1.6pt,linecolor=qrqrqr](7.54,1)(7.54,2)
\psdots[linecolor=qrqrqr](3,0)
\rput[bl](2.75,-0.32){\qrqrqr{$Min$}}
\psdots[linecolor=qrqrqr](3.67,0)
\rput[bl](3.6,-0.36){\qrqrqr{$Q_1$}}
\psdots[linecolor=qrqrqr](4.72,0)
\rput[bl](4.63,-0.37){\qrqrqr{$Med$}}
\psdots[linecolor=qrqrqr](6.19,0)
\rput[bl](6.12,-0.34){\qrqrqr{$Q_3$}}
\psdots[linecolor=qrqrqr](7.54,0)
\rput[bl](7.35,-0.36){\qrqrqr{$Max$}}
\end{pspicture*}
\end{center}
\end{Df}
\begin{Rq} Il existe plusieurs définitions de la médiane, des quartiles. Dans tous les cas, on peut dire que $25\%$ des valeurs de la série sont inférieures où égales à $Q_1$, $50\%$ des valeurs de la série sont inférieures où égales à la médiane et $75\%$ des valeurs de la série sont inférieures où égales à $Q_3$. (Les quartiles divisent la série en quarts)
\end{Rq}
\section{Utiliser la calculatrice}
\begin{Ex} Durant quatre cours de mathématiques, un professeur a fait tracer à chacun de ses élèves un carré de $10$cm de côté et mesurer la diagonale. Ces mesures sont consignées ici :

\small
\begin{center}
\begin{tabular}{|l|c|c|c|c|c|c|c|c|c|c|c|c|c|c|c|}
\hline
Modalité &13,7 &13,8 &13,9 &14 &14,1 &14,2 &14,3 &14,4 &14,5 &14,6 &N &Mode &Éte. &Moy. &Méd.\\
\hline
2nde1 &1 &1 &2 &2 &0 &4 &4 &1 &1 &0 &16 & &0,8 &14,14 &14,2 \\
\hline
2nde2 &0 &2 &5 &3 &2 &1 &2 &1 &1 &0 & & & & & \\
\hline
2nde3 &0 &2 &5 &0 &1 &3 &3 &4 &0 &0 & & & & & \\
\hline
2nde4 &0 &0 &3 &1 &2 &2 &4 &4 &0 &2 & & & & & \\
\hline
\end{tabular}
\end{center}
\Large
\begin{figure}[h]
 \begin{minipage}[b]{0.33\linewidth}
  \centering \fbox {\includegraphics[width=3.39cm,height=2.26cm]{seconde-cours-3a.eps}}\\
  \centering $[STAT],Edit$ (1:Edit)
 \end{minipage}\hfill
 \begin{minipage}[b]{0.33\linewidth}   
  \centering \fbox {\includegraphics[width=3.39cm,height=2.26cm]{seconde-cours-3b.eps}}\\
  \centering (Modalités$\to$L1, effectifs$\to$L2)
 \end{minipage}
 \begin{minipage}[b]{0.33\linewidth}
  \centering \fbox {\includegraphics[width=3.39cm,height=2.26cm]{seconde-cours-3c.eps}}\\
  \centering $[STAT\to Calc]$ (1:Stats-1-var)
 \end{minipage}\hfill
\end{figure}
\begin{figure}[h]
 \begin{minipage}[b]{0.33\linewidth}
  \centering \fbox {\includegraphics[width=3.39cm,height=2.26cm]{seconde-cours-3d.eps}}\\
  \centering $Stats-1-var L1,L2$ 
 \end{minipage}\hfill
 \begin{minipage}[b]{0.33\linewidth}   
  \centering \fbox {\includegraphics[width=3.39cm,height=2.26cm]{seconde-cours-3e.eps}}\\
  \centering Écran 1
 \end{minipage}
 \begin{minipage}[b]{0.33\linewidth}
  \centering \fbox {\includegraphics[width=3.39cm,height=2.26cm]{seconde-cours-3f.eps}}\\
  \centering [Flèche bas] Écran 2
 \end{minipage}\hfill
\end{figure}
\end{Ex}
\begin{Ex} Représenter le diagramme en boîte des secondes 2,3 et 4 : 
\small
\begin{center}
\newrgbcolor{trtrtr}{0.19 0.19 0.19}
\psset{xunit=2.0cm,yunit=1.0cm}
\begin{pspicture*}(65.9,-1.1)(74,8)
\psgrid[subgriddiv=0,gridlabels=0,gridcolor=lightgray](0,0)(66,-1)(74,8)
\psset{xunit=10.0cm,yunit=1.0cm,algebraic=true,dotstyle=*,dotsize=3pt 0,linewidth=0.8pt,arrowsize=3pt 2,arrowinset=0.25}
\psaxes[xAxis=true,yAxis=true,labels=x,Dx=0.2,Dy=1,ticksize=-2pt 0,subticks=2]{->}(0,0)(13.2,-1)(14.8,8)
\psline(13.7,1)(13.7,2)
\psline(13.7,1.5)(13.95,1.5)
\psline(14.3,1.5)(14.5,1.5)
\psline(14.2,2)(14.2,1)
\psline[linecolor=trtrtr](13.95,2)(14.3,2)
\psline[linecolor=trtrtr](14.3,2)(14.3,1)
\psline[linecolor=trtrtr](14.3,1)(13.95,1)
\psline[linecolor=trtrtr](13.95,1)(13.95,2)
\psline(14.5,1)(14.5,2)
\rput[tl](13.41,1.67){Seconde 1}
\rput[tl](13.41,3.67){Seconde 2}
\rput[tl](13.41,5.71){Seconde 3}
\rput[tl](13.41,7.58){Seconde 4}
\end{pspicture*}
\end{center}
\end{Ex}
\end{document}
