Auteur
:
Stéphane Tufféry
Editeur
:
Technip
Date de parution
:
14/11/2019
EAN/ISBN
:
9782710809364
Format
:
24 x 17
Nombre de pages
:
XIII-388
Thématique
:
Sciences & techniques - Mathématiques
Adhérent
:
Éditions Technip & Ophrys
Présentation de l'éditeur
Comprendre les principes théoriques de la statistique est une chose ; savoir les
mettre en pratique en est une autre, et le fossé peut être large entre les deux.C'est pour vous aider à le franchir que l'auteur a écrit un ouvrage de «travaux
pratiques» de la statistique décisionnelle, qui fait suite à son ouvrage de cours, Data
Mining et statistique décisionnelle, paru dans la même collection.Ce nouvel ouvrage présente une étude de cas réalisée de A à Z à partir du même
jeu de données, et répondant de façon complète et cohérente à deux importantes
problématiques de la statistique décisionnelle : la construction d'une segmentation
de clientèle et l'élaboration d'un score d'appétence à l'achat d'un produit ou la
souscription d'un contrat.Les données utilisées sont à la fois réelles et complètes. Elles proviennent
du secteur de l'assurance, mais l'étude qu'elles permettent de réaliser peut se
transposer à de nombreux autres domaines. Ces données sont disponibles sur
Internet, notamment sur le site des Editions Technip où elles sont accompagnées des
programmes présentés dans l'ouvrage. Ceci permettra au lecteur de compléter sa
lecture par des exercices personnels, par le test de variantes, mais aussi d'utiliser
ces programmes pour les appliquer à ses propres données et ses propres projets.L'étude de cas est menée avec le logiciel SAS, qui est à la fois le plus complet et
le plus répandu des logiciels commerciaux, et qui permet de traiter tous les sujets
abordés dans l'ouvrage, et même d'optimiser, d'automatiser et d'industrialiser les
traitements. Tout au long de l'ouvrage, une bonne partie des procédures classiques
de SAS/STAT est passée en revue, mais, au-delà des questions de programmation,
nous souhaitons surtout montrer au lecteur qu'il est souhaitable et possible de
conjuguer rigueur et productivité.Pour le scoring, les trois principales méthodes de modélisation sont mises en
oeuvre et comparées, l'analyse discriminante linéaire, les arbres de décision et la
régression logistique, de même que l'agrégation de modèles par bagging.
|