|
|
|
SUR LA STATISTIQUE ET L’ANALYSE DES DONNÉES |
|

|
Jean-Marie Bouroche, Gilbert Saporta : L’analyse des données, Que sais-je ?, n° 1854, Presses Universitaires de
France, 9e éd., 2006.
Un "best-seller" du domaine (plus de 60 000
exemplaires), traduit en plusieurs langues, présentant de façon
synthétique les fondements de l'analyse des
données. |
|
 |
Christophe Croux, Jean-Jacques Droesbeke, Pierre-Louis
Gonzalez, Christian Gourieroux, Gentiane Haesbroeck, Michel Lejeune,
Gilbert Saporta, Michel Tenenhaus : Modèles statistiques pour
données qualitatives, Technip, 2005.
Les actes d’un séminaire très intéressant organisé
par la Société Française de Statistique sur les méthodes de
classement, la régression logistique, le modèle log-linéaire, les
modèles de comptage, les modèles linéaires généralisés, la
régression PLS, avec des applications à la médecine et l’assurance.
À lire pour connaître l’état de l’art sur ces
sujets. |
|
 |
Ludovic Lebart, Alain Morineau, Marie Piron :
Statistique exploratoire multidimensionnelle :
Visualisations et inférence en fouille de données, Dunod, 4e éd., 2006.
Edition actualisée de l'un des meilleurs titres sur
l'analyse des données "à la française" (analyse factorielle), mais
aussi des développements sur la classification, l'analyse
discriminante, les modèles log-linéaires, les arbres de décision,
les réseaux de neurones, les méthodes de validation,
etc. |
|

|
Gilbert Saporta : Probabilités, analyse des données
et statistique, Technip, 2006.
Dans une nouvelle édition, l'ouvrage de
référence, à avoir en permanence sur sa table de travail, pour son
exposé clair, précis et complet. Il contient toutes les
bases qu'il faut connaître avec dans l'édition 2006 de
nombreux compléments sur des sujets récents : SVM, théorie de
l'apprentissage de Vapnik, méthodes de Monte-Carlo,
etc. |
|

|
Michel
Jambu : Méthodes de base de l’analyse des données,
Eyrolles, 1999.
Ecrit par un spécialiste, à la fois théoricien et
consultant pour France Telecom, sur l'analyse des données "à la
française" et les méthodes de classification. N'aborde pas les
méthodes prédictives hormis la régression linéaire. |
|

|
Jean-Pierre
Nakache, Josiane Confais : Statistique explicative appliquée,
Technip, 2003.
Un ouvrage récent à propos des principales méthodes
prédictives : l'analyse discriminante linéaire, la
régression logistique et les arbres de décision. L'ouvrage rappelle
la théorie de façon concise et détaillée, et la fait suivre
d'exemples variés et éclairants réalisés à l'aide des logiciels SAS
et SPAD. |
|

|
Jean-Pierre
Nakache, Josiane Confais : Approche pragmatique de la
classification, Technip, 2004.
C'est en quelque sorte la suite de l'ouvrage
Statistique explicative appliquée des mêmes auteurs, dans le
même style fait de rigueur théorique et de pédagogie dans les
exemples d'applications, avec de nombreuses références à la
littérature récente, à des sites internet, ainsi qu'aux
dernières versions de logiciels, principalement SAS et SPAD, mais
pas exclusivement. Un excellent ouvrage de référence sur ce vaste et
riche sujet. |
|

|
Sylvie
Thiria, Olivier Gascuel, Yves Lechevallier, Stéphane Canu :
Statistique
et méthodes neuronales, Dunod, 1997.
Un ouvrage de référence sur le
sujet. |
|
 |
David W. Hosmer and Stanley Lemeshow : Applied
Logistic Regression, Wiley, 1989, 2d edition 2000.
Un ouvrage fameux sur la régression logistique,
avec de nombreux exemples. |
|
 |
Michel Tenenhaus : La régression PLS, théorie et
pratique, Technip, 1998.
Tout ce qu'il faut savoir sur la régression PLS,
inventée en 1983 par Svante Wold et généralisée en 2000 par
Michel Tenenhaus à la régression logistique PLS, de plus en
plus utilisée dans l'industrie (chimique, agroalimentaire...) quand
il faut manipuler un grand nombre de variables explicatives
fortement colinéaires. |
|

|
Mireille Bardos : Analyse discriminante, application au risque et
scoring financier,
Dunod, 2001.
Un ouvrage riche de l'expérience de l'auteur à la Banque de
France. Contient de nombreux exemples de scoring des entreprises,
avec des comparaisons de méthodes, en particulier de l'analyse
discriminante et de la régression logistique, et des remarques
utiles sur la préparation des données. Très utile pour qui travaille
dans ce domaine.
|
|
|
SUR LE DATA MINING |
|

|
Stéphane
Tufféry : Data Mining et Statistique Décisionnelle, Éditions
Technip, 2005.
Cet ouvrage fait le point sur le data mining, ses
méthodes, ses outils et ses applications, qui vont du scoring
jusqu’au web mining et au text mining. Nombre de ses outils
appartiennent à l’analyse des données et la statistique classique
(classification automatique, analyse discriminante, régression
logistique, modèles linéaires généralisés…) mais certains sont plus
spécifiques au data mining (arbres de décision, réseaux de neurones,
support vector machines, algorithmes génétiques…). Un chapitre
aidera le lecteur à se diriger dans une offre logicielle fournie, et
il dresse un comparatif approfondi de SAS et SPSS. De nombreux
exemples conduits avec SAS, SPSS et SPAD.
Les aspects méthodologiques vont de la
conduite des projets jusqu’aux facteurs de réussite et aux pièges à
éviter, en passant par l’évaluation et la comparaison des modèles,
l’intégration dans le marketing de bases de données, le calcul du
retour sur investissement, les interfaces informatiques, sans
oublier les contraintes juridiques dès que l’on traite des données à
caractère personnel.
Cet ouvrage de référence intéressera les
statisticiens, les data miners, les utilisateurs et les
gestionnaires de bases de données, quel que soit leur secteur
d’activité. Les décideurs, les économètres, les enseignants et
étudiants en sciences économiques, le liront aussi avec
profit. |
|

|
Stéphane Tufféry : Data Mining et Scoring, Dunod,
2002.
Panorama des techniques descriptives et prédictives de data
mining utilisées en entreprise, pour le CRM et le management du
risque. Annexe statistique et étude de cas complète.
Nouvelle présentation en juin 2003.
DEFINITIVEMENT EPUISE
Cité dans Le Monde Informatique n° 996 du
03/10/2003. |
|

|
Michael J. A. Berry, Gordon S. Linoff : Data Mining,
Masson, 1997.
Un livre agréable à lire sur le data mining (traduit de
l’américain), qui ne parle toutefois ni de l'analyse des données à
la française, ni des méthodes prédictives par analyse discriminante
et régression logistique. Aussi traduit en japonais et en
chinois.
EPUISE |
|

|
Michael
J. A. Berry, Gordon S. Linoff : Mastering
Data Mining : The Art and Science of Customer Relationship
Management,
John Wiley & Sons, 1999.
Le second livre de data mining des célèbres
consultants américains, avec vingt études de cas. Aussi traduit en
italien et en chinois. |
|

|
Usama
M. Fayyad, Gregory Piatetsky-Shapiro, Padhraic Smyth, Ramasamy
Uthurusamy (Editors) : Advances
in Knowledge Discovery and Data Mining,
AAAI Press / MIT Press, 1996.
L’état de l’art sur le data mining. Un ouvrage
académique réputé. |
|

|
T.
Hastie, R. Tibshirani, J.-H. Friedman : The
Elements of Statistical Learning : Data Mining, Inference and
Prediction,
Springer Series in Statistics, Springer Verlag, 2001.
Un des meilleurs ouvrages récents sur les aspects
statistiques du data mining, écrit par des statisticiens
réputés.
Cliquez ici pour aller sur le site de
l'ouvrage |
|

|
L.
Breiman, J.H. Friedman, R.A. Olshen, C.J. Stone : Classification
and Regression Trees,
Wadsworth, 1984.
Un ouvrage fondemental sur les arbres de décision,
écrits par les inventeurs de CART. |
|

|
Olivia
Parr Rud : Data
Mining Cookbook,
Wiley, 2000.
Un livre pratique accompagné de très nombreux
exemples de modélisations utilisant les logiciels SAS (antérieurs à
Entreprise Miner).
|
|
|
SUR LE TEXT MINING |
|

|
Ludovic
Lebart, André Salem : Statistique
textuelle,
Éditions Dunod,
1994.
Un classique passionnant.
|
|
|
SUR LE WEB MINING |
|

|
Michael J.A. Berry, Gordon S. Linoff :
Mining the web, John Wiley & Sons, 2002.
Le dernier titre des célèbres consultants du
cabinet bostonien "Data-miners". |
|

|
Mylène
Bazsalicza, Patrick Naïm : Data
mining pour le Web,
Eyrolles, 2001.
Un titre français sur le web
mining.
|
|
|
SUR LE MARKETING DE BASES DE DONNÉES |
|

|
Andrea Micheaux : Marketing de bases de
données, Éditions d’Organisation, 1997.
Un ouvrage à la fois pratique et clair.
|
|
|
SUR SAS ET LE LANGAGE SAS |
|

|
Hélène Kontchou, Olivier Decourt : SAS : Maîtriser SAS Base et SAS Macro, SAS 9.2 et
versions antérieures, Éditions Dunod, 2007.
Nouvelle édition d'un excellent livre qui s'adresse
aux utilisateurs débutants et confirmés. Les premiers y trouveront
les grands principes de SAS, une présentation de l'interface et des
concepts de base (table, variable, format, étape Data, procédure,
ODS), des principales instructions. Les seconds y mettront à jour
leurs connaissances en incluant les nouveautés de la version 9
(signalées dans le livre), et trouveront des synthèses sur des
sujets difficiles (ODS, macro-langage, formats, fonctions SAS, ...).
Il est émaillé d'un grand nombre d'exemples, et s'achève par un
chapitre consacré à un traitement de cas concret, sur des données
bancaires réalistes, qui synthétise le contenu des chapitres
précédents.
|
Plan du site | Politique de confidentialité | Contactez-nous | ©2009 Datamining4trading Tous Droits Réservés
|