Groupe de discussion |
***
Un groupe francophone très actif sur l'analyse des
données - Nombreux sujets abordés
|
***
Archives of
SAS-L@LISTSERV.UGA.EDU
|
***
Archives of
SPSSX-L@LISTSERV.UGA.EDU
|
Analyse des données |
***
Le
site très complet de Philippe Besse (Université de Toulouse), avec
de nombreux supports de cours en ligne
|
***
Le site très riche de Christophe Benavent (IAE des
pays de l'Adour), avec plusieurs cours fondamentaux donnés par lui
ou d'autres, ainsi que d'autres ressources sur les outils, les
ouvrages, etc
|
***
StatNotes Online Textbook
Le cours en ligne de G. David Garson, avec de
nombreuses notices très bien faites sur tous les sujets de la
statistique et de l'analyse des données, avec le détail de
l'implémentation dans SPSS
|
***
Un très bon glossaire statistique
|
***
Introduction aux Statistiques et notamment aux tests
paramétriques et non-paramétriques ainsi qu'à l'analyse factorielle
(AFC et ACP)
Cours de Ramousse R., Le Berre M & Le Guelte
L.
|
***
La Revue MODULAD
Une mine de renseignements pratiques (sur
les logiciels, les manifestations) et d'articles statistiques très
intéressants.
|
*** Exemples
d'utilisations de SAS/STAT dans le domaine de l'écologie
|
**
Electronic Statistics
Textbook
Cours de statistique en ligne - Moins de
théorie que celui de Besse et moins d'exemples que celui de
Garson
|
**
Cours de Andrew W. Moore's (Carnegie
Mellon University) - Transparents téléchargeables au format PDF sur
de nombreux sujets
|
**
Sur la courbe ROC et son
interprétation
Calcul de l'aire
sous la courbe ROC à l'aide de la méthode d'approximation des trapèzes (SUGI 27)
|
**
An Introduction to Logistic
Regression
Un cours de base bien fait sur la
régression logistique
|
**
Un cours sur la régression logistique de
l'Université d'Exeter
|
**
Un cours sur l'analyse des
correspondances à la Benzécri
|
**
Les travaux de Petitjean sur la classification, avec
ses freewares en téléchargement
|
**
Cours de l'INSA de Rouen - Régression
linéaire, réseaux bayésiens, réseaux neuronaux - Pour ceux qui
aiment les formules
|
**
Stat/Math Center (Indiana
University)
Comparaison d'algorithmes (régression,
tests statistiques) de SAS, SPSS
|
Data Mining |
***
Une présentation d'ensemble du data mining par un
grand statisticien
|
***
Le site du livre "Introduction to Data
Mining" de Pang-Ning Tan, Michael Steinbach, Vipin
Kumar chez Addison-Wesley, avec tout un
matériel proposé (extraits, diapositives
PowerPoint...)
|
***
Un article sur les fondements du data
mining
|
*** Cours
pas très détaillé mais assez complet de data mining
|
**
Glossaire du data mining
|
*
Comparaison entre réseaux de neurones et
régression logistique
|
*
Performances comparées de différents outils d'analyse de
données de PMSI sur plusieurs dizaines de jeux de données, allant du
"maison" au très connu (CENSUS, TITANIC, etc.)
|
Régression Logistique |
***
Cours de Régression Logistique Appliquée, de Patrick
Taffé, Lausanne, 2004
Un tour d'horizon complet en 64 pages avec des
exemples obtenus avec le logiciel STATA
|
***
Logistic regression in SAS version 8, de Paul W.
Dickman
Department of Medical Epidemiology and Biostatistics
Karolinska Institutet, 2003
Encore un bon panorama du sujet en 57
diapositives
|
***
Stat/Math Center (Indiana University)
:
Analysis Of Categorical Dependent Variables With SAS
And SPSS :
Exemples détaillés avec sorties des
logiciels
|
***
UCLA Academic Technology Services
Statistical Computing Seminar
Proc Logistic and Logistic Regression
Models
Une vue d'ensemble complète de la proc LOGISTIC de
SAS 8.2
|
***
Cours de Régression logistique, de Paul-Marie
Bernard
Département de Médecine Sociale et Préventive,
Québec, Canada, 2003
Cours complet incluant des exercices, et abordant la
régression logistique ordinale et nominale
|
Réchantillonnage et agrégation de
modèles |
***
Re-sampling
methods in statistical modeling
Très bon
cours du Pr Bontempi de l'Université Libre de Bruxelles sur les
modèles prédictifs
et
l'apport des techniques de jackknife, de boostrap, notamment au
travers des méthodes
d'agrégation
de modèles (bagging, boosting)
|
**
What are cross-validation and
bootstrapping?
Une petite synthèse intéressante
|
Réseaux de neurones et Support Vector
Machines |
***
Très bonne présentation des SVM par
Olivier Bousquet (Ecole Polytechnique)
|
***
Site sur les SVM avec plusieurs liens
vers des articles intéressants
|
***
Cours de Philippe Leray (INSA de Rouen) sur le sujet :
Réseaux de neurones,
réseaux bayesiens et applications
|
***
mySVM - a support vector machine - implémentation
gratuite des SVM par Stefan Rüping
|
** Ressources sur
les réseaux de neurones
|
Statistique |
***
Université de Neuchâtel
De nombreux cours de statistique en ligne d'excellent
niveau
|
***
Un cours sur les équations structurelles, utilisant le
logiciel AMOS.
|
***
Cours de biostatistique
|
***
Le cours de licence de statistique de
Jean Véronis - Complet et convivial avec des exemples
|
***
Aide mémoire de maîtrise de Michel Le-Her
- Les bases à connaître
|
*** Des exposés
intéressants sur les statistiques, ses pièges et la façon d'aborder
une étude en sciences humaines
|
**
Cours de Jean-Michel (INSA
Lyon)
|
**
Cours de (bio)statistique des Facultés Universitaires de
Namur
|
Mathématique |
***
Eric
Weisstein's World of Mathematics
Une
encyclopédie mathématique en ligne avec plus de 11000 entrées et
5000 figures
|
***
http://www.bibmath.net/index.php3
Dictionnaire mathématique en ligne
|
Text Mining |
***
Site de la revue Lexicometrica - Articles
à télécharger sur la fouille de données textuelles
|
**
Coloriage automatique de corpus (exemples
et téléchargements)
|
** Text mining :
Word Mapper
|
Web Mining |
***
Cours de Web mining de Gregory
Piatetsky-Shapiro
|
Applications métiers |
***
Article de Gilbert Saporta sur l'essentiel de ce qu'il faut
savoir sur le scoring
|
***
Extraction des Connaissances à partir des Données
(ECD) - Laboratoire ERIC, Université Lumière Lyon 2
|
**
Working Paper Series
|
**
Papers about Credit
Scoring
|
**
Rakesh Agrawal's
Publications
|
**
Groupe de Recherche Opérationnelle - Crédit
Lyonnais
|
*
Data Mining in Finance
|
Consulting et
formation |
***
Le site d'Olivier
Decourt, consultant - Nombreuses informations sur les outils SAS, y
compris une rubrique "paparazzi" consacrée aux "indiscrétions sur
les nouveautés de SAS"
|
***
Le site de
Lincoln, société de conseil particulièrement active en data
mining
|
**
Société Française de Statistique
|
Outils logiciels |
***
Aide en ligne SAS :
http://support.sas.com/documentation/onlinedoc/
http://support.sas.com/documentation/onlinedoc/sas9doc.html
http://v8doc.sas.com/sashtml/
|
***
Support technique sur SAS/STAT
|
***
FASTats: Frequently Asked-for
Statistics
De nombreux renseignements sur les procédures de
SAS/STAT
|
***
Exemples de programmes SAS/STAT avec des
données réelles
Autres exemples de programmes
SAS/STAT
Encore des exemples de programmes
SAS/STAT
|
***
Bonne introduction à SAS base et SAS macro
:
http://www.cnam.fr/maths/IMG/pdf/SAS_introduction_1.pdf
http://www.cnam.fr/math/IMG/pdf/SAS_macros.pdf
|
***
Groupe des utilisateurs du logiciel R
|
***
Statistiques avec le logiciel R, de Vincent
Zoonekynd, mathématicien et bioinformaticien
|
***
Cours sur R : http://www.biostat.envt.fr/wiki/index.php/GNU_R
http://cran.r-project.org/doc/contrib/Paradis-rdebuts_fr.pdf
|
***
La "R Graph Gallery" de Romain François, pour obtenir de
superbes graphiques avec R
|
***
Rattle Rattle est une interface graphique de
R permettant de faire différents modèles assez facilement
(import des données, variable cible, type de
modélisation...).
|
***
R
commander Un article qui donne
le mode d'emploi de Rcmdr ("R commander"), package qui dote R d'une
"interface graphique" pour certaines de ses fonctionnalités : import
de données, transformation de variables, tests statistiques, modèles
de régression, scoring d'un fichier, etc.
|
***
Factor
Analysis and Data Mining with R
developed
by F. Husson, S. Lê and J. Mazet (CNRS - Université de Rennes)
FactoMineR est un programme d'analyse factorielle qui permet
de traiter les tableaux simples et multiples. Il permet en outre de
travailler avec des individus et/ou des variables
supplémentaires.
|
***
Enseignements de Statistique en
Biologie
A.B. Dufour, D. Chessel et J.R. Lobry
Nombreux supports de cours et de TD avec le logiciel
R
|
***
Université Lyon
1, TD de
Statistique en Biologie, A.B. Dufour, D.
Chessel & J. Lobry
Exemples
d'utilisation du logiciel R couvrant toute la
statistique
|
***
Raynald's SPSS Tools
Un site
très complet consacré à SPSS, avec FAQ, conseils pratiques,
syntaxes, liens, etc
|
***
Des manuels de référence SPSS 13 sur le
site de l'Université du Kansas
|
***
En téléchargement
sur ce site de SPSS, le guide SPSS Programming and Data
Management: A Guide for SPSS and SAS® Users , écrit par le grand
spécialiste de SPSS Raynald Levesque, qui expose avec de
nombreux exemples la syntaxe des commandes SPSS, le langage script
et l'OMS (output management system), équivalent de l'ODS de SAS. Il
contient aussi l'équivalent SPSS d'un certain nombre de commandes
SAS de gestion des données.
|
**
Solving Homework Problems in Data
Analysis II
De petites études de cas traitées en
détail avec SPSS, expliquant bien les étapes à
franchir
|
***
Macros Excel pour effectuer des tests
non-paramétriques, avec des rappels de cours
Très bien fait
|
***
Visual PLS, pour les modèles à équations
structurelles
|
**
Liste de scripts SPSS fournis pour compléter les procédures existantes de
SPSS
|
**
Support technique statistique de SPSS
|
**
SPSS Suisse
|
**
Un texte sur la régression logistique sur
SPSS
|
**
Quelques macros statistiques pour SAS et Excel
surtout
|
**
The BUGS Project
Logiciel de réseau bayésien
|
**
Un comparatif récent (2004) et complet de plusieurs
logiciels de statistique (Gauss, Maple, Mathematica, Matlab, MuPAD,
O-Matrix, Ox, Scilab, S-Plus)
|
**
Un
comparatif de vitesse entre plusieurs logiciels de statistique (R,
S-Plus, Matlab, O-Matrix, Octave, Scilab, Ox)
|
**
Comparatif fonctionnel de SAS Entreprise Miner,
Statistica Data Miner et SPSS Clementine
Comparatif fonctionnel de Insightful Miner, KXEN
et XL-Miner
Data
Mining Tools : Which One is Best for CRM ?
Article
published in DM Direct Special Report, by Robert A.
Nisbet
|
Jeux de données
statistiques |
***
Statistical Consulting Center - University of Massachusetts
Des
données réelles avec commentaires pour illustrer les méthodes
statistiques, triées par méthode
|
***
Quelques
jeux de données très intéressants :
Utilisés
pour comparer 20 algorithmes de classement (projet Statlog - projet
européen Esprit), méthodes statistiques, arbres de décision et
réseaux de neurones
(plus
de détails sur Statlog)
|
***
DASL : The Data
and Story Library
Des données
réelles avec commentaires pour illustrer les méthodes statistiques,
triées par méthode
|
***
Journal of Statistics Education
Des données réelles avec commentaires pour illustrer les
méthodes statistiques
|
***
The Insurance Company (TIC) Benchmark
|
***
The German Credit Risk
Database
Voir aussi l'adresse : ftp://ftp.ics.uci.edu/pub/machine-learning-databases/statlog
|
***
Liste de jeux de données du Machine Learning
Network
|
***
Delve Datasets - Collections of data for
developing, evaluating, and comparing learning
methods
|
***
The University of Edinburgh - Datasets
for Data Mining
|
***
Fichiers de données réelles pour études
statistiques
|
**
Canadian Automobile Insurance Claims for
1957-1958
Jeu d'essai pour tester la régression de Poisson et
la régression gamma
|
Portails |
**
Kdnuggets : Data Mining, Web Mining, and Knowledge Discovery
Guide
|
**
Un portail complet en français
|
**
Data Mining - Web-datamining, le portail de la société
Lincoln
|
** Ressources
statistiques libres sur le web
|
**
Centre de Veille et de Recherches Thématiques (références
d'articles, d'études, d'ouvrages et de sites sur le data
mining)
|
*** Jeux de données
: nombreux exemples de
données statistiques
|