# Le perceptron multicouche avec scikit-learn

Documentation officielle: http://scikit-learn.org/stable/modules/neural_networks_supervised.html

Notebooks associés:
- http://www.jdhp.org/docs/notebooks/ai_multilayer_perceptron_fr.html

## Vérification de la version de la bibliothèque scikit-learn

**Attention**: le Perceptron Multicouche n'est implémenté dans scikit-learn que depuis la version 0.18 (septembre 2016).

Le code source de cette implémentation est disponible sur [github](https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/neural_network/multilayer_perceptron.py).
Le long fil de discussion qui précédé l'intégration de cette implémentation est disponible sur la page suivante: [issue #3204](https://github.com/scikit-learn/scikit-learn/pull/3204).

In [None]:
import sklearn

# version >= 0.18 is required
version = [int(num) for num in sklearn.__version__.split('.')]
assert (version[0] >= 1) or (version[1] >= 18)

## Classification

C.f. http://scikit-learn.org/stable/modules/neural_networks_supervised.html#classification

### Premier exemple

In [None]:
from sklearn.neural_network import MLPClassifier

In [None]:
X = [[0., 0.], [1., 1.]]
y = [0, 1]

clf = MLPClassifier(solver='lbfgs',
                    alpha=1e-5,
                    hidden_layer_sizes=(5, 2),
                    random_state=1)

clf.fit(X, y)

Une fois le réseau de neurones entrainé, on peut tester de nouveaux exemples:

In [None]:
clf.predict([[2., 2.], [-1., -2.]])

`clf.coefs_` contient les poids du réseau de neurones (une liste d'array):

In [None]:
clf.coefs_

In [None]:
[coef.shape for coef in clf.coefs_]

Vector of probability estimates $P(y|x)$ per sample $x$:

In [None]:
clf.predict_proba([[2., 2.], [-1., -2.]])

## Régression

C.f. http://scikit-learn.org/stable/modules/neural_networks_supervised.html#regression

### Premier exemple

In [None]:
from sklearn.neural_network import MLPRegressor

In [None]:
X = [[0., 0.], [1., 1.]]
y = [0, 1]

reg = MLPRegressor(solver='lbfgs',
                   alpha=1e-5,
                   hidden_layer_sizes=(5, 2),
                   random_state=1)

reg.fit(X, y)

Une fois le réseau de neurones entrainé, on peut tester de nouveaux exemples:

In [None]:
reg.predict([[2., 2.], [-1., -2.]])

`clf.coefs_` contient les poids du réseau de neurones (une liste d'array):

In [None]:
reg.coefs_

In [None]:
[coef.shape for coef in reg.coefs_]

## Régularisation

C.f. http://scikit-learn.org/stable/modules/neural_networks_supervised.html#regularization

In [None]:
# TODO...

## Normalisation des données d'entrée

C.f. http://scikit-learn.org/stable/modules/neural_networks_supervised.html#tips-on-practical-use

## Itérer manuellement

C.f. http://scikit-learn.org/stable/modules/neural_networks_supervised.html#more-control-with-warm-start

Itérer manuellement la boucle d'apprentissage peut être pratique pour suivre son évolution ou pour l'orienter.

Voici un exemple où on suit l'évolution des poids du réseau sur 10 itérations:

In [None]:
X = [[0., 0.], [1., 1.]]
y = [0, 1]

clf = MLPClassifier(hidden_layer_sizes=(15,),
                    random_state=1,
                    max_iter=1,        # <- !
                    warm_start=True)   # <- !

for i in range(10):
    clf.fit(X, y)
    print(clf.coefs_)

**TODO**: Quelle différence avec le mode d'apprentissage *online* (boucle ouverte ?) `fit.partial_fit()` ???