# TP d'entraînement : complexité

Rappels :


* `len(L)` renvoie le nombre d'élément de la liste `L`.
* `list(X)` convertit le contenu de la variable `X` en une liste. Cela peut notamment servir si `X` est de type `range`.
* On peut créer une liste "par compréhension". Par exemple pour créer une liste avec Les 10 premiers entiers au carré :

            L = [k**2 for k in range(10)]
* Pour afficher une fonction, on utilise la fonction `plot` du module `matplotlib.pyplot`. La syntaxe pour importer un module est 

            import <module> as <alias>
  
  Et toute fonction de ce module peut alors être appelée avec la syntaxe `<alias>.<fonction>(...)`.


## Exercice 1 : maximum d'une liste

Écrire une fonction `f` qui prend en argument une liste `L` de flottants et renvoie le maximum de `L`. Vous ne devez pas utiliser la fonction "max" !

In [None]:
def f(L):
    
    
    

Tester votre fonction en compilant la cellule ci-dessous.

In [None]:
print( f([2,5,4]) )
print( f([-2,-6]) )
print( f([0,0,0]) )

## Préliminaire : le module time

On va mesurer le temps que met la fonction `f` à s'exécuter pour une liste de taille donnée. On utilise pour cela le module `time` qui contient la fonction `time()`. La fonction `time.time()` retourne le nombre de secondes écoulées depuis _l'Epoch_ c'est-à-dire depuis la date du 1er janvier 1970.

In [None]:
import time

time.time()

Ainsi, pour savoir en combien de temps s'exécute une ou plusieurs instructions, on fait la différence entre deux mesures de la fonction `time.time()` : une mesure juste avant et une juste après.

In [None]:
t1 = time.time()
a = 6**7**8
t2 = time.time()

print('Le temps d\'exécution est ', t2-t1 )

_Note : la fonction `time.time()` n'est pas très pratique pour l'utilisateur qui voudrait par exemple connaitre la date et l'heure. Pour ce faire, on peut convertir le résultat avec la fonction `ctime()` du package `time` :_

In [None]:
T=time.time()
time.ctime(T)


## Exercice 2 : mesure d'un temps d'exécution

Écrire une fonction `chrono(n)` qui prend en argument un entier `n` et qui :
* génère la liste `[0,1,2,...]` de longeur `n`.
* applique la fonction `f` à cette liste en mesurant le temps d'exécution.
* retourne ce temps d'exécution.

In [None]:
def chrono(n):
    
    
    

In [None]:
print( chrono(2**20) )
print( chrono(2**21) )
print( chrono(2**22) )
print( chrono(2**23) )
print( chrono(2**24) )

**Question A** : recompiler plusieurs fois la cellule ci-dessus. Les résultats sont-il toujours identiques ? Chercher une explication.


## Exercice 3 : approximation numérique de la complexité

**Question B :** quelle est la complexité (théorique) de la fonction `f` ?


L'objectif est de mettre en évidence cette complexité. Pour cela, on va évaluer le temps d'exécution $t_n$ de `f` pour des listes de taille $n$ avec plusieurs valeurs de $n$.

Par exemple :
* si la complexité est d'ordre $n$, on aura $t_n\approx n$ donc la fonction $n\mapsto t_n$ sera proche d'une droite.
* si la complexité est d'ordre $n^2$, on aura $t_n\approx n^2$ donc la fonction $n\mapsto t_n$ sera proche d'une courbe quadratique.

Pour plusieurs raisons, on regarde uniquement les tailles $n$ sous la forme d'une puissance de deux : $n=2^k$ avec $k$ un paramètre qu'on fait varier.

<br><br>

Écrire une suite d'instruction qui :
- construit une liste X contenant les puissances de deux de `2**20` à `2**26` incluses.
- construit une liste Y contenant le résultat de `chrono(n)` pour chaque entier `n` de `X`.
- affiche le résultat.

On utilisera dans les deux cas des **listes par compréhension** (cf rappels au début du TP, et également pour l'affichage).

In [None]:
import ...

X = ...
Y = ...

plt.plot(X,Y,'-o')
...

Comme on a pris des puissances de deux, les abscisses des points ne sont pas équidistantes : il y a plus de points vers les petites valeurs. Pour contrebalancer cela, on se place en échelle "log-log".

Réécrire le code ci-dessus en remplaçant la fonction `plot` par `loglog`.

In [None]:
import ...

X = ...
Y = ...

plt.loglog(X,Y,'-o')
...

**Question C** : Ce graphique va-t-il dans le sens de la complexité théorique ?

_Note :_ Ce passage au log n'est pas anodin : si la complexité était quadratique, on ne pourrait pas le mettre en évidence en regadant la courbe $n\mapsto t_n$ : elle serait censée croître à une allure similaire à $n^2$ mais comment peut-on le vérifier juste en regardant la courbe ? 

Cependant, en représentant $\log(t_n)$ en fonction de $\log(n)$, on peut mettre en évidence si la croissance est quadratique, cubique, etc. (plus de détails dans un cours futur).

## Exercice 4 : comparaison avec la complexité de la fonction `max`

Python dispose d'une fonction native `max` qui retourne le maximum d'une liste. L'instruction `max(L)` est en général beaucoup plus rapide que les fonctions construites "à la main". Compiler les cellules ci-dessous :

In [None]:
def g(L):
    return max(L)


Ltest = list(range(2**26))

t1=time.time()
g(Ltest)
t2=time.time()
print('temps pour g',t2-t1)

t1=time.time()
f(Ltest)
t2=time.time()
print('temps pour f',t2-t1)

Comment peut-on observer une telle différence ? Se pourrait-il que la complexité de `max` soit encore plus faible qu'une complexité linéaire ? Vérifions cela.

Écrivez une fonction `chrono2(n,F)` qui réalise la même opération que `chrono` mais pour la fonction `F` passée en argument de `chrono2`.

In [None]:
def chrono2(n,F):
    ...

Représentez sur un même graphique la courbe des temps (obtenue avec `chrono2` et en échelle log-log) pour la fonction `f` et la fonction `g`.

In [None]:
import ...

X = ...
Y = ...
Z = ...

plt.loglog(X,Y,'r-o')  # cette courbe sera en rouge
plt.loglog(X,Z,'b-o')  # cette courbe sera en bleu
...

**Question D** : Quelle est la complexité (numérique) de `max` ?

## Bonus


On considère la fonction suivante qui réalise un tri par insertion d'une liste donnée

In [None]:
def tri_insertion(L):
    for i in range(1,len(L)):
        x=L[i]
        j=i
        while j>0 and x < L[j-1] :
            L[j]=L[j-1]
            j=j-1
        L[j]=x
    return L

* Tracer la courbe des temps d'exécution de cette fonction (en échelle normale, pas loglog). 
* La complexité semble-t-elle linéaire ?
* Mêmes questions avec la fonction native `sort(L)` qui trie la liste `L` avec une méthode plus optimisée.
* Tracer les courbes de temps d'exécution en échelle log-log pour les deux fonctions. 
* Quelle différence observe-t-on par rapport au graphique des temps du maximum ?