Le RSI est-il pertinent ?Contexte de l'analyse
J'ai mené une analyse sur l'indicateur technique Relative Strength Index (RSI) pour évaluer sa pertinence dans la prédiction des rendements futurs des actions du S&P 500. Le RSI est souvent utilisé pour identifier les conditions de surachat ou de survente d'un titre, et mon objectif était de déterminer s'il existe une relation significative entre le RSI et les rendements futurs.
Données et méthode
Collecte des données :
J'ai récupéré les prix ajustés de clôture pour les tickers du S&P 500 depuis 2005 via Yahoo Finance. Les données manquantes ont été supprimées, laissant un nombre significatif de tickers pour l'analyse.
Calcul du RSI :
Le RSI a été calculé pour une fenêtre de 14 jours. avec des positions détenue sur une journée
La formule du RSI repose sur la moyenne des gains et des pertes sur une période donnée, transformée pour obtenir une valeur oscillant entre 0 et 100.
# Function to calculate RSI (python)
def calculate_rsi(data, window=14):
delta = data.diff(1)
gain = delta.where(delta > 0, 0)
loss = -delta.where(delta < 0, 0)
avg_gain = gain.rolling(window=window, min_periods=1).mean()
avg_loss = loss.rolling(window=window, min_periods=1).mean()
rs = avg_gain / avg_loss
rsi = 100 - (100 / (1 + rs))
return rsi
Préparation des données :
Pour chaque ticker, le RSI et les rendements futurs (variation en pourcentage du prix de clôture) ont été calculés.
Les données ont été combinées en un seul DataFrame pour faciliter l'analyse.
Modèle de régression linéaire :
J'ai utilisé la régression linéaire pour évaluer la relation entre le RSI et les rendements futurs. Le modèle de régression inclut une constante pour le terme d'interception.
Résultats
Les résultats du modèle de régression linéaire montrent que le RSI a un coefficient très proche de zéro avec une p-value extrêmement faible, indiquant que le RSI est statistiquement significatif mais n'a pratiquement aucune influence sur les rendements futurs.
R-squared: 0.000, ce qui signifie que le RSI n'explique pratiquement aucune variation dans les rendements futurs.
Coefficient du RSI: -4.836e-05, très proche de zéro.
P-value: 0.000, suggérant que le coefficient presque nul est statistiquement significatif.
Tests supplémentaires
Pour renforcer cette conclusion, des tests supplémentaires sur les résidus du modèle de régression.
Test d'Omnibus
Le test d'Omnibus combine les mesures de skewness (asymétrie) et de kurtosis (aplatissement) des résidus pour tester la normalité des résidus.
Omnibus: 623479.434
Prob(Omnibus): 0.000
Une p-value de 0.000 indique que nous rejetons l'hypothèse nulle selon laquelle les résidus suivent une distribution normale.
Test de skewness (asymétrie)
Une mesure de la symétrie de la distribution des résidus. Une distribution normale a un skew de 0.
Skew: 0.473
Un skew positif indique que la distribution des résidus est légèrement asymétrique vers la droite.
Test de kurtosis
Une mesure de la "queue" de la distribution des résidus. Une distribution normale a une kurtosis de 3.
Kurtosis: 34.949
Une kurtosis très élevée suggère que la distribution des résidus a des queues lourdes (plus de valeurs extrêmes que ce qui serait attendu dans une distribution normale).
Test de Durbin-Watson
Le test Durbin-Watson vérifie la présence d'autocorrélation dans les résidus de la régression. Les valeurs proches de 2 suggèrent l'absence d'autocorrélation.
Durbin-Watson: 2.076
Une valeur proche de 2 indique qu'il n'y a pas d'autocorrélation significative dans les résidus.
Test de Jarque-Bera
Le test Jarque-Bera vérifie la normalité des résidus en utilisant des mesures de skewness et de kurtosis.
Jarque-Bera (JB): 82351929.309
Prob(JB): 0.000
Une p-value de 0.000 indique que nous rejetons l'hypothèse nulle selon laquelle les résidus suivent une distribution normale.
La visualisation de la régression linéaire montre une ligne de régression pratiquement horizontale, confirmant l'absence de relation linéaire significative entre le RSI et les rendements futurs.
Limites de l'Analyse Actuelle
Période d'Étude :
L'analyse couvre les données depuis 2005, mais ne capture peut-être pas toutes les conditions de marché, notamment les périodes de volatilité extrême.
Choix de la Fenêtre de RSI :
Le RSI a été calculé sur 14 jours. D'autres périodes (7 jours, 21 jours) n'ont pas été testées et pourraient montrer des résultats différents.
Exclusion d'Autres Facteurs :
Seul le RSI a été considéré. D'autres indicateurs techniques ou économiques n'ont pas été inclus, ce qui pourrait limiter la compréhension complète des rendements futurs.
Modèle de Régression Linéaire :
La régression linéaire peut ne pas capturer des relations non linéaires ou complexes. Des modèles plus sophistiqués n'ont pas été explorés.
Normalité des Résidus :
Les résidus ne suivent pas une distribution normale, ce qui indique que le modèle linéaire pourrait être mal spécifié.
Chocs de Marché :
Les événements extrêmes (crises financières, annonces économiques majeures) ne sont pas pris en compte, bien qu'ils puissent fortement influencer les rendements.
Sélection de l'Échantillon :
L'analyse se concentre sur les actifs du S&P 500. Les résultats pourraient différer pour d'autres indices ou marchés internationaux.
Conclusion
Sur la base de cette analyse, le RSI, bien qu'il soit souvent utilisé pour identifier les conditions de surachat ou de survente, ne semble pas être un indicateur pertinent pour prédire les rendements futurs des actions du S&P 500. Les tests de diagnostic montrent que le modèle de régression est mal adapté et que les prédictions basées sur le RSI sont principalement aléatoires et peu fiables. Les traders devraient donc être prudents en utilisant le RSI comme indicateur principal pour la prédiction des rendements futurs.