En tant que Data Scientist, je pourrai intervenir sur des missions freelance multiples :
Analyse et modélisation de volumes de données variés
Élaboration de modèles prédictifs pour anticiper l’évolution des données et construction d’algorithmes permettant l’analyse et le traitement conformément aux exigences métier
Proposition de recommandations stratégiques d’aide à la décision
Activités de recherche et développement pour identifier des solutions innovantes pour le traitement de grands volumes de données
Ces missions se baserons sur mes compétences en machine learning et le deep learning ainsi que dans les technos Python ou R, avec une bonne maîtrise des librairies telles que NumPy, Pandas, Matplotlib, Seaborn, Sci-kit learn, Tenserflow et Keras.
Réalisation des projets :
- House Prices : Advanced Regression Techniques
- Titanic Machine Learning from Disaster
- Times series Forecasting
Analyse et nettoyage de données
Stationnarisation des séries temporelles
Feature Engineering (Traitement des données manquantes, création des variables, encodage des variables ...etc)
Implémentation de différents algorithmes de régression et de classification
Prdéctions utilisant les méthodes : Naive Forecasting, Moving Averages Forecasting, Exponential Smoothening, Holt’s Linear Forecasting, Holt’sWinter Forecasting
Implémentation des modèles auto-regressifs (ARIMA, SARIMA)
Définition des variables importantes pour chaque modèle
Ces projets peuvent être consultés sur GitHub : https://github.com/said-cs
Le projet consiste à mettre en place un programme intelligent offrant aux entreprises des solutions adaptées dans le secteur de la Supply Chain. Mes principales missions :
Traitement, analyse et exploration des données
Développement des modèles de classification (SVM, régression logistique, modèles à base d’arbres, réseaux de neurones...etc)
Analyse des séries temporelles sur des données de prévisions de ventes
Stationnarisation d’une série temporelle
Développement des modèles auto-régressifs (ARIMA-SARIMA)
Développement des réseaux de neurones CNN et LSTM pour les séries temporelles
Évaluation des différents modèles