Data Science, Python, Economie ...

Accueil

By Tags

sql

  • Afficher les tables existantes dans une base SQL
  • Se connecter à une base SQL
  • sqlite3
  • stdlib

  • Argparse - créer une interface en ligne de commande
  • Comprehension
  • Créer un fichier de configuration avec ConfigParse
  • Différence itérable-itérateur-itération
  • Fonction lambda
  • Générateur
  • Obtenir toutes les clés d'un dictionnaire
  • Packager un projet python
  • Pickle
  • Str - méthodes
  • csv
  • dict.update()
  • filter()
  • iter()
  • set
  • sys.exit()
  • Cartographie

  • Associer des noms de lieux à des coordonnées géographiques
  • Calculer des distances terrestres
  • Cartopy
  • web-scraping

  • BeautifulSoup
  • Selenium
  • Probabilités

  • Chaines de markov
  • Correction de Bonferroni
  • Homoscédasticité et Hétéroscédasticité
  • Loi normale
  • Rêgle de Tukey pour exclure les valeurs aberrantes
  • Test Bootstrap
  • Test de Permutation
  • Théorème de Bayes
  • NLP

  • Créer un vecteur TF de mots
  • Nettoyer un texte avant analyse
  • spaCy
  • ml-pratique

  • Créer un vecteur TF de mots
  • Détecter les valeurs extrêmes
  • Que faire des valeurs manquantes (imputation)
  • Dbscan
  • sklearn
  • spaCy
  • Shell

  • Ecrire un script shell
  • pandas

  • Format datetime
  • Manipuler les formats longs et larges de données
  • Scinder et rassembler les données dans une colonne
  • df.append() - ajouter une ligne
  • df.apply()
  • df.duplicated() - trouver les doublons
  • df.fillna()
  • df.isin() - vérifier le contenu d'une ligne
  • df.isna(), df.isnull() - trouver les valeurs manquantes
  • df.query() - filtrer un dataframe
  • df.reset_index
  • df.to_sql()
  • pd.concat() - ajouter des lignes et des colonnes
  • pd.cut() - créer une variable catégorielle
  • pd.factorize() - transformer une variable str en int
  • series.str.split()
  • Maths

  • Indépendance linéaire
  • Inertie
  • Mise à l'échelle des données - standardisation et normalisation
  • Norme d'un vecteur
  • Similarité cosinus
  • Similarité
  • Valeurs propres
  • Centroïde
  • Visualisations

  • matplotlib
  • Regex

  • Regex - Sélectionner un mot entre deux caractères
  • Apprentissage-non-supervisé,

  • Dbscan
  • Numpy

  • np.flatnonzero()
  • np.linspace(start, end, step)
  • scipy

  • scipy.spatial.distance.euclidian()
  • sklearn

  • sklearn.cluster.Kmeans - Kmeans facile
  • sklearn.impute.SimpleImputer() - Imputation simple
  • sklearn.metrics - Evaluer les modèles