Data Science, Python, Economie ...

Accueil

csv

Les fichiers .csv correspondent à des fichiers texte représentant des données sous forme tabulaire. Les colonnes sont séparées par des caractères de ponctuation et les lignes par des retours à la ligne.

Un en-tête (header) peut être spécifié en première ligne afin de donner le nom des colonnes.

On peut généralement spécifier un caractère différent de la virgule : le point-virgule (souvent le cas pour Excel), une tabulation (référencé \t dans les strings Python) ou deux points (:, courant pour Linux), par exemple.

Un code simple de création de csv :

def create_db(self):
	if os.path.isfile(self.filename):
    	print("A file with the same name already exists.")
        print("The data collected will be appended to it")
        # We append the file so that we do no lose previous data.
        # Duplicates can be dealt after.
    csv_file = open(self.filename, 'a+',newline='')
    try:
        writer = csv.writer(csv_file)
        writer.writerow(self.header)
     finally:
         pass

Si l'on utilise le package pandas, on peut ouvrir des fichiers .csv avec la fonction pd.read_csv(filename):

import pandas as pd 
data = pd.read_csv("filename.csv") 

Des options sont disponibles pour définir des paramètres d'importation (séparateur, header, etc…).