https://www.youtube.com/watch?v=KDzUozgLyCI&t=1736s

Movies Analysis project

Nous avons 10866 lignes et 21 colonnes

Data Cleaning

Delete duplicated rows

Checking the missing values

Removal of no useful columns.

Check for missing values

Supprimer les 23 lignes manquantes

Check for missing values

recodage de la colonnes "genres"

Regular Expressions

Nous allons prendre seulement la 1e valeur.

Nous allons changer "genres" en "genre_adj"

EXPLORATORY ANALYSIS

Les Variables numériques

Analyse univariée (Univariate analysis)

Les Variables qualitatives

Analyse Bivariée ( Bivariate Analysis)

Il y a une correlation entre les revenues et budget

les votes qui sont à partir de 7, ont un très bon revenu.

Q1: Quel est le genre de film qui a un très bon revenu?

Q2: les caracteristiques des filmes avec un très bon revenu?