Bonjour, je ne suis absolument pas en train de faire du web mais bon c'est du python et du html
Je suis en train de faire un parser pour extraire du texte d'un fichier html en utilisant la classe HTMLParser. Sauf que quand je lance j'obtient cette erreur :
1 | UnicodeDecodeError: 'utf-8' codec can't decode byte 0xe9 |
Que dois-je faire ? De ce que j'ai compris c'est un problème d'encodage mais je ne sais pas si c'est le fichier python ou le fichier html. Le texte est en français donc avec des accents et 'ç'
Merci d'avance
+0
-0