J'aurais besoin d'aide pour un travail de NLP/classification en Python svp 
Pour un exo de TD j'ai un CSV simple qui ressemble à ça :
Text Label
0 y r u always l8 to the meetings? student
1 The project team embraced a user-centric desig... ai
2 i dont like dealing with risks, it's too stres... student
3 i dont worry about reliability, it's good enough student
4 i dont care about human-centered design, just ... student
... ... ...
1299 The project team focused on data-driven soluti... ai
1300 i dont like talking about limitations, it feel... student
1301 The research methodology involved both qualita... ai
1302 The team was responsible for presenting the re... aiIl faut y appliquer des modèles de NLP (Bayes, SVM, XGBoost...) sauf que j'ai des accuracy égales à 1, et je vois pas le problème 
Si quelqu'un qui s'y connaît veut bien jeter un oeil à mon notebook par mp ce serait sympa, c'est un travail à rendre 
Le 15 novembre 2024 à 23:51:39 :
Ce desco est incapable d'envoyer un lien en mp
Si je viens de le faire 
Le 15 novembre 2024 à 23:43:08 :
J'ai fait des études en ça c'était insupportable
Je peux pas t'aider dsl
Tes études t'ont servi à quoi du coup ? 
Je suis qu'en L2 mais j'aime bien pour le moment, même si je suis pas hyper doué aya
Le 15 novembre 2024 à 23:45:00 :
C'est quoi le problème si t'as 1 d'accuracy?
Bah c'est pas trop logique, en général c'est du surapprentissage
Le 15 novembre 2024 à 23:54:48 :
Le 15 novembre 2024 à 23:51:39 :
Ce desco est incapable d'envoyer un lien en mpSi je viens de le faire
Le 15 novembre 2024 à 23:43:08 :
J'ai fait des études en ça c'était insupportable
Je peux pas t'aider dslTes études t'ont servi à quoi du coup ?
Je suis qu'en L2 mais j'aime bien pour le moment, même si je suis pas hyper doué ayaLe 15 novembre 2024 à 23:45:00 :
C'est quoi le problème si t'as 1 d'accuracy?Bah c'est pas trop logique, en général c'est du surapprentissage
oui overfitting
reduis le nombre d'epoch et ton learning rate
1 d'accuracy sur le train set ou sur un jeu d'évaluation ?
Sinon des exemples que t'as donné, les phrases "ai" commencent toutes par une majuscule alors que les phrases "student" non, si c'est le cas dans tout le dataset c'est peut être la seule chose que ton modèle apprend
Le 16 novembre 2024 à 00:01:01 :
1 d'accuracy sur le train set ou sur un jeu d'évaluation ?Sinon des exemples que t'as donné, les phrases "ai" commencent toutes par une majuscule alors que les phrases "student" non, si c'est le cas dans tout le dataset c'est peut être la seule chose que ton modèle apprend
Il l'a fait avec chat gpt, chat gpt aura compris que c'est le label, pas la data je pense
Le 16 novembre 2024 à 00:01:01 :
1 d'accuracy sur le train set ou sur un jeu d'évaluation ?Sinon des exemples que t'as donné, les phrases "ai" commencent toutes par une majuscule alors que les phrases "student" non, si c'est le cas dans tout le dataset c'est peut être la seule chose que ton modèle apprend
Sur le jeu d'évaluation
La prof a dit que normalement l'accuracy devait graviter autour de 0.8 pour ce jeu de données
Le 15 novembre 2024 à 23:58:28 :
envoie un lien git je regarde stuv
C'est bon, merci

JvArchive compagnon