Topic de gouttes :

[Python] Besoin d'aide pour un exo de NLP

Supprimé

J'aurais besoin d'aide pour un travail de NLP/classification en Python svp :hap:

Pour un exo de TD j'ai un CSV simple qui ressemble à ça :

                                                   Text    Label
0                      y r u always l8 to the meetings?  student
1     The project team embraced a user-centric desig...       ai
2     i dont like dealing with risks, it's too stres...  student
3      i dont worry about reliability, it's good enough  student
4     i dont care about human-centered design, just ...  student
...                                                 ...      ...
1299  The project team focused on data-driven soluti...       ai
1300  i dont like talking about limitations, it feel...  student
1301  The research methodology involved both qualita...       ai
1302  The team was responsible for presenting the re...       ai

Il faut y appliquer des modèles de NLP (Bayes, SVM, XGBoost...) sauf que j'ai des accuracy égales à 1, et je vois pas le problème :hap:

Si quelqu'un qui s'y connaît veut bien jeter un oeil à mon notebook par mp ce serait sympa, c'est un travail à rendre :hap:

J'ai fait des études en ça c'était insupportable
Je peux pas t'aider dsl
C'est quoi le problème si t'as 1 d'accuracy?
Utilise chatgpt ou Claude le desco
Chat gpt kheys, surtout pour python il est introllable
Ce desco est incapable d'envoyer un lien en mp

Le 15 novembre 2024 à 23:51:39 :
Ce desco est incapable d'envoyer un lien en mp

Si je viens de le faire :hap:

Le 15 novembre 2024 à 23:43:08 :
J'ai fait des études en ça c'était insupportable
Je peux pas t'aider dsl

Tes études t'ont servi à quoi du coup ? :hap:
Je suis qu'en L2 mais j'aime bien pour le moment, même si je suis pas hyper doué aya

Le 15 novembre 2024 à 23:45:00 :
C'est quoi le problème si t'as 1 d'accuracy?

Bah c'est pas trop logique, en général c'est du surapprentissage

Le 15 novembre 2024 à 23:54:48 :

Le 15 novembre 2024 à 23:51:39 :
Ce desco est incapable d'envoyer un lien en mp

Si je viens de le faire :hap:

Le 15 novembre 2024 à 23:43:08 :
J'ai fait des études en ça c'était insupportable
Je peux pas t'aider dsl

Tes études t'ont servi à quoi du coup ? :hap:
Je suis qu'en L2 mais j'aime bien pour le moment, même si je suis pas hyper doué aya

Le 15 novembre 2024 à 23:45:00 :
C'est quoi le problème si t'as 1 d'accuracy?

Bah c'est pas trop logique, en général c'est du surapprentissage

oui overfitting
reduis le nombre d'epoch et ton learning rate

envoie un lien git je regarde stuv

1 d'accuracy sur le train set ou sur un jeu d'évaluation ?

Sinon des exemples que t'as donné, les phrases "ai" commencent toutes par une majuscule alors que les phrases "student" non, si c'est le cas dans tout le dataset c'est peut être la seule chose que ton modèle apprend

Le 16 novembre 2024 à 00:01:01 :
1 d'accuracy sur le train set ou sur un jeu d'évaluation ?

Sinon des exemples que t'as donné, les phrases "ai" commencent toutes par une majuscule alors que les phrases "student" non, si c'est le cas dans tout le dataset c'est peut être la seule chose que ton modèle apprend

Il l'a fait avec chat gpt, chat gpt aura compris que c'est le label, pas la data je pense

Le 16 novembre 2024 à 00:01:01 :
1 d'accuracy sur le train set ou sur un jeu d'évaluation ?

Sinon des exemples que t'as donné, les phrases "ai" commencent toutes par une majuscule alors que les phrases "student" non, si c'est le cas dans tout le dataset c'est peut être la seule chose que ton modèle apprend

Sur le jeu d'évaluation
La prof a dit que normalement l'accuracy devait graviter autour de 0.8 pour ce jeu de données

Le 15 novembre 2024 à 23:58:28 :
envoie un lien git je regarde stuv

C'est bon, merci

j'ai une question, est ce que pour ce genre d'exercice chatgpt peut t'aider ou il ne sert plus à rien?
Oui il peut large mais là il m'a pas aidé à trouver la source du problème donc je préfère demander à un humain :hap:

Données du topic

Auteur
gouttes
Date de création
15 novembre 2024 à 23:40:30
Date de suppression
16 novembre 2024 à 21:50:00
Supprimé par
Auteur
Nb. messages archivés
19
Nb. messages JVC
17
Voir le topic sur JVC

Afficher uniquement les messages de l'auteur du topic

En ligne sur JvArchive

JvArchive compagnon

Découvrez JvArchive compagnon , l'userscript combattant la censure abusive sur le 18-25 !