Topic de gouttes :

[Python] Besoin d'aide pour un exo de NLP

Supprimé

15 novembre 2024 à 23:40:30

J'aurais besoin d'aide pour un travail de NLP/classification en Python svp :hap:

Pour un exo de TD j'ai un CSV simple qui ressemble à ça :

                                                   Text    Label
0                      y r u always l8 to the meetings?  student
1     The project team embraced a user-centric desig...       ai
2     i dont like dealing with risks, it's too stres...  student
3      i dont worry about reliability, it's good enough  student
4     i dont care about human-centered design, just ...  student
...                                                 ...      ...
1299  The project team focused on data-driven soluti...       ai
1300  i dont like talking about limitations, it feel...  student
1301  The research methodology involved both qualita...       ai
1302  The team was responsible for presenting the re...       ai

Il faut y appliquer des modèles de NLP (Bayes, SVM, XGBoost...) sauf que j'ai des accuracy égales à 1, et je vois pas le problème :hap:

Si quelqu'un qui s'y connaît veut bien jeter un oeil à mon notebook par mp ce serait sympa, c'est un travail à rendre :hap:

gouttes Auteur

15 novembre 2024 à 23:40:53

stanislas24

15 novembre 2024 à 23:42:43

Envoie

LiteratureClub

15 novembre 2024 à 23:43:08

J'ai fait des études en ça c'était insupportable
Je peux pas t'aider dsl

CreeAxe94

15 novembre 2024 à 23:45:00

C'est quoi le problème si t'as 1 d'accuracy?

flemme39

15 novembre 2024 à 23:45:57

Utilise chatgpt ou Claude le desco

Eldeter93

15 novembre 2024 à 23:47:28

Chat gpt kheys, surtout pour python il est introllable

stanislas24

15 novembre 2024 à 23:51:39

Ce desco est incapable d'envoyer un lien en mp

gouttes Auteur

15 novembre 2024 à 23:54:48

Le 15 novembre 2024 à 23:51:39 :
Ce desco est incapable d'envoyer un lien en mp

Si je viens de le faire :hap:

Le 15 novembre 2024 à 23:43:08 :
J'ai fait des études en ça c'était insupportable
Je peux pas t'aider dsl

Tes études t'ont servi à quoi du coup ? :hap:
Je suis qu'en L2 mais j'aime bien pour le moment, même si je suis pas hyper doué aya

Le 15 novembre 2024 à 23:45:00 :
C'est quoi le problème si t'as 1 d'accuracy?

Bah c'est pas trop logique, en général c'est du surapprentissage

stanislas24

15 novembre 2024 à 23:58:12

Le 15 novembre 2024 à 23:54:48 :
Le 15 novembre 2024 à 23:51:39 :
Ce desco est incapable d'envoyer un lien en mp
Si je viens de le faire
Le 15 novembre 2024 à 23:43:08 :
J'ai fait des études en ça c'était insupportable
Je peux pas t'aider dsl
Tes études t'ont servi à quoi du coup ?
Je suis qu'en L2 mais j'aime bien pour le moment, même si je suis pas hyper doué aya
Le 15 novembre 2024 à 23:45:00 :
C'est quoi le problème si t'as 1 d'accuracy?
Bah c'est pas trop logique, en général c'est du surapprentissage

oui overfitting
reduis le nombre d'epoch et ton learning rate

stanislas24

15 novembre 2024 à 23:58:28

envoie un lien git je regarde stuv

[OwO]

16 novembre 2024 à 00:01:01

1 d'accuracy sur le train set ou sur un jeu d'évaluation ?

Sinon des exemples que t'as donné, les phrases "ai" commencent toutes par une majuscule alors que les phrases "student" non, si c'est le cas dans tout le dataset c'est peut être la seule chose que ton modèle apprend

stanislas24

16 novembre 2024 à 00:03:58

Le 16 novembre 2024 à 00:01:01 :
1 d'accuracy sur le train set ou sur un jeu d'évaluation ?
Sinon des exemples que t'as donné, les phrases "ai" commencent toutes par une majuscule alors que les phrases "student" non, si c'est le cas dans tout le dataset c'est peut être la seule chose que ton modèle apprend

Il l'a fait avec chat gpt, chat gpt aura compris que c'est le label, pas la data je pense

gouttes Auteur

16 novembre 2024 à 00:26:14

Le 16 novembre 2024 à 00:01:01 :
1 d'accuracy sur le train set ou sur un jeu d'évaluation ?
Sinon des exemples que t'as donné, les phrases "ai" commencent toutes par une majuscule alors que les phrases "student" non, si c'est le cas dans tout le dataset c'est peut être la seule chose que ton modèle apprend

Sur le jeu d'évaluation
La prof a dit que normalement l'accuracy devait graviter autour de 0.8 pour ce jeu de données