Le 05 janvier 2022 à 17:41:06 :
Le 05 janvier 2022 à 17:38:02 :
Le 05 janvier 2022 à 17:37:18 :
Le 05 janvier 2022 à 17:27:06 :
Le 05 janvier 2022 à 17:26:20 :
jeuxvideo.com est probablement l'un des sites les plus facile à scraper : des classes CSS partout, pas de blocage, du server-side rendering. Rien de mieux pour s'exercer au scraping.Même poster des messages (une fois le cookie coniunctio récupéré) est très aisé.
Et le captcha ?
Faut le résoudre à la mano
Sinon il y a peut être un moyen de le résoudre avec le captcha audio et du speech-to-text
Interessant, mais le recaptcha analyse bien plus que ta réponse...
Oui il y a le temps de réaction, les mouvements de la souris etc...
À la limite ça peut peut être se bypasser avec Playwright
oui ca doit etre faisable mais galère
Le 05 janvier 2022 à 17:42:17 :
Le 05 janvier 2022 à 17:41:06 :
Le 05 janvier 2022 à 17:38:02 :
Le 05 janvier 2022 à 17:37:18 :
Le 05 janvier 2022 à 17:27:06 :
Le 05 janvier 2022 à 17:26:20 :
jeuxvideo.com est probablement l'un des sites les plus facile à scraper : des classes CSS partout, pas de blocage, du server-side rendering. Rien de mieux pour s'exercer au scraping.Même poster des messages (une fois le cookie coniunctio récupéré) est très aisé.
Et le captcha ?
Faut le résoudre à la mano
Sinon il y a peut être un moyen de le résoudre avec le captcha audio et du speech-to-text
Interessant, mais le recaptcha analyse bien plus que ta réponse...
Oui il y a le temps de réaction, les mouvements de la souris etc...
À la limite ça peut peut être se bypasser avec Playwright
oui ca doit etre faisable mais galère
pas besoin de captcha pour poster sur jvc si tu postes pas trop fréquemment (1 post toutes les 2 minutes je crois)
j'avais écrit un bot jvc en python y'a pas longtemps
Le 05 janvier 2022 à 17:45:43 :
Le 05 janvier 2022 à 17:42:17 :
Le 05 janvier 2022 à 17:41:06 :
Le 05 janvier 2022 à 17:38:02 :
Le 05 janvier 2022 à 17:37:18 :
Le 05 janvier 2022 à 17:27:06 :
Le 05 janvier 2022 à 17:26:20 :
jeuxvideo.com est probablement l'un des sites les plus facile à scraper : des classes CSS partout, pas de blocage, du server-side rendering. Rien de mieux pour s'exercer au scraping.Même poster des messages (une fois le cookie coniunctio récupéré) est très aisé.
Et le captcha ?
Faut le résoudre à la mano
Sinon il y a peut être un moyen de le résoudre avec le captcha audio et du speech-to-text
Interessant, mais le recaptcha analyse bien plus que ta réponse...
Oui il y a le temps de réaction, les mouvements de la souris etc...
À la limite ça peut peut être se bypasser avec Playwright
oui ca doit etre faisable mais galère
pas besoin de captcha pour poster sur jvc si tu postes pas trop fréquemment (1 post toutes les 2 minutes je crois)
j'avais écrit un bot jvc en python y'a pas longtemps
interressant, et tu connais les rates sur la lecture de posts ?
Le 05 janvier 2022 à 17:45:43 :
Le 05 janvier 2022 à 17:42:17 :
Le 05 janvier 2022 à 17:41:06 :
Le 05 janvier 2022 à 17:38:02 :
Le 05 janvier 2022 à 17:37:18 :
Le 05 janvier 2022 à 17:27:06 :
Le 05 janvier 2022 à 17:26:20 :
jeuxvideo.com est probablement l'un des sites les plus facile à scraper : des classes CSS partout, pas de blocage, du server-side rendering. Rien de mieux pour s'exercer au scraping.Même poster des messages (une fois le cookie coniunctio récupéré) est très aisé.
Et le captcha ?
Faut le résoudre à la mano
Sinon il y a peut être un moyen de le résoudre avec le captcha audio et du speech-to-text
Interessant, mais le recaptcha analyse bien plus que ta réponse...
Oui il y a le temps de réaction, les mouvements de la souris etc...
À la limite ça peut peut être se bypasser avec Playwright
oui ca doit etre faisable mais galère
pas besoin de captcha pour poster sur jvc si tu postes pas trop fréquemment (1 post toutes les 2 minutes je crois)
j'avais écrit un bot jvc en python y'a pas longtemps
Oui mais je parlais du login, tu as le captcha à résoudre pour récupérer le cookie coniunctio et être authentifié.
Le 05 janvier 2022 à 17:48:19 :
Le 05 janvier 2022 à 17:45:43 :
Le 05 janvier 2022 à 17:42:17 :
Le 05 janvier 2022 à 17:41:06 :
Le 05 janvier 2022 à 17:38:02 :
Le 05 janvier 2022 à 17:37:18 :
Le 05 janvier 2022 à 17:27:06 :
Le 05 janvier 2022 à 17:26:20 :
jeuxvideo.com est probablement l'un des sites les plus facile à scraper : des classes CSS partout, pas de blocage, du server-side rendering. Rien de mieux pour s'exercer au scraping.Même poster des messages (une fois le cookie coniunctio récupéré) est très aisé.
Et le captcha ?
Faut le résoudre à la mano
Sinon il y a peut être un moyen de le résoudre avec le captcha audio et du speech-to-text
Interessant, mais le recaptcha analyse bien plus que ta réponse...
Oui il y a le temps de réaction, les mouvements de la souris etc...
À la limite ça peut peut être se bypasser avec Playwright
oui ca doit etre faisable mais galère
pas besoin de captcha pour poster sur jvc si tu postes pas trop fréquemment (1 post toutes les 2 minutes je crois)
j'avais écrit un bot jvc en python y'a pas longtemps
Oui mais je parlais du login, tu as le captcha à résoudre pour récupérer le cookie coniunctio et être authentifié.
et pourquoi ce nom ?
coniunctio a une durée de validité assez longue. Le mien expire en janvier 2023 
Le 05 janvier 2022 à 17:49:55 :
Le 05 janvier 2022 à 17:48:19 :
Le 05 janvier 2022 à 17:45:43 :
Le 05 janvier 2022 à 17:42:17 :
Le 05 janvier 2022 à 17:41:06 :
Le 05 janvier 2022 à 17:38:02 :
Le 05 janvier 2022 à 17:37:18 :
Le 05 janvier 2022 à 17:27:06 :
Le 05 janvier 2022 à 17:26:20 :
jeuxvideo.com est probablement l'un des sites les plus facile à scraper : des classes CSS partout, pas de blocage, du server-side rendering. Rien de mieux pour s'exercer au scraping.Même poster des messages (une fois le cookie coniunctio récupéré) est très aisé.
Et le captcha ?
Faut le résoudre à la mano
Sinon il y a peut être un moyen de le résoudre avec le captcha audio et du speech-to-text
Interessant, mais le recaptcha analyse bien plus que ta réponse...
Oui il y a le temps de réaction, les mouvements de la souris etc...
À la limite ça peut peut être se bypasser avec Playwright
oui ca doit etre faisable mais galère
pas besoin de captcha pour poster sur jvc si tu postes pas trop fréquemment (1 post toutes les 2 minutes je crois)
j'avais écrit un bot jvc en python y'a pas longtemps
Oui mais je parlais du login, tu as le captcha à résoudre pour récupérer le cookie coniunctio et être authentifié.
et pourquoi ce nom ?
Bah j'en sais rien, faut demander aux devs de jeuxvideo.com.
Apparemment c'est un dérivé latin du verbe "joindre".
Le 05 janvier 2022 à 17:48:19 :
Le 05 janvier 2022 à 17:45:43 :
Le 05 janvier 2022 à 17:42:17 :
Le 05 janvier 2022 à 17:41:06 :
Le 05 janvier 2022 à 17:38:02 :
Le 05 janvier 2022 à 17:37:18 :
Le 05 janvier 2022 à 17:27:06 :
Le 05 janvier 2022 à 17:26:20 :
jeuxvideo.com est probablement l'un des sites les plus facile à scraper : des classes CSS partout, pas de blocage, du server-side rendering. Rien de mieux pour s'exercer au scraping.Même poster des messages (une fois le cookie coniunctio récupéré) est très aisé.
Et le captcha ?
Faut le résoudre à la mano
Sinon il y a peut être un moyen de le résoudre avec le captcha audio et du speech-to-text
Interessant, mais le recaptcha analyse bien plus que ta réponse...
Oui il y a le temps de réaction, les mouvements de la souris etc...
À la limite ça peut peut être se bypasser avec Playwright
oui ca doit etre faisable mais galère
pas besoin de captcha pour poster sur jvc si tu postes pas trop fréquemment (1 post toutes les 2 minutes je crois)
j'avais écrit un bot jvc en python y'a pas longtemps
Oui mais je parlais du login, tu as le captcha à résoudre pour récupérer le cookie coniunctio et être authentifié.
oui pour se connecter faut un captcha, mais du coup tu peux te connecter manuellement à une dixaine de comptes et récupérer les cookies coniunction 
Le 05 janvier 2022 à 17:59:22 :
Belle initiative, tu l'as fait avec quoi khey ?Go ajouter une fonction pour post, histoire de flood le forom
![]()
Go éviter de flood de forum + gilbert
Remontes un peu, je l'ai fais avec https://github.com/ithirzty/bah
bahlang, le 05 janvier 2022 à 17:34:37 :
Le 05 janvier 2022 à 17:32:58 :
Sympa d'utiliser ton propre langage de programmation et je doute qu'il soit compliqué à maîtriser![]()
Je pense que publier ton code publiquement ne t'apportera aucun soucis légalement (des projets comme Youtube-dl y sont toujours, peu importe ce que font les gens avec)
![]()
Le seul problème serait que ton serveur collecte tout de même les données de JV, même temporairement
![]()
Ça dépend ce que t'appelle stocker apres, si c'est en mémoire vive moins d'une miliseconde, sans cache, peut on vraiment appeler ca stocker...
A partir du moment où tu redistribues les données d'un site, la question peut se poser
Cependant il ne s'agit pas d'une copie parfaite du site, mais plutôt quelque chose qu'on pourrait comparer à un moteur de recherche, car après tout Google fait la même chose
Afficher uniquement les messages de l'auteur du topic