Topic de bahlang :

JVAPI (une api JSON pour les DEV)

Le 05 janvier 2022 à 17:41:06 :

Le 05 janvier 2022 à 17:38:02 :

Le 05 janvier 2022 à 17:37:18 :

Le 05 janvier 2022 à 17:27:06 :

Le 05 janvier 2022 à 17:26:20 :
jeuxvideo.com est probablement l'un des sites les plus facile à scraper : des classes CSS partout, pas de blocage, du server-side rendering. Rien de mieux pour s'exercer au scraping.

Même poster des messages (une fois le cookie coniunctio récupéré) est très aisé.

Et le captcha ?

Faut le résoudre à la mano :-(

Sinon il y a peut être un moyen de le résoudre avec le captcha audio et du speech-to-text :(

Interessant, mais le recaptcha analyse bien plus que ta réponse...

Oui il y a le temps de réaction, les mouvements de la souris etc...

À la limite ça peut peut être se bypasser avec Playwright :(

oui ca doit etre faisable mais galère

Le 05 janvier 2022 à 17:42:17 :

Le 05 janvier 2022 à 17:41:06 :

Le 05 janvier 2022 à 17:38:02 :

Le 05 janvier 2022 à 17:37:18 :

Le 05 janvier 2022 à 17:27:06 :

Le 05 janvier 2022 à 17:26:20 :
jeuxvideo.com est probablement l'un des sites les plus facile à scraper : des classes CSS partout, pas de blocage, du server-side rendering. Rien de mieux pour s'exercer au scraping.

Même poster des messages (une fois le cookie coniunctio récupéré) est très aisé.

Et le captcha ?

Faut le résoudre à la mano :-(

Sinon il y a peut être un moyen de le résoudre avec le captcha audio et du speech-to-text :(

Interessant, mais le recaptcha analyse bien plus que ta réponse...

Oui il y a le temps de réaction, les mouvements de la souris etc...

À la limite ça peut peut être se bypasser avec Playwright :(

oui ca doit etre faisable mais galère

pas besoin de captcha pour poster sur jvc si tu postes pas trop fréquemment (1 post toutes les 2 minutes je crois)

j'avais écrit un bot jvc en python y'a pas longtemps

Le 05 janvier 2022 à 17:45:43 :

Le 05 janvier 2022 à 17:42:17 :

Le 05 janvier 2022 à 17:41:06 :

Le 05 janvier 2022 à 17:38:02 :

Le 05 janvier 2022 à 17:37:18 :

Le 05 janvier 2022 à 17:27:06 :

Le 05 janvier 2022 à 17:26:20 :
jeuxvideo.com est probablement l'un des sites les plus facile à scraper : des classes CSS partout, pas de blocage, du server-side rendering. Rien de mieux pour s'exercer au scraping.

Même poster des messages (une fois le cookie coniunctio récupéré) est très aisé.

Et le captcha ?

Faut le résoudre à la mano :-(

Sinon il y a peut être un moyen de le résoudre avec le captcha audio et du speech-to-text :(

Interessant, mais le recaptcha analyse bien plus que ta réponse...

Oui il y a le temps de réaction, les mouvements de la souris etc...

À la limite ça peut peut être se bypasser avec Playwright :(

oui ca doit etre faisable mais galère

pas besoin de captcha pour poster sur jvc si tu postes pas trop fréquemment (1 post toutes les 2 minutes je crois)

j'avais écrit un bot jvc en python y'a pas longtemps

interressant, et tu connais les rates sur la lecture de posts ?

Le 05 janvier 2022 à 17:45:43 :

Le 05 janvier 2022 à 17:42:17 :

Le 05 janvier 2022 à 17:41:06 :

Le 05 janvier 2022 à 17:38:02 :

Le 05 janvier 2022 à 17:37:18 :

Le 05 janvier 2022 à 17:27:06 :

Le 05 janvier 2022 à 17:26:20 :
jeuxvideo.com est probablement l'un des sites les plus facile à scraper : des classes CSS partout, pas de blocage, du server-side rendering. Rien de mieux pour s'exercer au scraping.

Même poster des messages (une fois le cookie coniunctio récupéré) est très aisé.

Et le captcha ?

Faut le résoudre à la mano :-(

Sinon il y a peut être un moyen de le résoudre avec le captcha audio et du speech-to-text :(

Interessant, mais le recaptcha analyse bien plus que ta réponse...

Oui il y a le temps de réaction, les mouvements de la souris etc...

À la limite ça peut peut être se bypasser avec Playwright :(

oui ca doit etre faisable mais galère

pas besoin de captcha pour poster sur jvc si tu postes pas trop fréquemment (1 post toutes les 2 minutes je crois)

j'avais écrit un bot jvc en python y'a pas longtemps

Oui mais je parlais du login, tu as le captcha à résoudre pour récupérer le cookie coniunctio et être authentifié.

Le 05 janvier 2022 à 17:48:19 :

Le 05 janvier 2022 à 17:45:43 :

Le 05 janvier 2022 à 17:42:17 :

Le 05 janvier 2022 à 17:41:06 :

Le 05 janvier 2022 à 17:38:02 :

Le 05 janvier 2022 à 17:37:18 :

Le 05 janvier 2022 à 17:27:06 :

Le 05 janvier 2022 à 17:26:20 :
jeuxvideo.com est probablement l'un des sites les plus facile à scraper : des classes CSS partout, pas de blocage, du server-side rendering. Rien de mieux pour s'exercer au scraping.

Même poster des messages (une fois le cookie coniunctio récupéré) est très aisé.

Et le captcha ?

Faut le résoudre à la mano :-(

Sinon il y a peut être un moyen de le résoudre avec le captcha audio et du speech-to-text :(

Interessant, mais le recaptcha analyse bien plus que ta réponse...

Oui il y a le temps de réaction, les mouvements de la souris etc...

À la limite ça peut peut être se bypasser avec Playwright :(

oui ca doit etre faisable mais galère

pas besoin de captcha pour poster sur jvc si tu postes pas trop fréquemment (1 post toutes les 2 minutes je crois)

j'avais écrit un bot jvc en python y'a pas longtemps

Oui mais je parlais du login, tu as le captcha à résoudre pour récupérer le cookie coniunctio et être authentifié.

et pourquoi ce nom ?

Après oui le cookie coniunctio a une durée de validité assez longue. Le mien expire en janvier 2023 :ok:

Le 05 janvier 2022 à 17:49:55 :

Le 05 janvier 2022 à 17:48:19 :

Le 05 janvier 2022 à 17:45:43 :

Le 05 janvier 2022 à 17:42:17 :

Le 05 janvier 2022 à 17:41:06 :

Le 05 janvier 2022 à 17:38:02 :

Le 05 janvier 2022 à 17:37:18 :

Le 05 janvier 2022 à 17:27:06 :

Le 05 janvier 2022 à 17:26:20 :
jeuxvideo.com est probablement l'un des sites les plus facile à scraper : des classes CSS partout, pas de blocage, du server-side rendering. Rien de mieux pour s'exercer au scraping.

Même poster des messages (une fois le cookie coniunctio récupéré) est très aisé.

Et le captcha ?

Faut le résoudre à la mano :-(

Sinon il y a peut être un moyen de le résoudre avec le captcha audio et du speech-to-text :(

Interessant, mais le recaptcha analyse bien plus que ta réponse...

Oui il y a le temps de réaction, les mouvements de la souris etc...

À la limite ça peut peut être se bypasser avec Playwright :(

oui ca doit etre faisable mais galère

pas besoin de captcha pour poster sur jvc si tu postes pas trop fréquemment (1 post toutes les 2 minutes je crois)

j'avais écrit un bot jvc en python y'a pas longtemps

Oui mais je parlais du login, tu as le captcha à résoudre pour récupérer le cookie coniunctio et être authentifié.

et pourquoi ce nom ?

Bah j'en sais rien, faut demander aux devs de jeuxvideo.com.

Apparemment c'est un dérivé latin du verbe "joindre".

Le 05 janvier 2022 à 17:48:19 :

Le 05 janvier 2022 à 17:45:43 :

Le 05 janvier 2022 à 17:42:17 :

Le 05 janvier 2022 à 17:41:06 :

Le 05 janvier 2022 à 17:38:02 :

Le 05 janvier 2022 à 17:37:18 :

Le 05 janvier 2022 à 17:27:06 :

Le 05 janvier 2022 à 17:26:20 :
jeuxvideo.com est probablement l'un des sites les plus facile à scraper : des classes CSS partout, pas de blocage, du server-side rendering. Rien de mieux pour s'exercer au scraping.

Même poster des messages (une fois le cookie coniunctio récupéré) est très aisé.

Et le captcha ?

Faut le résoudre à la mano :-(

Sinon il y a peut être un moyen de le résoudre avec le captcha audio et du speech-to-text :(

Interessant, mais le recaptcha analyse bien plus que ta réponse...

Oui il y a le temps de réaction, les mouvements de la souris etc...

À la limite ça peut peut être se bypasser avec Playwright :(

oui ca doit etre faisable mais galère

pas besoin de captcha pour poster sur jvc si tu postes pas trop fréquemment (1 post toutes les 2 minutes je crois)

j'avais écrit un bot jvc en python y'a pas longtemps

Oui mais je parlais du login, tu as le captcha à résoudre pour récupérer le cookie coniunctio et être authentifié.

oui pour se connecter faut un captcha, mais du coup tu peux te connecter manuellement à une dixaine de comptes et récupérer les cookies coniunction :(

Belle initiative, tu l'as fait avec quoi khey ?

Go ajouter une fonction pour post, histoire de flood le forom https://image.noelshack.com/fichiers/2017/15/1492216073-jesus-smile.png

Le 05 janvier 2022 à 17:59:22 :
Belle initiative, tu l'as fait avec quoi khey ?

Go ajouter une fonction pour post, histoire de flood le forom https://image.noelshack.com/fichiers/2017/15/1492216073-jesus-smile.png

Go éviter de flood de forum + gilbert https://image.noelshack.com/fichiers/2017/45/7/1510446145-risitien.png

Remontes un peu, je l'ai fais avec https://github.com/ithirzty/bah

bahlang, le 05 janvier 2022 à 17:34:37 :

Le 05 janvier 2022 à 17:32:58 :
Sympa d'utiliser ton propre langage de programmation et je doute qu'il soit compliqué à maîtriser https://image.noelshack.com/fichiers/2019/41/4/1570729310-chateussoulunettescostume.jpg

Je pense que publier ton code publiquement ne t'apportera aucun soucis légalement (des projets comme Youtube-dl y sont toujours, peu importe ce que font les gens avec) https://image.noelshack.com/fichiers/2019/41/4/1570729310-chateussoulunettescostume.jpg

Le seul problème serait que ton serveur collecte tout de même les données de JV, même temporairement https://image.noelshack.com/fichiers/2019/41/4/1570729310-chateussoulunettescostume.jpg

Ça dépend ce que t'appelle stocker apres, si c'est en mémoire vive moins d'une miliseconde, sans cache, peut on vraiment appeler ca stocker...

A partir du moment où tu redistribues les données d'un site, la question peut se poser https://image.noelshack.com/fichiers/2019/41/4/1570729310-chateussoulunettescostume.jpg

Cependant il ne s'agit pas d'une copie parfaite du site, mais plutôt quelque chose qu'on pourrait comparer à un moteur de recherche, car après tout Google fait la même chose https://image.noelshack.com/fichiers/2019/41/4/1570729310-chateussoulunettescostume.jpg

Elle fonctionne encore ? Elle m'intéresse
Up kheyou ton API a l'air cool mais j'ai besoin que le forum soit personnalisable khoya
Ou si tu peux mettre en open source

Données du topic

Auteur
bahlang
Date de création
5 janvier 2022 à 16:52:54
Nb. messages archivés
94
Nb. messages JVC
79
Voir le topic sur JVC

Afficher uniquement les messages de l'auteur du topic

En ligne sur JvArchive
JvArchive compagnon
Découvrez JvArchive compagnon, l'userscript combattant la censure abusive sur le 18-25 !