Filtres génériques - [Ajoutés]

French supplemental subscription

Moderator: Liste AR & FR Mods

Locked
User avatar
Crits
Liste FR Author
Liste FR Author
Posts: 682
Joined: Sun Dec 18, 2011 6:21 pm
Location: France

Filtres génériques - [Ajoutés]

Post by Crits »

A l'instar de l'EasyList et la Fanboy List, j'aimerais ajouter des filtres génériques à la liste FR, ce qui nous permettra de bloquer de nombreuses pubs que l'on n'auraient pas encore détectées, ainsi que de nombreuses pubs futures.

Les filtres que je propose ici sont à l'image des filtres génériques présents dans l'EasyList, mais l'idée est d'ajouter dans la liste FR leur version régionalisée afin qu'ils soient adaptés aux sites web francophones (par exemple : "pub" à la place de "ads", "bannieres" à la place de "banner", ou encore ".fr" à la place de ".com"). Sachant que j'ai surtout pris des bouts des filtres qui existaient déjà dans la liste FR. J'ai déjà élagué un peu la liste ci-dessous en prenant en compte les faux-positifs provenant de filtres génériques qui avaient déjà été notés par les contributeurs de l'EasyList.

Concernant les effets des filtres génériques sur la vitesse de filtrage d'Adblock Plus lors du chargement d'une page :
1) Je ne sais pas exactement ce qu'il en est pour les règles de masquage d'éléments.
2) Par contre, pour tous les autres filtres (c'est-à-dire les 3 derniers cadres de code ci-dessous), le fait de rendre ces filtres génériques et donc plus courts n'aura quasiment aucune influence sur la vitesse de filtrage. En effet, d'après un message obscur de Wladimir que je ne saurais retrouver, tant que les filtres ont au moins 3 caractères consécutifs sans * (joker), la complexité du filtrage reste grossièrement de l'ordre de O(1), relativement au nombre de règles de filtrage de la liste utilisée.

Je n'ai pas encore ajouté ces filtres à la liste FR. Je vais de mon côté les tester pendant environ 2 semaines pour voir s'ils ne posent pas de problème.

Merci, si vous avez un peu de temps devant vous, de tester ces filtres pendant ces prochaines semaines afin de voir s'il ne provoquent pas de faux-positifs. N'hésitez pas non plus à poster un message ici si vous pensez à d'autres filtres génériques dans ce genre, ou si vous avez une quelconque critique sur le principe même de ces filtres génériques.

EDIT : Liste de filtres enlevée de ce post, la liste complète se trouve quelques posts plus bas.
User avatar
Lian
Liste FR Author
Liste FR Author
Posts: 462
Joined: Thu Aug 07, 2008 10:14 pm

Post by Lian »

J'ai remarqué que beaucoup de sites francophones utilisent en fait des url ou des ID de pubs en anglais (ads etc.). Donc perso j'ai pas vu beaucoup d'occasions de rajouter des filtres génériques francophones.

En ne gardant que tes filtres et en ouvrant des dizaines de sites Fr de tous types seule une minorité s'est activée dans mon test :

##.position_pub
.fr/ads.
.fr/ads/
/images/pub/*
/publicite.js
Présentation, conseils de blocage et soutien au projet
User avatar
Crits
Liste FR Author
Liste FR Author
Posts: 682
Joined: Sun Dec 18, 2011 6:21 pm
Location: France

Post by Crits »

A vrai dire, la quasi-totalité de ces filtres sont actuellement déjà présents dans la liste FR donc devraient quand même s'activer à un moment ou à un autre :)
Et ceux-ci se retrouveront aussi dans des sites plus ou moins connus pour lesquels peu de monde fera des remarques concernant Adblock Plus, ce qui fera donc d'une pierre deux coups.
Après, il est vrai qu'ils ne seront pas aussi utiles que les filtres génériques de l'EasyList, mais si tu fais un tour dans les listes complémentaires (EasyList Italy ou EasyList Germany par exemple), tu te rendras compte qu'elles contiennent aussi beaucoup de filtres génériques (et régionalisés).

Peut-être que les filtres suivants ne sont pas très utiles en effet :

Code: Select all

.fr/bads/
.fr/gads/
.fr/miads/
.be/bads/
.be/gads/
.be/miads/
User avatar
Crits
Liste FR Author
Liste FR Author
Posts: 682
Joined: Sun Dec 18, 2011 6:21 pm
Location: France

Post by Crits »

---------- Filtres génériques ajoutés ----------

:arrow: :arrow: :arrow: https://code.google.com/p/listefr-adblo ... 34048a7dc1

AJOUTÉS :

Code: Select all

.be/ads-
.be/ads.
.be/ads/
.be/ads?
.be/ads_
.com/fr/ads/
.fr/ads-
.fr/ads.
.fr/ads/
.fr/ads?
.fr/ads_
/bandeaupublicite/*
/banniere_pub/*
/images/pub/*$domain=~usinedeco.com
/images/pubs/*
/images_pub/*
/pub_affichage_web/*
/pub/banniere/*
/publicite.js
/publicite/*
/publicite_
/template/pubs/*

###adsCarre
###adsHaut
###annonce_pub2
###bandeau_pub
###bandeau_publicite
###Block_Pub_Right
###blocPublicitaire
###contextuel-publicite-video
###footer_haut-publicite
###footerpubs
###general_subpub
###header_bloc2_pub
###idMapAdvertising
###idpublicitepave
###iframesidebarpub
###news-droite-publicite
###pave_pub
###pub_carre_1
###pub_contener_right
###pub_header_droite
###pub_square
###pubEncart
###pubEncart1
###pubEncart2
###PubFooter
###PubHead
###PubHeader
###publicite_banniere
###PubPave
###pubright
###pub-widget
###pub-widget2
###rightpubbox
###slidepub
###tag_pub_footer
###thePubDiv2
##.block.pub
##.block.publicite
##.container-pubcarre
##.footer-pub
##.footerpubleft
##.footerpubright
ENLEVÉS :

Code: Select all

||webedia.fr/ads/$third-party
||cdn.cnetnetworks.fr/ads/*/fond.jpg$domain=gamekult.com
||cyberpresse.ca/latribune/publicite/*
||emploipartner.com/template/pubs/
||frandroid.com/visuals/pub_affichage_web/
||images.gamekult.com/images/pubs/
||lapresse.tn/images/upload_files/banniere_pub/
||les-terrains.com/images_pub/
||meteoconsult.fr/common_terrestre/bandeaupublicite/affichebann?
||mr-annonce.fr/images/pub/
||rfi.fr/scripts/publicite.js
||rfi.fr/img/publicite_
||tsa-algerie.com/images/pubs/

agoravox.fr##.publarge
blogdumac.com###pub-widget
blogdumac.com###pub-widget2
canalplus.fr###idpublicitepave
competition.dz##.publicite-bas
deezer.com##.pub_mobile
ecrannoir.fr###bandeau_pub
eurekasante.fr###thePubDiv2
filmdeculte.com###pubright
forum.freenews.fr##.publicite_3
generation-nt.com##.pub300x250
gulli.fr##.pave_pub
ina.fr##.container-pubcarre
infos-mobiles.com##.pubaccueildroite1
infos-mobiles.com##.pubaccueilgauche1
judgehype.com###news-droite-publicite
lachainemeteo.com###bandeau_pub
lemonde.fr##.position_pub
lexpressiondz.com###header_bloc2_pub
lagazettedescommunes.com##.footer-pub
marsactu.fr##.pub-banner
meteoconsult.fr###bandeau_publicite
millenium.org###pub_header_droite
millenium.org##.pubIframe
muzika.fr###adsCarre
muzika.fr###adsHaut
numerama.com###general_subpub
radiofrance.fr###blocPublicitaire
ratp.fr###pubEncart1
ratp.fr###pubEncart2
rfi.fr###footer_haut-publicite
rfi.fr###contextuel-publicite-video
siteduzero.com###publicite_banniere
tv-replay.fr###pave_pub
viamichelin.fr###idMapAdvertising
viamichelin.fr##.pubContent
zap-tele.com##.pubRight1
User avatar
Lian
Liste FR Author
Liste FR Author
Posts: 462
Joined: Thu Aug 07, 2008 10:14 pm

Post by Lian »

Est-ce que tous ces filtres génériques ont déjà été constatés sur plusieurs sites ? Car si un motif ne se rencontrera que sur un seul site il vaut mieux garder le filtre qui sera le plus précis possible, c'est meilleurs en terme d'impact sur les performances d'Adblock.

Sinon j'ai retiré les accents ça posait un soucis pour le calcul du checksum. Sans doute un problème de formatage.
Présentation, conseils de blocage et soutien au projet
User avatar
Crits
Liste FR Author
Liste FR Author
Posts: 682
Joined: Sun Dec 18, 2011 6:21 pm
Location: France

Post by Crits »

Les filtres qui ne concernent pas le masquage d'élément, oui. Pour la plupart des filtres de masquage d'élément, pas forcément.

Mais l'impact sur les performances d'Adblock Plus (qui nécessite de base peu de ressources de toute façon) est clairement négligeable, car l’algorithme de matching entre URL et filtres utilise un système performant de correspondance entre des mots-clés extraits de ces deux entités, qui rend le temps d'exécution de cet algorithme peu dépendant du nombre de filtres des listes utilisées.
C'est d'ailleurs pour cela, je pense, que les gestionnaires de l'EasyList ajoutent tant de filtres génériques à leur liste, sans pour autant se demander si'ls apparaissent forcément sur plusieurs sites.

Et même si l'ajout de filtres génériques avait un impact non négligeable sur les performances d'ABP : l'EasyList compte actuellement 7936 filtres dits "génériques" (cad plutôt courts et non associés à un nom de domaine).
La liste FR en compte actuellement de son côté 88, et ce nombre ne va pas croître de façon démesurée dans l'avenir.
Soit environ 90x moins, donc l'impact sur les performances serait au pire de l'ordre de 1% (et plus raisonnablement de l'ordre de 0.1%)

Et puis, il ne faut pas oublier que le Web francophones comportent surement plusieurs millions de pages Web, et ce système de filtres génériques nous facilitera donc bien la vie pour le futur.

Sinon, pas de soucis pour le checksum, j'y penserai à l'avenir.
Locked