Wikipedia:Filtro de ediciones/Implementación/Archivo 2022

De Wikipedia, la enciclopedia libre


Filtro 136[editar]

Asunto

En Wikipedia existen determinadas protecciones para velar por la seguridad del contenido del proyecto. Así, las páginas de código o que afectan directamente a la interfaz solamente pueden ser editadas por administradores de interfaz, las páginas totalmente protegidas solamente pueden ser editadas por los bibliotecarios, los filtros solamente pueden ser editados por los administradores de filtros y los bibliotecarios, o las páginas semiprotegidas solamente pueden ser editadas por autoconfirmados.

Hasta aquí todo parece bastante normal. Pero para Plantilla:Portada:Actualidad existe específicamente el filtro 136, creado por -jem-, que limita su edición «a bibliotecarios y a un grupo de wikipedistas instruidos al efecto» formado por Jembot, Madamebiblio, MONUMENTA y Villalaso. ¿Por qué una lista arbitraria? ¿Por qué esos usuarios? ¿Acaso los cinco usuarios que actualmente hemos sido impedidos de nuestra edición en tal plantilla necesitamos ser «instruidos al efecto»? ¿Necesita CGE —un usuario con más de once mil ediciones y quince años de experiencia— ser instruido para cambiar una fecha? ¿Necesita Futbolero —un usuario con casi noventa mil ediciones y dieciséis años de experiencia— ser instruido para agregar un elemento de lista? ¿Necesita Obelix83 —un usuario con más de setenta mil ediciones y quince años de experiencia— ser instruido para actualizar una imagen? ¿Necesita Usuario:Gafotas —un usuario con casi cincuentamil ediciones y dieciseis años de experiencia— ser instruido para un elemento de lista? ¿Necesito yo explicales a los «instruidos al efecto» qué significa la atribución de una licencia?

Con apenas diez disparos del filtro —todos ellos bien intencionados— en casi cinco meses, que afectan a una plantilla que ya está semiprotegida y que no es directamente accesible, sino que está escondida en una página de un portal. ¿Qué necesidad hay de protegerla tanto?

Sé que hay unos criterios establecidos para decidir qué se agrega y qué no se agrega en la portada, pero también tengo entendido que en Wikipedia todo se puede arreglar, y que para solicitar una protección o semiprotección tiene que existir una justificación previa pues no se hacen de forma preventiva. Por todo ello, solicito la eliminación del filtro 136 o su reconfiguración para incluir grupos específicos de usuarios.

  • comentario Comentario posterior a la respuesta. Disculpa mi insitencia Laura Fiorucci, pero traslado aquí mi opinión para que reconsideres tu decisión. Tal como está parece que hay una élite que puede editar la portada. Un nuego grupo reservado, que no fue decidido por la Comunidad. Me parecería mejor que estuviera limitado a verificadores —incluso aunque yo seguiría sin poder editar la plantilla— o a un nuevo grupo de «revisores de portada» creado al efecto, donde cada interesado tendría que postularse. Lo del filtro parece un parche, una chapuza sin consulta. O se hacen las cosas bien... o no se hacen. Si no hay gente que actualice la sección de Actualidad, pues no hay actualidad, como tampoco ya no hay Wikipedia:¿Sabías que... Además, el filtro es altamente inseguro porque el número de usuarios autorizados no está limitado a esos cuatro añadidos (aunque por WP:LLAVE no puedo darte mayores detalles sobre esto) por lo que igualmente debería ser corregido. -- Leoncastro (discusión) 22:19 17 ene 2022 (UTC)
Usuario que lo solicita

Leoncastro (discusión) 19:59 17 ene 2022 (UTC)

Respuesta

Hola, @Leoncastro:. Esa plantilla estuvo protegida de edición desde hace mucho. Si revisas el historial, como creo que ya hiciste, podrás darte cuenta que, desde hace años, solo la editábamos @-jem-: y yo. Yo hacía la actualización diaria de la Portada todos los días de año, sin faltar uno, durante años. Por cosas de la vida he estado con "tiempo inestable" y he buscado, desde hace muchos meses, incluso con mensajes en el Café, a usuarios que deseen relevarme de esa tarea. Lo cierto es que no había conseguido a ningún bibliotecario que se hiciera cargo, diariamente, de la Portada.

Hubo usuarios, sin permisos de biblio, que quisieron colaborar en esta tarea pero, como debes saber, las cosas de la Portada de Wikipedia están protegidas (tuvimos casos de pequeños desastres hechos por personas "bien intencionadas" que rompieron todo). La ayuda de no biblios fue bienvenida, se ofrecieron varias personas y se nos planteó el problema de cómo podían editar la plantilla sin los permisos de administradores; fue allí donde jem hizo el filtro.

El sistema de actualización de la Portada se ha ido semiautomatizando, gracias José Emilio, y por ello hicimos un canal de telegram para coordinarnos. Se actualiza a medianoche UTC, o cerca, se revisa que cada artículo que va tenga las referencias y datos correctos y que tenga los datos en Wikidata. También las imágenes se rotan siguiendo el orden de llegada a la plantilla... supongo que hay otras cosas que, por obvias, no las recuerdo, las hago mentalmente en automático.

Los usuarios como tú, que se quejan que no pueden editar la portada en un momento específico, no se comprometen a editarla diariamente per secula..., así que el mal es menor. Un pequeño error, una fecha rodada, la inclusión de un evento... no necesita la inmediatez de Wikinoticias y puede ser perfectamente avisado en la discusión de la Portada para ser incluido en la próxima actualización. Así que, a menos que la comunidad levante la voz y decida cambiar lo que hasta ahora hemos hecho con el espaldarazo de la misma comunidad (en algún momento pondré el enlace del hilo del Café, cuando lo encuentre), el filtro seguirá igual y usaremos el mismo método. Saludos, Laura Fiorucci (discusión) 21:19 17 ene 2022 (UTC)

Hola, @Leoncastro:. Estoy llegando del trabajo, revisaré todo lo que me dices. Aunque nos hemos cruzado poco, veo tu buen tino para las cosas. Déjame revisar con calma tus sugerencias. Mi gran duda es que, si no hay coordinación para los cambios, ya me ha pasado, la portada se convierte en un "sin Dios". Saludos, Laura Fiorucci (discusión) 00:19 18 ene 2022 (UTC)
Bueno, si te parece que hay una "élite", regresemos al statu quo, esto es que la plantilla solo pueda ser editada por bibliotecarios (como el resto de plantillas de la portada), supongo que esto hará que esa sección desaparezca si no hay quien se comprometa, no lo sé; o puedes plantearlo en el Café, y ver la opinión de la comunidad. Qué dice @-jem-:, que es parte importante de este trabajo... Laura Fiorucci (discusión) 01:47 18 ene 2022 (UTC)
Qué sencillo decir que "si no hay gente que actualice la sección de Actualidad, pues no hay actualidad" bajo la premisa de que si lo que se implementó no me gusta entonces está mal y debe quitarse. Para nada acercarse de buena fe y plantear modificaciones o soluciones alternativas; nada de de acercarse y decir, "ey, puedo colaborar de vez en cuando ¿cómo puedo hacer?"; nah, mejor inventémonos historias de que se creó una "casta" de usuarios para mantener el portal actualizado y planteemos que vuelvan las cosas a como estaban antes mientras esta burocrática comunidad decide si le da la gana crear un nuevo grupo de usuarios que pueda modificar el portal, o si pueden editarlo gente con determinada cantidad de ediciones o permisos que da cero garantías de que no vaya a causar desastres y actos de sabotaje como lo vemos todos los días con elementos semiprotegidos. Si el filtro es inseguro y no se puede exponer aquí el por qué entonces este hilo no debió abrirse en un primer lugar; está la lista privada de correos de los bibliotecarios a la cual enviar los detalles, o el correo de quien creó el filtro, u otra ene cantidad de opciones. Estoy francamente harto de una comunidad que día tras día mina la paciencia y las ganas de colaborar de la gente; ni pican leña, ni prestan el hacha. — Lucho Problem? 21:33 19 ene 2022 (UTC)
Leoncastro: No hay ninguna pretensión elitista ni arbitraria con este filtro. Como ya ha apuntado Laura, tras varios intentos y en una situación algo precaria se consiguió que estas personas asumieran un compromiso diario de trabajo y coordinación, lo cual no es nada fácil, pero si más wikipedistas están dispuestos a lo mismo, siempre serán bienvenidos, aunque precisamente casos como el de los «sabías qué» también demuestran que «tarea de muchos, tarea de nadie» y tener un grupo del tamaño adecuado resulta práctico y eficiente. Y al igual que LuchoCR, no comparto que sea preferible que una tarea quede abandonada solo por cumplir estrictamente con las normas, dado que en última instancia podemos ignorarlas si va en beneficio de Wikipedia (aunque yo prefiero que en esos casos sean las normas las que se ajusten para acomodarse a la realidad), ni creo que añadir la burocracia de un nuevo permiso o incorporar a quienes tengan un cierto permiso pero no puedan comprometerse o coordinarse sea una buena solución. Por supuesto que las sugerencias son siempre bienvenidas (también) y por eso entre todos tratamos de atenderlas en lo posible; en este sentido, el problema del filtro que remitía a WP:LLAVE ya ha sido resuelto por -sasha-, a quien le damos las gracias (y me disculpo porque debí haber sido más cuidadoso cuando puse en marcha el filtro), y el problema que se intentaba corregir cuando saltó el filtro también ha quedado ya resuelto. Saludos, - José Emilio –jem– Tú dirás... 12:36 20 ene 2022 (UTC)

px[editar]

Asunto

Hola, anteriormente me he encontrado con este error, si no pones el tamaño de la imagen, la imagen cubre todo el artículo. En algunos casos son vandalismo. Expongo la idea:

  1. Filtro de edición: Se puede crear un filtro para evitar que el parámetro esté vacío o que los píxeles sean demasiado grandes.

Gracias

Usuario que lo solicita

Anibal Maysonet (discusión) 23:55 21 ene 2022 (UTC)

Respuesta

✓ Hecho, en parte. He creado el filtro 143, que impide que el tamaño de las imágenes se pueda aumentar excesivamente, aunque por el momento no se activará la opción de no permitir hasta asegurar que no haya falsos positivos. En cuanto a que sea obligatorio especificar un tamaño, eso no es posible ya que el tamaño original depende de cada imagen y en algunas es el adecuado. Sargento - A sus órdenes 11:25 22 ene 2022 (UTC)

Filtro de arte ascii[editar]

Asunto
(⌐■-■)🤙
Artículo Libre asociación (comunismo y anarquismo), creada por una IP

Detecté 3 caracteres gráficos, o bien, un emoticono que no fue detectado por el filtro. Véase Libre asociación (comunismo y anarquismo) (editar | discusión | historial | enlaces | vigilar | registros | proteger | borrar) antes de borrar.

Usuario que lo solicita

VR0: ニャー! Deja tu mensaje, ニャー! 03:10 8 mar 2022 (UTC)

Respuesta

✓ Hecho.--Trinitrotolueno (Boom) 04:19 9 mar 2022 (UTC)

"Sígueme en..."[editar]

Asunto

Este tipo de ediciones son comunes y constitutivas de SPAM. La expresión "Sígueme en..." debería estar en un filtro que impida la edición.

Usuario que lo solicita

Lucho Problem? 20:03 21 mar 2022 (UTC)

Respuesta

@LuchoCR: He reasignado el filtro 88 para el spam de redes sociales; he colocado las acciones etiquetar/advertir para comprobar si existen falsos positivos, y en caso de no haberlos se podrán impedir dichas ediciones. Saludos Ruy (discusión) 21:04 21 mar 2022 (UTC)

Enlaces a suscripciones de canales[editar]

Asunto

Independientemente de que posiblemente acabe en el TAB una "discrepancia" sobre los enlaces a Facebook, adelanto aquí un tema que posiblemente exceda el tema y requiera algún tipo de filtro: son ediciones como esta. Es todo lo que va detrás de "Recibe próximas encuestas con un CLIK". No sé si técnicamente es posible hacer esa distinción en enlaces o si para esto hace falta llevarlo antes al Café: de ser así siento molestar aquí. Gracias en todo caso por adelantado

@Kirchhoff: No entiendo muy bien la solicitud. Lo que hay tras el texto que dices son unos enlaces a Telegram, Whatsapp, Facebook y otra web. ¿Qué es lo que quieres que el filtro detecte? Disculpa también la demora en atender esto. -sasha- (discusión) 18:32 19 abr 2022 (UTC)
@-sasha-:, gracias por tu respuesta y no te preocupes por el tiempo: ni hay plazos ni corre prisa. Incluso no sé si se puede hacer porque supongo que es compleja la detección
Cambiando un poco los enlaces, "Recibe próximas encuestas con un CLIK Telegram https://t.me/FactoMetrixxx Whatsapp grupo https://chat.whatsapp.com/Cwxxx Lista Whatsapp https://wa.link/8yxxx" entiendo que es spam, pero como no va en la url sino en el título de la referencia no lo corta ningún filtro. Quizás no sea posible, o no sé quiera hacer el filtro para determinadas páginas (reconozco que no he buscado en el historial ni en el café si ya se ha tratado). Pero hoy mismo hice saltar un filtro al intentar enlazar un libro de Amazon, pero no hay filtro con la cadena https://wa.link . Como comentaba ¿mejor si llevo al Café que existan filtros para determinadas cadenas de texto que incluyan suscripciones a grupos de Telegram o Whatsapp? o ¿se pueden pedir directamente aquí?. Gracias de nuevo y si tarda o no se puede reitero que no es grave, me gustaría que existieran, pero hay tantas cosas en Wikipedia que me gustaría y no son "a mi gusto personal" ;) un cordial saludo Kirchhoff (discusión) 19:05 19 abr 2022 (UTC)
@Kirchhoff: Más que una cuestión de filtros, es de lista negra de spam (a no ser que solo se quiera limitar para algunos espacios de nombres). Sobre Telegram, no sé muy bien en qué quedó este hilo en el que veo que participaste, pero aún hay enlaces, así que yo no lo tocaría por ahora. En cuanto a los de Whatsapp, quizá sí se podrían añadir a un filtro porque veo que se han usado de forma legítima en el espacio Wikipedia ([1]), solo había uno en el espacio principal que acabo de retirar y tres o cuatro en el espacio de usuario, que he borrado. No veo que puedan tener encaje en los espacios de contenido. -sasha- (discusión) 20:23 19 abr 2022 (UTC)
Muchas gracias -sasha-. Sí, quizás hubiera sido mejor en filtro de spam: aunque la única que quedaba la he quitado y quizás no valga la pena para tan pocas que puede haber. Había pensado que esos filtros se hacian aquí, pero he comprobado que no son filtros como yo creía y me dejan hacer esto, insertando el enlace dentro del título de la referencia. Tendría que haberlo probado mejor antes.
En lo del chat.whatsapp.com y wa.link supongo que si empiezo a ver más lo pediré en antispam; y sigo con las mismas dudas, del hilo que enlazas, de si t.me está en la misma situación: en algún caso podría ser relevante aunque a la vista de los resultados que da quizás me equivoque y no valgan mucho ninguno. Resumiendo, que a veces me lio a escribir... siento haberlo dejado aquí que quizás no era el lugar ni hacía mucha falta; y muchas gracias por la atención. Un cordial saludo --Kirchhoff (discusión) 16:38 20 abr 2022 (UTC)
Usuario que lo solicita.

Kirchhoff (discusión) 21:11 31 oct 2021 (UTC)

Respuesta

Respondo por aquí... Yo creo que este sitio es más visible que la discusión de la lista negra, así que tampoco me parece un mal lugar, tienen relación en realidad. Estoy de acuerdo en que no hay mucho spam con esos enlaces, pero si empezara a verse más, podría insertarse en, por ejemplo, el filtro 88 sin problema ninguno y de esta forma podría solucionarse de paso el inconveniente de la lista negra que mencionas, ya que los filtros sí pueden detectar eso. Saludos. -sasha- (discusión) 22:45 20 abr 2022 (UTC)

Please fix filter 82[editar]

Asunto

Hello, and sorry for writing in English. I am writing here because abuse filter 82 is often reported on logstash as failing to run. The regex used by the filter is very expensive, and it causes the filter to stop working. This is happening roughly 2500 times per day. Even when the filter is able to finish, it probably slows down the edit (see data for all filters combined). I would ask you to please take a look and simplify the regex. Thank you!

Usuario que lo solicita

Daimona Eaytoy (discusión) 14:24 17 abr 2022 (UTC)

Comentarios

✓ Hecho. @Leoncastro: muchas gracias. -sasha- (discusión) 20:32 17 abr 2022 (UTC)

@Leoncastro y -sasha-: Thank you! I've checked logstash again, and unfortunately the filter is still failing. The last edit possibly made it even worse, since it broke 8000 times in the past 12 hours. As a quick performance test, you can use this demo on regex101, based on this edit. You can see that the regex backtracks a lot and it fails with message "catastrophic backtracking". Ideally, it should be able to complete on that short text in very few steps. --Daimona Eaytoy (discusión) 12:25 18 abr 2022 (UTC)
Revertido a la versión anterior. -sasha- (discusión) 12:36 18 abr 2022 (UTC)
@Daimona Eaytoy, the above regexp is the one you had recommended some time ago. According to your recommendation it was what worked best at that time. Now you say it does not works. Has changed something? Can you propose any other alternative? Maybe you know some similar filter on other projects. This filter checks and avoids the excesive repetitions like: example example example example example example example, where the example string may be any kind of sentence. -- Leoncastro (discusión) 16:46 18 abr 2022 (UTC)
@Leoncastro: Oh, I see, this is not the first time. Nothing has changed, so probably it's simply been slow/broken for all this time. Unfortunately, I don't think it's possible to optimize it further unless you also change the requirements. Searching all repetitions of any sequence of words inside a text is computationally hard and can be very slow. You can make it faster by limiting the length of the words or that of the sentence that is repeated. Currently, the filter searches for words 1 to 20 characters long and sentences 1 to 21 words long. You could, for instance, limit words to 10 characters and sentences to 8; or any combination of lengths that are as small as possible while still being useful. Other projects (e.g. itwiki, enwiki, frwiki) have a similar filter, but it only catches repetitions of words (of limited length). I'm not aware of other filters that search repetitions of sentences. If you would like to experiment with the lengths a bit, I can monitor the AbuseFilter dashboard on logstash and tell you how it's performing. --Daimona Eaytoy (discusión) 17:15 18 abr 2022 (UTC)
@Daimona Eaytoy: I've just lowered the requirements to 10 characters/word and 10 words/sentence. Please check whether performance is improved, thank you. -sasha- (discusión) 18:12 19 abr 2022 (UTC)
@-sasha-: Thank you. It may have gotten a little bit better, but it still breaks sometimes (500 times in the last 16 hours). This is an example of edit that made the filter fail while checking the regex for tables (see it on regex101). Another thing you could try is to change the order of the conditions, to check added_lines and removed_lines first, and then new_wikitext and old_wikitext; since the _lines variables are usually shorter the regex should work better there, and if they don't match, the filter wouldn't check new_ and old_wikitext. Also... I just noticed that lines 12 and 13 are wrong, the ! operator only applies to the rcount call, so they're equivalent to ( !rcount(...) ) > rcount(...). Instead, you need to add parenthesis surrounding the comparison, like !( rcount(...) > rcount(...) ). --Daimona Eaytoy (discusión) 11:30 20 abr 2022 (UTC)
@Daimona Eaytoy: Syntax corrected and order of conditions changed. It seems to be running way faster now, but I guess there could be edits where it still breaks. -sasha- (discusión) 11:44 20 abr 2022 (UTC)
@-sasha-: Thank you!! It seems to be running perfectly now, it never failed since your edit. Since 24 hours have passed, I'm going to say that you don't need to worry about its performance anymore. It's totally fine if it fails rarely. Thank you again, --Daimona Eaytoy (discusión) 10:57 21 abr 2022 (UTC)
Respuesta

✓ Hecho. @Daimona Eaytoy: Thank you very much for the follow-up. -sasha- (discusión) 12:19 21 abr 2022 (UTC)

Evitar crear de nuevo[editar]

Asunto

Saludo, me surgió una idea de que se puede crear un filtro que evite nuevamente la creación de un artículo borrado por parte de una ip y no autoconfirmado. Los artículo que no halla pasado tan tiempo de su borrado para así evitar falso positivo. Aquí dejo casos recientes, Adhemar Poma, A.TV. y un fin de artículos.

Usuario que lo solicita

Anibal Maysonet (discusión) 17:41 19 jul 2022 (UTC)

Respuesta

Estoy bastante seguro de que no hay forma de hacer un filtro que revise si una página fue borrada con anterioridad (ni siquiera si la página tiene logs previos). Si algún artículo es constantemente recreado por usuarios no autconfirmados lo más conveniente sería pedir una semiprotección. Saludos. --Trinitrotolueno (Boom) 20:58 19 jul 2022 (UTC)