Wikipedia:Mantenimiento/Revisión de errores de PatruBOT/Análisis

De Wikipedia, la enciclopedia libre

Muestra aleatoria[editar]

Reservas[editar]

Origen de los datos[editar]

Para poder realizar la estadística del porcentaje de aciertos de PatruBOT, se han extraído los datos desde su página de contribuciones, considerando solamente las ediciones en el espacio principal y filtrando desde el 10 de febrero al 27 de marzo de 2018 (respectivamente las fechas en que se anunció que había sido ajustado por última vez el bot, y cuando se anunció la parada del mismo), todo ellos de acuerdo con la petición de Ganímedes. Estas ediciones pueden consultarse manualmente desde los siguientes enlaces: [1], [2], [3], [4], [5], [6], [7], [8]. Como la muestra poblacional es de 39 111 elementos, se decide tomar una selección aleatoria. Para esa población, con un nivel de confianza del 95 % y un margen de error del 3 %, se necesita analizar una muestra de 1039 ediciones. Como la diferencia a la acotación de Mar del Sur es mínima, se toman los 1040 elementos que ella explicaba. Todos los datos, ordenados ascendentemente por fecha, fueron filtrados seleccionando aleatoriamente esa muestra de 1040 elementos. Adicionalmente, para evitar la escasez de la muestra en el posible caso del posterior borrado del articulo, o de la edición, o del resumen, se agrega un 10 % adicional (104 elementos) de reserva.

comentario Comentario Si no hay objeciones, voy a retirar la parte de "(dif · hist)" porque la página pesa muchísimo, cuesta enormemente cargar y en realidad no aporta información (el enlace al diff ya aparece en la primera parte, fecha y hora; y el enlace al artículo aparece después). --Saludos. Ganímedes 15:28 30 mar 2018 (UTC)[responder]
✓ Hecho. -- Leoncastro (discusión) 17:30 30 mar 2018 (UTC)[responder]
Pero qué excelentísimo trabajo y cuánta eficiencia!!! Muchas gracias :) --Saludos. Ganímedes 17:48 30 mar 2018 (UTC)[responder]

Por motivos de claridad del registro he retirado "a la última edición de PatruBOT". Se mantiene el comentario cuando la edición previa ha sido de algún otro usuario. Se añade comentario en la sección que viene debajo. --Saludos. Ganímedes 12:48 31 mar 2018 (UTC)[responder]

Leoncastro: por asuntos meramente estadísticos, ¿existe la posibilidad de obtener en forma automatizada, a partir de esta lista, si PatruBOT ha revertido más de una vez en el mismo artículo? Y ¿si ha revertido al mismo usuario (en el mismo u otro artículo? --Saludos. Ganímedes 12:49 1 abr 2018 (UTC)[responder]
Ganímedes, para la primera pregunta, es evidente que el bot “re-revierte” (o como se escriba) al menos el 44 % de las veces, que puede ser incluso más, si hubo ediciones intermedias de otro usuario (por ejemplo otro reversor deshaciendo otras ediciones antes que el bot). Pero el primer problema que veo a eso es: ¿hasta cuando se debe mirar hacia atrás para ver las reversiones del bot? Si escribo «caca» en una página y el bot me revierte, y repetimos el ciclo una vez al mes, ¿eso cuenta? Y luego, ¿cual es la utilidad de esa información? El bot no “persigue” a usuarios, en tanto que el análisis de sus acciones se basa únicamente en la misma edición a analizar, independientemente de las acciones previas (es por cierto uno de los motivos de falsos positivos más graves reportado: usuario que hace varias buenas ediciones, y una de ellas —la última— es detectada como vandalismo por algún motivo y se revierte esa edición con todo el trabajo anterior).
Para la segunda pregunta, la misma última duda “persecutoria” que el caso anterior. No obstante, al margen de mis dudas al respecto, y aunque quisiera saber también esa información, lamento decir que no veo cómo poder obtenerla fácilmente de modo automático (téngase en cuenta que el listado realmente lo hice casi a mano, extrayendo la información directamente de la página de contribuciones del bot). -- Leoncastro (discusión) 16:37 1 abr 2018 (UTC)[responder]
No te entiendo. Lo diré de otra forma: me gustaría saber si es posible ver en esta lista si hay algún artículo que aparezca en más de una ocasión, y lo mismo con algún usuario. Para obtener un informe estadístico más completo, para no dejar nada librado al azar, y por simple curiosidad. No he dicho ni implicado que el bot persiga a nadie (al menos desde que cambió el código y compensa las ediciones). Pero tal vez en un análisis posterior del vandalismo específico se puedan examinar esas ediciones más en profundidad. Pero si no se puede... no se puede. No pasa nada. --Saludos. Ganímedes 16:52 1 abr 2018 (UTC)[responder]
Lo de la persecución lo digo yo, pues es la única conclusión que puedo llegar a ver con esa forma de analizar los datos. Y la misma insistencia que ofrece el usuario cometiendo el vandalismo o el falso positivo una y otra vez, se repite desde el bot revirtiendo también una y otra vez. Incluso yo no diría que suceda con «algún artículo» sino con muchos; incluso con los usuarios. Es demasiado habitual, aunque no sea capaz de ver cómo generar los datos que pides. Tan habitual, que incluso se pueden ver algunos ejemplos a simple vista dentro de la muestra, y eso que es aleatoria, bastante dispersa y que solo alcanzan a ser un 2.66 % de las ediciones totales —es decir, que incluso sin ver el 97.34 % de ediciones, ya ves esas repeticiones de artículos y usuarios—. Por ejemplo, sin salir de las primeras muestras, la 2 y 3 —mismo usuario— o la 41 y 42 —mismo artículo y usuario—. -- Leoncastro (discusión) 18:29 1 abr 2018 (UTC)[responder]
Perdón por la insistencia: ¿se podría determinar cuántas ediciones son revertidas a IP y cuántas a usuarios registrados? --Saludos. Ganímedes 15:33 1 abr 2018 (UTC)[responder]
Finalmente, las estadísticas globales de reversiones a IP o a registrados es de: 92.97 % anónimas (36 362 reversiones), 7.02 % registrados (2747 reversiones) y 0.01 % ocultas (2 reversiones con el nombre de usuario y el resumen de edición ocultado: 1 y 2). -- Leoncastro (discusión) 16:37 1 abr 2018 (UTC)[responder]
Gracias :) --Saludos. Ganímedes 16:54 1 abr 2018 (UTC)[responder]

Estadísticas globales[editar]

Reversiones según el tipo de usuario
Tipo Reversiones Porcentaje
Usuarios anónimos 36 362 92.97 %
Usuarios registrados 2747 7.02 %
Ediciones borradas 2 0.01 %
Reversiones por artículos
Rango Artículos Reversiones
Solamente 1 10 480 10 480
Entre 2 y 10 7367 23 917
Entre 11 y 20 252 3487
Más de 20 41 1227
Total de artículos 18 140 39 111
Lista de artículos más revertidos
Artículo Reversiones
Chōdenshi Bioman 69
BTS (grupo musical) 62
Fortnite 51
Shakira 48
Canis lupus familiaris 39
Atletismo 38
Leonardo da Vinci 38
Cataluña 37
Mahatma Gandhi 35
El secreto de Puente Viejo 33
Red de computadoras 33
Fuerzas Armadas de Venezuela 32
Gabriel García Márquez 31
José Pedro Varela 29
La joven de la perla 29
Petro (criptomoneda) 29
Acacias 38 28
Acoso escolar 28
Aeropuerto de La Palma 28
Comunicación técnica 27
Teléfono 27
Juan Pablo Duarte 26
Negro (persona) 26
Historia de la música 25
John Lennon 25
Kuchisake-onna 25
Nicolás Copérnico 24
Baloncesto 23
Computadora 23
Frida Kahlo 23
José Kaor Dokú 23
Black Panther (película) 22
Descubrimiento de América 22
Martín Vizcarra 22
Aśoka 21
Aviación Militar Bolivariana 21
Educación física 21
John Cena 21
Pantalla azul de la muerte 21
Voleibol 21
YouTube 21
Reversiones por usuarios
Rango Usuarios Reversiones
Solamente 1 12 771 12 771
Entre 2 y 10 7446 22 780
Entre 11 y 20 181 2446
Más de 20 35 1112
Total de artículos 20 433 39 109
Lista de usuarios más revertidos
Artículo Reversiones
184.147.30.217 83
200.82.215.223 62
190.39.64.22 59
187.202.224.214 48
190.47.180.158 46
200.120.9.63 42
190.73.112.138 39
212.225.131.220 38
64.107.3.126 37
77.227.134.37 32
187.232.155.49 32
187.149.145.53 31
212.0.101.205 30
161.18.159.136 29
77.226.75.104 29
83.42.99.218 27
190.39.116.39 27
181.75.177.60 26
181.161.115.218 26
181.161.175.143 26
212.170.50.178 26
131.108.80.4 25
139.47.20.190 24
161.10.197.145 24
195.55.247.172 24
Marvin Hideki Doku 23
187.204.84.7 23
190.255.131.184 23
Sridrod 22
2.6.115.72 22
99.135.194.79 22
201.240.21.188 22
195.77.84.247 21
190.102.56.107 21
2001:41D0:303:13E2:0:0:0:1 21

-- Leoncastro (discusión) 23:46 1 abr 2018 (UTC)[responder]

Leoncastro: Naaaaaaa, ¡qué monstruooooo! Muchas gracias :) --Saludos. Ganímedes 23:49 1 abr 2018 (UTC)[responder]

Análisis de los datos[editar]

A partir de la coletilla "Revertidos los cambios de X a la última edición de PatruBOT" se ha constatado que en el 44% de las ocasiones, la edición previa a la que vuelve el bot ha sido realizada por él mismo.

Rango Reversiones a una edición previa del bot
100 45
200 36
300 45
400 42
500 38
600 43
700 45
800 49
900 40
1000 56
Reserva 50

--Saludos. Ganímedes 12:59 31 mar 2018 (UTC)[responder]

Conclusiones[editar]

(A rellenar con los resultados del análisis)