Wikiproyecto:Bots

De Wikipedia, la enciclopedia libre
(Redirigido desde «PR:BOTS»)
Saltar a: navegación, búsqueda


Wikiproyecto:Bots
Wikiproyecto Bots.svg
Datos
Objetivo Promover y facilitar la creación, el correcto desarrollo y la organización de cuentas automatizadas para simplificar las tareas de edición en Wikipedia en español.
Participantes
Véase «Wikiproyecto:Bots/participantes»
Discusión_


Inicio[editar]

Me parece muy buena iniciativa iniciar el proyecto. Saludos Hprmedina (¿cri cri?) 17:26 30 abr 2012 (UTC)

A mi también me parece muy buena iniciativa. Ya me he apuntado en participantes y cuando tenga un rato compartiré algún script en el repositorio. --Un Saludo Crystal 128 konsole.svg Kizar // Contactar 11:05 12 may 2012 (UTC)
Cada vez somos más, parece que va viento en popa. Si sigue como parece que va, va a ser un gran avance. Un saludo. —— ♠♠♠ Mr.Ajedrez Chess tile bl.svg Comenta la jugada ♠♠♠ —— 17:55 12 may 2012 (UTC)
Que así sea, Mr.Ajedrez. Gracias a todos los que han decidido unirse a este wikiproyecto; confío en que a través de él nos podamos coordinar, y además desarrollar, de forma colectiva, los códigos de algunas de las tareas con bot más comunes. --invadinado (Cuéntame) 21:26 12 may 2012 (UTC)
De momento soy el más ignorante del grupo, pero soy buen estudiante. Ni siquiera ejecuté nunca en la wiki Pywikipedia debido a un error que nunca supe solventar. Como jamás necesité más de lo que tengo a disposición, no lo volví a intentar. Espero poder dar algo, pero estoy seguro que será mucho más lo que tomaré de ustedes. Pongo a disposición mi buena voluntad. --Metrónomo-Goldwyn-Mayer Lion icon.png 22:48 12 may 2012 (UTC)
Me he apuntado al proyecto ya que tanto que le hice propaganda al tema que era contradictorio no hacerlo. Cualquier cosa, pueden preguntar con total libertad y espero subir algunas regex del proyecto Check Wikipedia en los próximos dias. Quizás un git para algunas cosas más colaborativas, pero en primera instancia, ya tenemos el espacio. Saludos Superzerocool (el buzón de msg) 15:47 14 may 2012 (UTC)

Aporto también mis reflexiones iniciales. Creo que en este terreno hay mucho y bueno que se puede avanzar desde el esfuerzo coordinado de todos, y trataré de aportar lo que pueda en ese sentido dentro de lo limitado de mi tiempo. En la cuestión del repositorio de códigos tendré trabajo por la forma particular en que tengo organizado mi código, pero en algún momento iré preparando alguna solución al respecto. Sí hay algunas cosas como las que ahora planteo que se pueden ir abordando a corto plazo: la tabla de tareas periódicas, donde podamos centralizar qué bot está actualizando/manteniendo qué página, cada cuánto, con qué código y qué requisitos; y el uso del canal IRC (#wikipedia-es-tecnica), para el cual me gustaría como primera idea proponer una «hora de encuentro» cada semana que nos venga más o menos bien a todos y que nos pueda servir como «momento de referencia» para irnos comentando novedades, dudas o ideas. Yo me intentaría adaptar a lo que veamos entre todos. ¿Qué les parece? - José Emilio –jem– Tú dirás... 19:44 16 may 2012 (UTC)

Con relación al orden del código, diré que no tengo orden :B. Creo que tendré un ciclo de refactoring para eliminar duplicados y otras yerbas. Acerca de una reunión en IRC, cuenten conmigo si me avisan con algo de anticipación (basta con 1 ó 2 días). Saludos Superzerocool (el buzón de msg) 13:54 24 may 2012 (UTC)

Rankings, tablas, etc.[editar]

Hola, estaba revisando el ranking de la ATP. Hace algún tiempo lo intenté para el tema de los hombres y el código lo tengo, pero no lo he publicado ni nada. ¿Ven viable que automaticemos algunas cosas del mismo estilo para evitar la edición manual de listados enormes?. Saludos Superzerocool (el buzón de msg) 16:36 6 jun 2012 (UTC)

Yo lo veo positivo, todo lo que se pueda automatizar fácilmente mejor que esté actualizado. No le veo ningún posible punto en contra a ese uso de bots para actualizar datos. Un saludo. —— ♠♠♠ Mr.Ajedrez Chess tile bl.svg Comenta la jugada ♠♠♠ —— 19:10 9 jun 2012 (UTC)
Sin duda alguna es conveniente e incluso necesaria la automatización en esas y otras cuestiones similares. No obstante, creo que ya todos aquí conocen Wikidata, proyecto que por lo que sabemos hasta ahora podría resolvernos tanto la generación automática de listados como la actualización automática de las fichas. Yo particularmente opino (y pongo en práctica) que antes de programar cualquier nuevo código debemos ya pensar en si puede quedar obsoleto al llegar Wikidata —como parece que es el caso aquí—, y si es así irnos ocupando de otras cosas primero. Pero ustedes verán. - José Emilio –jem– Tú dirás... 13:06 11 jun 2012 (UTC)
Sí, Wikidata ya está en camino, pero su fecha de implementación será en marzo de 2013 (aprox). ¿Tienes alguna otra tarea que podamos pensar jem?... por ahora no se me ocurre nada más, excepto de bots de mantenimiento, pero esos ya está ultra hiper probados. Saludos Superzerocool (el buzón de msg) 13:34 11 jun 2012 (UTC)
Ehmmm... entiendo que me preguntas si puedo proponer otras tareas bóticas que previsiblemente se mantengan sin (apenas) cambios al llegar Wikidata... pues desde luego que sí, muchas. Sin pensarlo demasiado, tendríamos:
  • Estadísticas internas de todo tipo. En particular, todas las que BOTijo abandonó en su día, más la que hacía Botones, y otras estadísticas similares que se pueden implementar desde cero. Además, sería muy interesante crear un nuevo sistema que sustituya con ventajas al de Contenido por wikiproyecto, cuyo consumo de recursos lo hacía insostenible.
  • Mantenimiento de los AB y AD: Automatizar el proceso de altas y bajas de los mismos, los contadores y la actualización de sus respectivos índices, que generalmente tienen bastante desfase.
  • Organizar todo lo relativo a las correcciones ortográficas: comparar la labor de todos los bots existentes y unificar o sincronizar de alguna manera las listas de errores (más la del accesorio del corrector ortográfico).
  • En el Wikiproyecto:Check Wikipedia, programar las tareas que lo necesiten y coordinar la cobertura de todas las tareas por al menos un bot.
  • Gestionar las fichas con un bot que anote cuántas tenemos, cuántas de ellas están basadas en Ficha, cuántas tienen parámetros análogos pero escritos con ligeras variaciones, etc.
  • Reorganización de los ¿Sabías que...: Se están revisando todos y tengo pensada la idea de cómo organizarlos, pero aún no he empezado a teclear código. Es una labor que puede asumir cualquier otro interesado.
Podemos ir hablando de esas y otras muchas posibilidades si quieren. Mi lista con las tareas pendientes acumuladas durante años es casi inagotable y una fuente de sorpresas... - José Emilio –jem– Tú dirás... 18:52 11 jun 2012 (UTC)
Ya que sale el tema, informo de que se está elaborando una tabla de tareas, donde la intención es listar todas las tareas que actualmente realizan los bots, y también aquellas requeridas, de las que nadie se está encargando por ahora. Lo que no está decidido es la identificación de cada una de ellas. Por ahora, he determinado esta identificación de manera arbitraria siguiendo una numeración creciente, pero esto solo es provisional; habrá que pensar una mejor manera de organizar este punto. Todo el que quiera está invitado a añadir algunas tareas más para completar la lista, y así facilitar la coordinación entre controladores. --invadinado (Cuéntame) 19:19 11 jun 2012 (UTC)
Hablando de la lista de tareas y Wikidata. Lo mejor que tengo disponible es un sistema (recalco lo de sistema, el bot es sí es extremadamente sencillo, toma la información desde páginas wiki, allí se programaría la tarea) para trabajar con plantillas, si se van a estandarizar las fichas, luego del debido análisis, lo que puedo ofrecer va a ser de utilidad. Hice ingeniería inversa con Grillitus, así que borra y reescribe la plantilla. Eso es muy útil porque reconoce los parámetros sin importar cómo los hayan escrito y luego deja una ficha presentable. Hace más que solo eso, pero todavía no consigo que tome información de un artículo para incluirlo en la ficha. Cómo no estuve activo este último mes no lo continué, pero cuando esté lo suficientemente listo lo presentaré para que cualquiera pueda usarlo sin necesidad de solicitar la ayuda de un tercero. De hecho es tan simple que se podrían modificar artículos individuales sin necesidad de usar un bot, el bot sería para cambios masivos. Espero tener también un traductor de plantillas, con preferencia por las de referencias, al alcance del usuario promedio. Si cualquiera puede traducirlas por sí mismo, habrá menos trabajo para los boteros. También reviso periodicamente Categoría:Wikipedia:Páginas con enlaces rotos a archivos para darle una mano a CommonsDelinker. El número de artículos viene bajando desde 11 000, pero aparentemente no soy el único que lo hace. Lo menciono porque aparece en la lista de tareas. Imagino que una vez liquidada la categoría con CommonsDelinker alcanzará. Otro ámbito de mi interés es Check Wikipedia, algunas de esas tareas las podría realizar con regularidad, pero creo que lo primero es reinstalar pywikipedia y darle más prioridad a python. Cuando tenga la luz verde pido la autorización para usarlo, que mi autorización actual no me lo permitiría. Y ya que estoy lo digo, debo ser el único que traslada categorías sin usar pywikipedia, pero funcionar funciona y es práctico. --Metrónomo-Goldwyn-Mayer Lion icon.png 09:58 16 jun 2012 (UTC)

Enlaces externos[editar]

Mirando Categoría:Wikipedia:Artículos con enlaces externos rotos y analizando el número de enlaces se observa que hay unos 18700 enlaces externos rotos. A partir de una lista de estos enlaces se podría analizar si existe una copia en Internet Archive y realizar un reemplazo para estos. En cuanto a los que no aparecen, es mucho más complejo retirarlos y solo sería posible realizar la retirada parcialmente y de forma asistida. ¿Es posible y factible esta propuesta?. UA31 (discusión) 22:46 21 jun 2012 (UTC)

Puedo hacerlo pero no se si es buena idea poner 18K enlaces hacia el archivo. Si hay consenso lo hago. --Un Saludo Crystal 128 konsole.svg Kizar // Contactar 09:49 22 jun 2012 (UTC)

Redirecciones idénticas, salvo por el uso de mayúsculas/minúsculas[editar]

Hola!

Aprovechando que hace unos días se publicó la versión xml-dump de esWP al día 17/08, me intrigó las redirecciones en el namespace 0.

Encontré que habría unos 43.803 conjuntos de redirecciones idénticas salvo por el uso de mayúsculas/minúsculas, teniendo en cuenta signos de puntuación y acentos, dado que eso representan "otro caso" mas especial. La gran mayoría de los cosas, los conjuntos se componen de 2 redirecciones, por ejemplo: Título y título, pero para ser mas exacto:

Conjunto de N redirecciones Cantidad de casos
12 1
9 1
8 2
6 6
5 10
4 96
3 1.254
2 42.433

Si no tengo mal entendido, dicho grupo de redirecciones son innecesarias, y adicionalmente el software mediawiki no se ve afectado por la sensibilidad al caso. Si estoy equivocado indíquenmelo ;).

Ahora consulto: ¿no habría una forma de...

  1. Evitar que se generen nuevas redirecciones por el estilo?
  2. Facilitar su eliminación?

Comprendo que los títulos mas adecuados seria mejor que sean elegidos por humanos jeje, pero tal vez haya alguna alternativa ;).

Tengo a mano el listado de redirecciones, y podría reportarlo en algún formato si desean.

Saludos Flag of Argentina.svg Gonzalo Costa (Gcosta87) (discusión) 00:22 28 ago 2012 (UTC)

Reto[editar]

A ver, os reto a arreglar uno o dos scripts de Emijrp a la semana. Proponedme los que penséis que urgen más, a ver si dejais de tener tanta sopa de letras. Coet (discusión) 14:06 2 mar 2013 (UTC)

Creo que de los que mejor vendría tener arreglados son Wikiproyecto:Bots/Repositorio/artículos-redirecciones.py y Wikiproyecto:Bots/Repositorio/redirecciones-redirecciones.py. Un saludo. —— ♠♠♠ Mr.Ajedrez Chess tile bl.svg Comenta la jugada ♠♠♠ —— 21:18 2 mar 2013 (UTC)
Hecho Hecho, ¿los próximos para la semana que viene? Coet (discusión) 15:01 4 mar 2013 (UTC)
Dejo registro de chat para una localización más rápida.
[16:12:31] <MrAjedrez> coet|cawiki: Supongo que no podrás hacer que [[Wikiproyecto:Bots/Repositorio/contenido-pr.py]]
           funcione sin consumir tantísimos recursos, ¿no?
[16:18:10] <MrAjedrez> Si no puedes, tienes [[Wikiproyecto:Bots/Repositorio/protección-plantillas.py]] y
           [[Wikiproyecto:Bots/Repositorio/categorías-redundantes.py]] a punto para el taller :)
Coet (discusión) 10:28 6 mar 2013 (UTC)

Convenciones[editar]

Creo que deberíamos establecer algunas convenciones para realizar scripts de una manera más homogénea. Lo primero y principal por ejemplo es que yo sigo las convenciones generales establecidas por la comunidad de programadores Python. Desde la forma normativa para el nombre de varaible y funciones (camelcase reservado para las clases, para lo demás separar con guión bajo) hasta seguir las normas básicas de la filosofía Python. Tampoco es que hay que ser riguroso pero sí que me gusta observarlas para que en un futuro cualquier otro programador lo tenga más fácil a la hora de comprender el código.

Pero bueno, venía a comentar que creo que deberíamos tratar el tema de si debemos tener un directorio especial para los archivos temporales, si los código están pensados únicamente para usar en el toolserver o si debemos intentar tener alternativas para poder ejecutarlos desde otros puntos (que no tendrán acceso a las bases de datos de SQL, pero sí al API), etc.

Coet (discusión) 18:58 7 mar 2013 (UTC)

También me refiero a utilizar ciertas palabras claves que coincidan para todos los scripts, sobretodo para la línea de órdenes. Por ejemplo en estos escripts es necesario añadir --edit o -w para que el bot edite, quizá sea superfluo o excesivo, aunque a mí me es util para que elbot únicamente me muestr los resultados sin editar.
Coet (discusión) 16:54 8 mar 2013 (UTC)
Pensaba que la comunidad de programadores estaría más activa. Coet (discusión) 12:15 12 mar 2013 (UTC)
Pues no, por ahora todos los recursos se usan en Wikidata y en ideas de la comunidad, y no reinventando la rueda en base de los scripts de Emijrp. Superzerocool (el buzón de msg) 23:19 12 mar 2013 (UTC)
Bueno estas son algunas de mis propuestas:
  • Por defecto se deberá tener una carpeta para los archivos temporales ubicada en el directorio principal y llamada temp.
  • Se priorizará el método del toolserver, sobre todo cuando se deba realizar una consulta SQL.
Se usarán las siguientes opciones:
  • --edit o -E para editar, en principio debería ser obligatorio
  • --quiet o -Q no muestra la información adicional.
  • --test o -T para el modo de pruebas. Anula --edit y --quiet. Impide editar y fuerza la visualización de información adicional durante el desarrolo del programa.
  • --cache o -C usa los ficheros disponibles en el directorio temporal.
  • --remove o -R elimina los ficheros temporales utilizados al acabar el programa.
  • --async o -A edita mediante el método asincronizado.
  • --api o -a usar consultas API.
  • --pgen o -g usar el pagegenerator del pywikipediabot.
  • --path o -H ruta de archivos temporales, en caso de querer especificar una ruta diferente.
Los parámetros más comunes que se podrían estandarizar son:
  • --begin o -b página de inicio
  • --end o -e página de finalización
  • --start o -s número item de inicio
  • --stop o -S número item de finalización
  • --limit o -l número máximo de ítems a revisar
  • --ns o -n namespace.
  • --page o -p única página en la que se quiera realizar alguna acción
  • --pages o -P lista de páginas en las que realizar alguna acción
Continuará... Coet (discusión) 17:47 16 mar 2013 (UTC)

Reuniones IRC sobre Wikidata[editar]

Hola a todos. Para empezar a comentar y estudiar diversos temas relacionados con la implantación de Wikidata en Wikipedia en español, incluyendo la situación y el trabajo de los bots aquí y en Wikidata, la inserción de etiquetas y descripciones en Wikidata, la forma de organizar fichas y leer datos al implantarse la fase 2, etc., hemos convocado una primera reunión en el canal #wikipedia-es-tecnica entrar este jueves 4 de abril a las 19:00 h UTC. En principio se habilitará la consulta posterior del log y se planteará la realización de posteriores reuniones consensuando horarios, quizá sobre temas más específicos. Por supuesto, cualquier conclusión o propuesta cuya formalización o generalización pensemos que puede ser interesante para toda la comunidad será trasladada y planteada en el Café, aquí y/o en otras páginas que correspondan. Si alguien interesado no pudiera estar en ese horario, le invitamos a pasar por el canal en cualquier momento usando el enlace suministrado para intercambiar impresiones y estudiar la forma de coordinarnos en lo sucesivo. Les esperamos. - José Emilio –jem– Tú dirás... 11:35 31 mar 2013 (UTC)

Migración de Pywikipedia a Git[editar]

Hola. Creo que es oportuno recordar aquí que quienes usen Pywikipedia en sus bots deben empezar a actualizar su código mediante Git en vez de SVN, como nos han indicado en las Tech News que se publican en el Café y nos detallan aquí. Yo poco más puedo aportar al respecto porque no uso Pywikipedia, pero confío en que el proceso no suponga problemas. Saludos, - José Emilio –jem– Tú dirás... 16:41 1 ago 2013 (UTC)


Participantes_
Usuario Bots Pywikipedia Batch C# C++ PHP Python Java AWB WikiCleaner Ayuda IRC
-jem- (disc. · contr. · bloq.) JembotPatruBOT
Coet (disc. · contr. · bloq.) TronaBot
Hprmedina (disc. · contr. · bloq.) Grillitus
Invadinado (disc. · contr. · bloq.) InvadibotDestruBOT
Kizar (disc. · contr. · bloq.) KLBotKLBot2
Miguillen (disc. · contr. · bloq.) Miguillen-bot
Mr.Ajedrez (disc. · contr. · bloq.) ChessBOT
Superzerocool (disc. · contr. · bloq.) BOT-Superzerocool
Er Komandante (disc. · contr. · bloq.) Botones
Miguel2706 (disc. · contr. · bloq.) inteliBOTYokBOT


Repositorio_
Bots/Repositorio/IDDC.py Bots/Repositorio/RCAD.py Bots/Repositorio/artículos-populares.py
Bots/Repositorio/artículos-redirecciones.py Bots/Repositorio/categorías-redundantes.py Bots/Repositorio/commonsdates.py
Bots/Repositorio/contenido-pr.py Bots/Repositorio/crearCAB.py Bots/Repositorio/errores-AVBOT.py
Bots/Repositorio/importador-noticias.py Bots/Repositorio/interwikiscommons.py Bots/Repositorio/mejora-AVBOT.py
Bots/Repositorio/nos faltan.py Bots/Repositorio/ortog.sh Bots/Repositorio/plantilla-toolserver.py
Bots/Repositorio/progreso-1911.py Bots/Repositorio/progreso-encarta.py Bots/Repositorio/progreso-lemario.py
Bots/Repositorio/protección-plantillas.py Bots/Repositorio/páginas-viejas.py Bots/Repositorio/ranking-creaciones.py
Bots/Repositorio/ranking-pr.py Bots/Repositorio/ranking-visitas.py Bots/Repositorio/redirecciones-redirecciones.py
Bots/Repositorio/tabla-mantenimiento.py Bots/Repositorio/unifica-años.py Bots/Repositorio/usuarios-activos.py