Usuario:CEM-bot

De Wikipedia, la enciclopedia libre
Saltar a: navegación, búsqueda
Fairytale apply.svg Este es un bot, que ha sido autorizado como tal. (verificar)


Bot para la corrección de errores menores detectados en vaciados de Wikipedia. Corre bajo la supervisión de Bot-icario.

Información sobre los cambios que actualmente realiza el bot en Twitter, #CEMBot.

Cambios triviales[editar]

En marzo de 2010 CEM-bot realizó una serie de cambios triviales con el fin de recuperar de los dumps de Wikipedia páginas que se mostraban con un contenido erróneo:

Desde 2009 se presenta un problema con las copias (dumps) de Wikipedia en castellano, explicado en el bug 18694 de Mediawiki. Actualmente CEM-bot trabaja revisando artículos y enlaces afectados por ese problema, por lo que en algunos casos realiza cambios triviales, o prácticamente inútiles, en páginas y redirecciones.
Algunos ejemplos:
  • Hasta el mes pasado las copias de Wikipedia mostraban para el artículo Golajab el contenido del artículo Museo de Arte de Filadelfia. En las últimas copias su contenido es el correcto. CEM-bot hizo correcciones ortográficas sobre los artículos afectados y eso fue suficiente para corregir el problema.
  • En una segunda etapa, CEM-bot trabajó sobre los artículos afectados por este problema en los que no se encontraron correcciones a realizar; uno de ellos fue Bajo el bosque lácteo. En las copias del último año aparece con el contenido de Pleomórfico, una redirección hacia Pleomorfismo. Luego del cambio cosmético su contenido es el correcto.
  • Giges (desambiguación) no tenía cambios triviales a realizar, por lo que en una próxima copia seguirá con el contenido que ha mostrado el último año, es decir, el de Johann Michael Bach.
En la etapa final se están realizando cambios triviales en los artículos que no necesitaron cambios de otro tipo. El más sencillo que se encontró fue el introducir una línea en blanco al principio de las páginas afectadas.
  • Playa de Torrecarbonera es otro artículo cuyo contenido era incorrecto en los dumps (mostraba el contenido de una categoría). El bot incluyó una línea en blanco al principio del artículo que luego de una edición desapareció. Ya modificado, en el próximo dump debería mostrarse su contenido correcto.


Nuevas correcciones[editar]

Boticario cosechando errores a través de Wikipedia. (Imagen propuesta por Gustrónico).
  • Cromlech debería sutituirse por crómlech, de hecho es el término correcto segun la RAE, ya que cromlech es el nombre en bretón.
  • "lapso de tiempo" es una redundancia, debería reemplazarse por "lapso" o "período".
  • Palabras con "ń" en lugar de "ñ" como "ańos" (no confundir con correctos usos, del alfabeto polaco, etc.).
  • Substituir "cojer" por "coger" y hacer lo mismo para todas sus formas verbales (sobre todo las del presente).
  • Protejer => proteger.
  • "atencion" por "atención" esta palabra siempre lleva tilde.
  • "fué" por "fue" actualmente, tanto para el verbo ir y para el verbo ser se escribe igual, sin tilde, esto lo pueden comprobar en la página de la RAE al conjugar ambos verbos.
  • "Normandia" debería ser remplazado por "Normandía".
  • Substituir "single" por "sencillo" ya que la primera es en inglés y la segunda en español.
  • Hay muchas apariciones de "hechar" y de sus "formas verbales" (a pesar de no ser un verbo) derivadas: hechar, hechado/a/s. Todas son sin h (se refiere al verbo "echar").

Correcciones que realiza[editar]

La base inicial de patrones de corrección fue creada por Yrithinnd para su bot y está listada aquí.

Detalles[editar]

  • En septiembre de 2014, el bot incluye aproximadamente 22.000 patrones de corrección. Se puede ver un ejemplo (casi exagerado) de lo que hace aquí donde arregló más de 400 detallitos.
  • Consta de un cosechador de errores y de un corrector basado en las herramientas de pywikipedia.
  • El cosechador es desarrollado por Ascánder, está escrito en Python y trabaja sobre respaldos de la base de datos de Wikipedia publicados aproximadamente cada 20 días.
  • El cosechador y el bot corren bajo Ubuntu-linux, en lugar del protector de pantalla en la máquina de Ascánder.
  • Las correcciones son revisadas una por una por Boticario. Sin embargo, algunas correcciones inapropiadas se escapan de vez en cuando.
  • Favor remitir los comentarios aquí.

En cada palabra o grupo de palabras se resalta el punto en donde típicamente se encuentra el error y en la siguiente columna se listan los errores más usuales.

 : Búsqueda con mayúsculas y minúsculas tomada literalmente.

Palabra Error Palabra Error
autonom í a i abri é ndose(la, le, lo, las, les, los, ) e
absorci ó n o ac á a
á cid[ao]s? a Á cid[ao]s? A
act ú a[ns]? u acu á tic(o, a, os, as, amente) a
adem á s a administraci ó n o
a é re[ao]s? e aeron á utic[ao]s? a
agrade z c[ao][ns]? s agr í colas? i
á lamos? a Á lamos? A
albedr í o i álbum (es, ) (albun, álbun, album)
Álbum (es, ) (Albun, Álbun, Album) alcald í as? i
alcoh ó lic[ao]s? o alem á n a
alg ú n u all í i
almac é n e almac e nes é
á mbar a Á mbar A
ambientaci ó n o á mbitos? a
Á mbitos? A Amé rica (ame, Ame, amé)†
ampliaci ó n o anecd ó tic[ao]s? o
anfitri ó n o an ó nim(o, a, os, as, amente) o
antig ü edad(es)? u añadi é ndoles? e
aparecer á a aparici ó n o
aplicaci ó n o aqu í i
á rbol(es, ) a Á rbol(es, ) A
á reas? a Á reas? A
á rid[ao]s? a Á rid[ao]s? A
armon í as? i arm ó nic(o, a, os, as, amente) o
art í culos? i artiller í a i
art í sitic(o, a, os, as, amente) i as í i
asociaci ó n o asumi ó o
atac a ndo á atl á ntic[ao]s? a
atmosf é ric(o, a, os, as, amente) e á tomos? a
Á tomos? A atra í d[ao]s? i
atr á s a autom á tic(o, a, os, as, amente) a
automatizaci ó n o autom ó vil(es)? o
az ú car u balc ó n o
bal ompié (onpie, ónpie, onpié, ompie, ómpie) bal ó n o
bamb ú (es, ) u b á rbar(o, a, os, as, amente) a
bas á ndo(se, me) a b á sic(o, a, os, as, amente) a
bast ó n o bater í as? i
b éis bol e(si, is) b í blic(o, a, os, as, amente) i
bibliograf í a i biolog í as? i
biol ó gic(o, a, os, as, amente) o bol í var(es, ) i
bot á nic[ao]s? a brit á nic[ao]s? a
b ú squedas? u caballer í as? i
ca cerí a [zc]eri cad á ver a
cad a veres á diz ca
ca í d[ao]s i calc á re[ao]s? a
c á lid[ao]s? a c á maras? a
cami ó n o canci ó n o
c á nticos? a cañ ó n o
c á psulas? a car á cter a
caracter í stic(o, a, os, as, amente) i caser í os? i
categor í as? i cat ó lic[ao]s? o
celebraci ó n o c é lulas? e
cer á micas? a cercan í as? i
cient í fic(o, a, os, as, amente) i cil í ndric[ao]s? i
cintur ó n o cirug í as? i
c í vic(o, a, os, as, amente) i civilizaci ó n o
cl á sic(o, a, os, as, amente) a clasificaci ó n o
cl á usulas? a cl í max i
codificaci ó ns? o c ó digos? o
combinaci ó n o comenz ó o
compañ í as? i composici ó n o
comunicaci ó n o com ú n(mente, ) u
concentraci ó n o condici ó n o
configuraci ó n o con í feras? i
consegu í a[ns]? i conservaci ó n o
consideraci ó n o consigui ó o
consist í an? i consisti ó o
con strucció n s?truc?cio con strui d[ao]s? (s?)truí
contaminaci ó n o continuaci ó n o
contin ú an u contribuci ó n o
convirti é ndo(la, lo, las, los, le, les, ) e convirti ó o
correci ó n o correspond í a[ns]? i
corrosi ó n o creaci ó n o
Cristó bal (Cristo, cristó) cr í ticamente i
cu a n á cuesti ó n o
culminaci ó n o cumpli ó o
c ú pulas? u deb í a[ns]? i
d é bil(es, mente, ) e debi ó o
d é cadas? e decidi ó o
decisi ó n o dej a ndo á
dem á s a denominaci ó n o
depend í a[ns]? i descripci ó n o
descubr í a[ns]? i descubri e ndo é
descubri ó o des o rden(es, ) ó
despose í dos? i despu é s e
destru i d[ao]s? í destruy é ndol[ao]s? e
detr á s a devaluaci ó n o
di á metros? a d í as? i
dif í cil(es, mente) i difusi ó n o
di o ó diplom á tic[ao]s? a
direcci ó n o discograf í as? i
distinci ó n o distra í d(o, a, os, as, amente) i
distribuci ó n o distribu i d[ao]s? í
dividi ó o divisi ó n o
domin á ndo(la, lo, las, los, le, les, ) a duraci ó n o
ecolog í a i ecol ó gic[ao]s? o
econom í a i econ ó mic(o, a, os, as, amente) o
edici ó n o educaci ó n o
ejecuci ó n o ejerc í a[ns]? i
ejerci ó o el é ctric[ao]s? e
electr ó nica o ele a[ns]? [gj]i
elevaci ó n o eligi ó o
empez ó o emulaci ó n o
encontr ó o energ í as? i
é nfasis e É nfasis E
enfr í a[ns]? i epec í fic(o, a, os, as, amente) i
é pocas? e É pocas? E
erecci ó n o escalaf ó n o
escrib í a[ns]? i escribi ó o
espec í ficamente i esp é cimen e
espec í menes i esp í ritus? i
estableci é ndose(la, le, lo, las, les, los, ) estaci ó n o
Estados Unidos (E.E.U.U., Estados Unidos de América, los EUA, EUA, los E.U.A, E.U.A, los EEUU, EEUU, los EE.UU., EE.UU., los USA, USA, los U.S.A, U.S.A, la Unión Americana, los estados unidos, los estados Unidos, los Estados unidos, Estado Unidos, Estado Unido, estado unido, Estados Unido, estados unido)† estadounidense (norte, norte )american[ao]
est á n a est é [ns] e
est é tic(o, a, os, as, amente) e esto[s] é
estrat é gic(o, a, os, as, amente) e etimolog í a i
etimol ó gica(mente, ) o e tnias? é
eucarist í a i exclu i d[ao]s? í
exclusi ó n o exig í a[ns]? i
exigi ó o exist í a[ns]? i
existi ó o é xitos? e
É xitos? E ex ó tic[ao]s? o
expansi ó n o explosi ó n o
extend í a[ns]? i extensi ó n o
f á cil(es, mente, ) a fantas í as? i
favorec i a[ns]? i f e é
fen ó menos? o filosof í as? i
filos ó fic(o, a, os, as, amente) o fiscal í a i
f í sic(o, a, os, as, amente, ) i floraci ó n o
flu i r í fotograf í as? i
fotogr á fica(mente, ) a franc é s e
fr'