Karen Spärck Jones
Karen Spärck Jones | ||
---|---|---|
Karen Spärck Jones en 2002 | ||
Información personal | ||
Nacimiento |
26 de agosto de 1935 Huddersfield, Yorkshire | |
Fallecimiento |
4 de abril de 2007 Cambridgeshire | |
Causa de muerte | Cáncer | |
Residencia | Reino Unido | |
Nacionalidad | británica | |
Familia | ||
Padres |
Owen Jones Ida Spärck | |
Cónyuge | Roger Needham (desde 1958) | |
Educación | ||
Educada en | Universidad de Cambridge | |
Supervisor doctoral | DC Comics y R. B. Braithwaite | |
Información profesional | ||
Ocupación | Informática teórica, profesora de universidad e investigadora de la inteligencia artificial | |
Área | Ciencias de la computación | |
Conocida por | trabajar en recuperación de datos y procesador de lenguajes naturales, en perticular su modelo probabilístico de documentos y recuperación de textos | |
Empleador | Laboratorio de Computación (en la Universidad de Cambridge) | |
Miembro de | ||
Sitio web | www.cl.cam.ac.uk/archive/ksj21 | |
Distinciones | ACL Lifetime Achievement Award, medalla BCS Lovelace, ACM-AAAI Allen Newell Award, ACM SIGIR Salton Award, American Society for Information Science and Technology’s Award of Merit | |
Karen Spärck Jones (26 de agosto de 1935 – 4 de abril de 2007) fue una científica británica especializada en lingüística computacional. Investigadora pionera en recuperación de información.[1][2]
Biografía
[editar]Karen Spärck nació en Huddersfield (Yorkshire). Su padre fue Owen Jones, un profesor en química, y su madre fue Ida Spärck, que escapó de Noruega al Reino Unido durante la Segunda Guerra Mundial. Spärck Jones fue educada en una escuela primaria de Huddersfield y luego en el Girton College (Cambridge) desde 1953 hasta 1956, estudió Historia y un año adicional sobre Ciencias Morales (filosofía). Entonces empezó a trabajar como maestra en la escuela, pero poco después empezó a trabajar en informática. Durante todo el tiempo que estuvo dedicándose a la informática impulsó notablemente que más mujeres entraran en esta disciplina.[3]
Comenzó su carrera investigadora en 1950 desarrollando un tesauro para la Unidad de Investigación en Lenguaje de la Universidad de Cambridge. En 1964 se doctoró con una tesis titulada Sinonimia y clasificación semántica utilizando técnicas estadísticas y probabilísticas combinadas con técnicas lingüísticas.[4] Su enfoque fue pionero en la materia.[5]
Pudo seguir investigando en recuperación de información gracias a las distintas becas que le fueron concedidas por instituciones como la Royal Society o la Biblioteca Británica, hasta que fichó por el Laboratorio de Informática de la Universidad de Cambridge donde trabajó desde 1974 hasta su jubilación en 2002, aunque siguió trabajando allí hasta poco antes de morir por cáncer en 2007, en Willianghan (Cambridge).[6]
Obra científica
[editar]Karen Spärck Jones lideró la indización automatizada creando un indicador capaz de hallar la importancia informativa de una palabra para un documento;[7] lo que se llamaría a partir de entonces como indización ponderada o por pesos. Este algoritmo llamado ITF (inverse term frecuency o frecuencia inversa del término) obtiene la importancia de un término dependiendo del número de veces que aparezca en el documento en relación con el resto de términos que este tenga. Este algoritmo desecha las palabras que aparezcan tanto en exceso (palabras funcionales de la lengua como preposiciones o conjunciones) como por defecto (palabras con unas pocas apariciones), al considerar que no aportan valor informativo suficiente como para describir el contenido del documento.[8]
Este indicador daría paso a otro más importante todavía: el IDF (inverse document frecuency o frecuencia inversa del documento) cuyo procedimiento es similar al anterior pero que se emplea en todos los documentos de una base de datos documental. Con este algoritmo obtendríamos ordenados de mayor a menor relevancia los documentos encontrados al responder a una consulta. Este diseño fue el principio del modelo probabilístico de recuperación de información, desarrollado por Spärck Jones y Stephen Robertson, y continuado por otros investigadores como Keith van Rijsbergen, Peter Ingwersen o Ricardo Baeza-Yates.[9]
Publicaciones
[editar]Algunas de sus obras son:
- Automatic keywords classification for information retrieval. Londres: Butterworths, 1972
- Information retrieval experiment. Londres: Butterworths, 1981
- Readings in information retrieval (en coautoría con Willett). San Francisco: Morgan Kaufmann.
Publicó numerosos artículos en prestigiosas revistas de investigación científica, entre ellos:
- A statistical interpretation of term specificity and its application in retrieval (1972) en Journal of Documentation, nº 28.
- Index term weighting (1973) en Information Storage and Retrieval, nº 9.
Premios y condecoraciones
[editar]Fue galardonada con numerosos premios, entre ellos:
- Premio Gerard Salton en 1988,
- Premio ASIST al Mérito Académico en 2002,
- Premio a la trayectoria de una vida investigadora de la ACL, la asociación internacional más prestigiosa en Lingüística computacional.
- Premio Allen Newell de la ACM-AAAI (2007).
- Medalla Lovelace en 2007, cuando ya estaba enferma de cáncer.
Referencias
[editar]- ↑ «SPÄRCK JONES, Karen». forohistorico.coit.es. Consultado el 14 de agosto de 2019.
- ↑ «Overlooked No More: Karen Sparck Jones, Who Established the Basis for Search Engines». The New York Times (en inglés estadounidense). 2 de enero de 2019. ISSN 0362-4331. Consultado el 11 de octubre de 2019.
- ↑ «Conheça Karen Sparck Jones, criadora do conceito dos sites de busca». Revista Galileu (en portugués de Brasil). Consultado el 11 de octubre de 2019.
- ↑ Karen Spärck Jones (1986). Synonymy and Semantic Classification (Tesis publicada como libro). Edinburgh Information Technology series 1. Edinburgh University Press.
- ↑ «Upper | Karen Spärck Jones, una investigadora incansable». Upper. 11 de mayo de 2016. Archivado desde el original el 14 de agosto de 2019. Consultado el 14 de agosto de 2019.
- ↑ «La enérgica Karen Spärck Jones (1935-2007) | Vidas científicas». Mujeres con ciencia. 31 de octubre de 2017. Consultado el 14 de agosto de 2019.
- ↑ Carlos M. Lorenzetti (18 de marzo de 2011). «Caracterización Formal y Análisis Empírico de Mecanismos Incrementales de Búsqueda basados en Contexto».
- ↑ «Overlooked No More: Karen Sparck Jones, Who Established the Basis for Search Engines – Celebrate Women 2020». celebratewomen2020.org. Archivado desde el original el 11 de octubre de 2019. Consultado el 11 de octubre de 2019.
- ↑ Robertson, Stephen (1 de octubre de 2014). «Understanding Inverse Document Frequency: On theoretical arguments for IDF». |Journal of Documentation - Vol. 60 N°5. Archivado desde el original el 14 de agosto de 2019.
Bibliografía
[editar]- In memorian, Journal of de American Society for Information Science and Technology. 59(5). pp. 852-854, 2008.
- MOYA ANEGÓN; Felix de (2002): Técnicas avanzadas de recuperación de información. EN: Manual de ciencias de la documentación. Madrid: Pirámide.
Enlaces externos
[editar]- American Society for Information Science
- Ganadores del Premio al Mérito (enlace roto disponible en Internet Archive; véase el historial, la primera versión y la última).
- Gandores del Premio Gerard Salton
- Mujeres
- Nacidos en 1935
- Fallecidos en 2007
- Alumnado de la Universidad de Cambridge
- Informáticos teóricos del Reino Unido
- Informatólogos del Reino Unido
- Documentalistas del Reino Unido
- Profesores de la Universidad de Cambridge
- Lingüística computacional
- Premio ASIST al Mérito Académico
- Pioneras de la informática
- Científicas del Reino Unido
- Miembros de la Academia Británica
- Fallecidos por cáncer en Inglaterra
- Nacidos en Huddersfield