Usuario:CharlieRaMx/Taller

De Wikipedia, la enciclopedia libre
MHTML
Información general
Extensión de archivo .mht, .mhtml
Tipo de MIME multipart/related application/x-mimearchive
Tipo de formato Lenguaje de marcado
Extendido de HTML
Estándar(es) RFC 2557 (propuesto en 1999)
Formato abierto ?

MHTML (abreviado también MHT) o MIME HTML, es un formato de archivo de archivo web que se utiliza para combinar, en un solo archivo de computadora el código HTML y sus recursos externos complementarios (como imágenes) que están representados por hipervínculos, basándose en el estándar RFC 2557. Los archivos de datos incluidos son codificados utilizando MIME. Este formato es llamado a veces como MHT, bajo la extensión de archivo .mhtml o .mht dado a tales archivos por omisión cuando son creados por Microsoft Word, Internet Explorer u Opera.

la particularidad del MHTML, reside en que el contenido es codificado como si fuera mensajes de correo electrónico HTML , utilizando el MIME multipart/related.[1]​La primera parte del archivo es un encabezado de correo electrónico . La segunda parte es normalmente código HTML. Las partes subsiguientes son recursos adicionales identificados por sus localizadores uniformes de recursos (URL) originales y codificados en codificación base64 de binario a texto . MHTML se propuso como un estándar abierto y luego circuló en una edición revisada en 1999 como RFC 2557.

Las extensiones de nombre de archivo .mhtml (archivo web) y .eml (correo electrónico) son intercambiables: cualquiera de las extensiones de nombre de archivo se puede cambiar de una a otra. Un mensaje .eml puede enviarse por correo electrónico y puede mostrarse mediante un cliente de correo electrónico . De misma forma, un mensaje de correo electrónico puede guardarse con una extensión de nombre de archivo .mhtml o .mht y luego abrirse para mostrarse en un navegador web o para editar otros programas, incluidos procesadores de texto y editores de texto .

Diseño[editar]

El encabezado de un archivo MHTML contiene metadatos, como una marca de fecha y hora , el título de la página, la URL de origen y una cadena de límite aleatoria única para separar los recursos contenidos en el archivo. La cadena de límite se define al principio y se utiliza en todo el archivo.

From: <Saved by Blink>
Snapshot-Content-Location: https://en.wikipedia.org/wiki/Smartphone
Subject: Smartphone - Wikipedia
Date: Sat, 24 Sep 2022 00:34:32 -0000
MIME-Version: 1.0
Content-Type: multipart/related;
        type="text/html";
        boundary="----MultipartBoundary--GsIBda0vjy2AKIAIliwl7JMwezXDRjDAsLje9khd5l----"

Luego, los recursos de la página se contienen secuencialmente, comenzando con el código fuente HTML representado de la página. Cada recurso tiene su propio encabezado de metadatos que especifica su tipo MIME y la ubicación original.

------MultipartBoundary--GsIBda0vjy2AKIAIliwl7JMwezXDRjDAsLje9khd5l----
Content-Type: text/html
Content-ID: <frame-D968CEC8BB7E60A1859261A8CA5DFB4D@mhtml.blink>
Content-Transfer-Encoding: binary
Content-Location: https://en.wikipedia.org/wiki/Smartphone

<!DOCTYPE html>

El archivo MHTML termina con una cadena de límite que no va seguida de ningún dato.[2]

Tipo MIME[editar]

El tipo MIME para MHTML no está bien acordado. Los tipos MIME usados ​​incluyen:

  • multipart/related
  • application/x-mimearchive
  • message/rfc822

Soporte en Navegadores[editar]

Algunos navegadores admiten el formato MHTML, ya sea directamente o mediante extensiones de terceros. Sin embargo, el proceso para guardar una página web junto con sus recursos como un archivo MHTML no está estandarizado. Debido a esto, una página web guardada como un archivo MHTML usando un navegador puede verse de manera diferente al abrirse en otro diferente.

Internet Explorer[editar]

El formato de .MHT fue introducido en 1999 en Internet Explorer 5.1, fue el primer navegador que permitió leer y guardar páginas web y recursos externos en un único archivo MHTML. Sin embargo, esta característica no puede guardar ciertas páginas web complejas correctamente, en especial las que contienen imágenes con redacción. Todo se guarda como un solo archivo.

Microsoft Edge[editar]

A partir del cambio al código fuente de Chromium , Edge admite guardar como MHTML.

Opera[editar]

El soporte para guardar páginas web como archivos MHTML estuvo disponible en el navegador web Opera 9.0.[3]​ Desde Opera 9.50 hasta el resto de la línea de productos Opera basada en Presto (actualmente en Opera 12.16 a partir del 19 de julio de 2013), el formato predeterminado para guardar páginas es MHTML. El lanzamiento inicial del nuevo Opera basado en Webkit/Blink (Opera 15) no era compatible con MHTML, pero los lanzamientos posteriores (Opera 16 en adelante) sí lo son.

MHTML se puede habilitar escribiendo "opera://flags#save-page-as-mhtml" en la barra de direcciones. Opera 9.0.

Mozilla Firefox[editar]

El navegador Mozilla Firefox no es compatible con MHTML. [4]​ Hasta la llegada de la versión 57 ("Firefox Quantum") requiere la instalación de una extensión denominada Mozilla Archive Format] o UnMHT. (enlace roto disponible en Internet Archive; véase el historial, la primera versión y la última). para ver y crear archivos MHTML.

Google Chrome[editar]

La creación de archivos MHTML en Google Chrome está habilitada de forma predeterminada en la versión 86.

La lectura de ficheros MHTML en Chrome está soportada, desde la versión 28.0, pero con limitaciones.

Es posible guardar páginas en formato MHTML en versiones de Google Chrome (25.0), para ello hay que activar la funcionalidad experimental "Guardar página como MHTML" desde la página chrome://flags/. Sin embargo, al habilitar esta opción experimental se deshabilitan las opciones de guardar páginas como solo HTML o página web completa.

Navegador Yandex[editar]

La creación de archivos MHTML (multiparte/relacionados) en Yandex Browser está habilitada de manera predeterminada en la versión 22.7.4.960 (julio de 2022).

Vivaldi[editar]

De manera similar a Google Chrome, el navegador Vivaldi basado en Chromium puede guardar páginas web como archivos MHTML desde la versión 2.3. [5]

Es compatible tanto con la lectura como con la escritura de archivos MHTML al alternar la opción "vivaldi://flags/#save-page-as-mhtml".

Safari[editar]

Desde la versión 3.1.1 en adelante, el navegador web Safari de Apple Inc. no es compatible de forma nativa con el formato MHTML. En cambio, Safari admite el formato de archivo web y la versión de macOS incluye una función de impresión a PDF .

Al igual que con la mayoría de los otros navegadores web modernos, se puede agregar soporte para archivos MHTML a Safari a través de varias extensiones de terceros.

Konqueror[editar]

A partir de la versión 3.5.7, el navegador web Konqueror de KDE no admite archivos MHTML. Se puede usar un proyecto de extensión, mhtconv, para permitir guardar y ver archivos MHTML.

ACCESS NetFront[editar]

NetFront 3.4 (en dispositivos como el Sony Ericsson K850 ) puede ver y guardar archivos MHTML.

Pale Moon[editar]

Pale Moon requiere que se instale una extensión para leer y escribir archivos MHT. Una extensión está disponible gratuitamente, MozArchiver, una bifurcación de la extensión Mozilla Archive Format.

GNOME Web[editar]

GNOME Web agregó soporte para leer y guardar páginas web en MHTML desde la versión 3.14.1 lanzada en septiembre de 2014.[6]

Visores de MHT[editar]

Existen productos de software comercial para ver archivos MHTML y convertirlos a otros formatos, como PDF y ePub . Algunos programas editores de HTML pueden ver y editar archivos MHTML.

Otras aplicaciones[editar]

Grabación de acciones de usuario[editar]

La Grabación de acciones de usuario para Windows puede guardar su salida en formato MHT.

Guardar en Google Drive (extensión)[editar]

La extensión "Guardar en Google Drive" para Google Chrome puede guardar como MHTML como una de sus salidas.

Microsoft OneNote[editar]

Microsoft OneNote, a partir de OneNote 2010, envía páginas individuales por correo electrónico como archivos .mht.

Evernote[editar]

Evernote para Windows puede exportar notas en formato MHT, como alternativa a HTML o su propio formato nativo .enex.

Exploits[editar]

En mayo de 2015, un investigador observó que los atacantes podían generar documentos maliciosos creando un archivo MHT, agregando un objeto MSO al final (MSO es un formato de archivo utilizado por la aplicación de correo electrónico Microsoft Outlook) y cambiando el nombre del archivo resultante con un extensión .doc[7]​.  El método de envío sería mediante correos electrónicos no deseados.[8]

En abril de 2019, un investigador de seguridad publicó detalles sobre una vulnerabilidad de entidad externa XML (XXE) que podría explotarse cuando un usuario abre un archivo MHT. Dado que el sistema operativo Windows está configurado para abrir automáticamente todos los archivos MHT, de forma predeterminada, en Internet Explorer, el exploit podría activarse cuando un usuario hiciera doble clic en un archivo que recibió por correo electrónico, mensajería instantánea u otro vector, incluido un navegador diferente. [9]

Alternativas[editar]

Esquema de URI de datos[editar]

El esquema de URI de datos ofrece una alternativa para incluir elementos separados, como imágenes, hojas de estilo y secuencias de comandos en línea al atender una solicitud HTML o guardar un recurso HTML para uso sin conexión. Al igual que el contenido incrustado dentro de MHTML, los URI de datos utilizan la codificación Base64 de los recursos externos (que pueden ser binarios o de texto) para incrustarlos en línea dentro del marcado HTML. Las páginas HTML guardadas con elementos externos incrustados mediante el esquema de URI de datos son páginas web estándar y se pueden abrir con cualquier navegador moderno, incluidos los navegadores que no admiten MHTML, como Mozilla Firefox.[10]​ A diferencia de MHTML, guardar páginas web con sus recursos externos incrustados mediante URI de datos requiere la instalación de una extensión de terceros en el navegador.[11]

Mozilla Archive Format[editar]

El formato de archivo de Mozilla (MAFF) es un formato de archivo de archivo web heredado que fue compatible con Firefox de 2004 a 2018 a través de un complemento.[12]​A diferencia de MHTML y URI de datos, MAFF utiliza un contenedor ZIP para conservar tanto el archivo HTML como sus elementos externos. En octubre de 2017, el desarrollador del complemento anunció que el formato ya no sería compatible con futuras versiones de Firefox.[13]

Enlaces Externos[editar]

Referencias[editar]

  1. Holden, Amanda. «Difference of HTML & MHTML» (en inglés). Archivado desde el original el 17 de noviembre de 2017. Consultado el 17 de noviembre de 2017. 
  2. «2. The MHTML File Format - Hunchly Knowledge Base». support.hunch.ly (en inglés). 17 de octubre de 2018. Consultado el 24 de septiembre de 2022. 
  3. Santambrogio, Claudio (10 de marzo de 2006). «…and one more weekly!» (en inglés). Opera Software. Archivado desde el original el 15 de enero de 2010. Consultado el 15 de mayo de 2009. 
  4. «Bug 40873 - Save as rfc 2557 MHTML; complete webpage in one file» (en inglés). 
  5. février 6, Publié sur; Tetzchner, 2019-Par Jon von (6 de febrero de 2019). «Vivaldi Update | Auto-Stacking Tabs». Vivaldi (en francés). Consultado el 16 de mayo de 2019. 
  6. «NEWS · master · GNOME / Epiphany» (en inglés). 
  7. Kovacs, Eduard (11 de mayo de 2015). «Attackers Hide Malicious Macros in MHTML Documents». SecurityWeek.Com (en inglés). Consultado el 19 de abril de 2019. 
  8. Mosuela, Lordian (July 10, 2015). «New Tricks of Macro Malware». Cyren (en inglés). Consultado el 19 de abril de 2019. 
  9. Cimpanu, Catalin (12 de abril de 2019). «Internet Explorer zero-day lets hackers steal files from Windows PCs». ZDNet (en inglés). Consultado el 19 de abril de 2019. 
  10. «Data URLs - HTTP». MDN (en inglés). Consultado el 2 de abril de 2023. 
  11. Brinkmann, Martin (3 de septiembre de 2018). «Save any webpage as a single file in Chrome or Firefox - gHacks Tech News». ghacks.net (en inglés). Consultado el 2 de abril de 2023. 
  12. «Mozilla Archive Format Add-on - File Format Overview». amadzone (en inglés). Consultado el 2 de abril de 2023. 
  13. «Firefox Addon: MAF - Mozilla Archive Format» (en inglés). Archivado desde el original el 2 November 2017. Consultado el 2 de abril de 2023. 


[[Categoría:Formatos de archivos informáticos]]