Сохранить веб-страницу как HTML или MHT с помощью Delphi

При работе с Delphi TWebBrowser Компонент позволяет создавать индивидуальные Приложение для просмотра веб-страниц или добавить в свои приложения возможности просмотра в Интернете, файлах и сети, просмотра документов и загрузки данных.

Как сохранить веб-страницу из TWebBrowser

При использовании Internet Explorer вы можете просматривать исходный HTML-код страницы и сохранять эту страницу в виде файла на локальном диске. Если вы просматриваете страницу, которую хотите сохранить, перейдите в Файл / Сохранить как... пункт меню. В открывшемся диалоговом окне предлагается несколько типов файлов. Сохранение страницы под другим типом файла повлияет на способ сохранения страницы.

Компонент TWebBrowser (находится на странице «Интернет» палитры компонентов) обеспечивает доступ к функциональности веб-браузера из вашего Delphi-приложения. Как правило, вы хотите включить сохранение веб-страницы, отображаемой внутри веб-браузера, в виде HTML-файла на диск.

Сохранение веб-страницы в виде необработанного HTML

instagram viewer

Если вы хотите сохранить веб-страницу только в виде необработанного HTML, выберите «Веб-страница, только HTML (* .htm, * .html)». Он просто сохранит исходный HTML-код текущей страницы на вашем диске в целости и сохранности. Это действие НЕ сохранит графику со страницы или любые другие файлы, используемые на странице, что означает, что если вы загрузите файл обратно с локального диска, вы увидите неработающие ссылки на изображения.

Вот как сохранить веб-страницу в виде необработанного HTML-кода, используя код Delphi:

Образец использования:

Примечания

  • Интерфейсы IPersistStreamInit и IStream объявлены внутри блока ActiveX.
  • Веб-страница сохраняется в виде необработанного HTML-файла в файле WebBrowser1.html в корневой папке диска C.

MHT: веб-архив, один файл

Когда вы сохраняете веб-страницу как «Веб-архив, один файл (* .mht)», веб-документ сохраняется в формате многоцелевого расширения электронной почты в Интернете (MHTML) с расширением файла .mht. Все относительные ссылки на веб-странице переназначаются, а встроенный контент включается в файл .mht. вместо того, чтобы быть сохраненным в отдельной папке (как в случае с «Веб-страница, полная (* .htm, * .Html) ").

MHTML позволяет отправлять и получать веб-страницы и другие документы HTML с помощью таких программ электронной почты, как Microsoft Outlook и Microsoft Outlook Express; или даже ваши собственные решения для отправки электронной почты Delphi. MHTML позволяет встраивать изображения непосредственно в текст сообщения электронной почты, а не прикреплять их к сообщению.

Вот как сохранить веб-страницу в виде одного файла (формат MHT), используя код Delphi:

Пример использования:

Заметка

  • Класс _Stream определен в модуле ADODB_TLB, который вы, вероятно, уже создали. Код интерфейсов IMessage и IConfiguration из библиотеки cdosys.dll. CDO означает Collaboration Data Objects - библиотеки объектов, разработанные для включения SMTP-сообщений.

CDO_TLB является автоматически сгенерированным модулем Delphi. Чтобы создать его, в главном меню выберите «Библиотека типов импорта», выберите «C: \ WINDOWS \ system32 \ cdosys.dll» и нажмите кнопку «Создать модуль».

Нет TWebBrowser

Вы можете переписать процедуру WB_SaveAs_MHT, чтобы принять строку URL (не TWebBrowser), чтобы иметь возможность сохранять веб-страницу напрямую - не нужно использовать компонент WebBrowser. URL-адрес из WebBrowser извлекается с использованием свойства WB.LocationURL.

instagram story viewer