HTML 웹페이지 분할

HTML 파일은 일반적으로 웹사이트나 웹 애플리케이션에 정보를 표시하는 데 사용됩니다. 실제로 텍스트의 서식을 지정할 수도 있는 마크업 텍스트입니다. 때때로 HTML 파일은 텍스트, 이미지, 차트, 다이어그램 및 기타 많은 콘텐츠를 포함한 많은 데이터를 포함할 수 있기 때문에 상당히 큽니다. 다른 요구 사항이나 사용 사례에 따라 HTML 파일을 분할해야 할 수도 있습니다. C#을 사용하여 HTML 파일을 여러 파일로 분할하는 방법을 살펴보겠습니다.

C#의 HTML 스플리터 – API 설치

Aspose.HTML for .NET API는 C# 프로그래밍 언어를 사용하여 .NET Framework 기반 응용 프로그램에서 HTML 웹 페이지를 만들거나 조작하는 것을 지원합니다. 다운로드 섹션에서 최신 DLL 파일을 다운로드하거나 다음 설치 명령으로 NuGet 갤러리를 통해 API를 쉽게 설치할 수 있습니다.

PM> Install-Package Aspose.Html

C#에서 HTML 웹 페이지를 여러 파일로 분할

.NET API용 Aspose.HTML에는 다양한 기능이 있습니다. 로드된 HTML 문서의 내용을 다른 HTML 문서로 복사할 수 있습니다. 그러나 HTML은 고정 레이아웃 형식이 아니며 PDF, DOCX 등과 같은 특정 장치로 인쇄할 때까지 페이지가 없기 때문에 다른 고정 레이아웃처럼 콘텐츠를 페이지로 분할할 수 있는 메서드나 속성을 찾을 수 없습니다. 레이아웃 형식. 따라서 HTML을 분할할 적절한 위치를 찾고 그에 따라 분할 로직을 설계해야 합니다.

이 예에서는 단락 요소를 기반으로 HTML 웹 페이지를 분할해야 하는 예를 고려할 것입니다. 따라서 다음 단계는 HTML 웹 페이지를 단락별로 분할하는 방법을 보여줍니다.

  1. 입력 HTML 웹 페이지 로드
  2. Query Selector를 사용하여 HTML 문서 내의 모든 단락 요소 찾기
  3. HTML 파일을 분할할 빈 문서 만들기
  4. 출력 HTML 파일 저장

아래 코드 조각은 C#을 사용하여 HTML 웹 페이지를 여러 파일로 분할하는 방법을 자세히 설명합니다.

String content = File.ReadAllText(dataDir1 + "Product.html");
// HTML 문서의 인스턴스 생성
var document = new HTMLDocument(content, "");
            
// HTML 웹 페이지를 여러 파일로 분할
// CSS 선택기 쿼리를 사용하여 문서 내의 모든 단락 요소 찾기
var elements = document.QuerySelectorAll("p");
for (int i = 0; i < elements.Length; i++)
{
    // 내용을 내보낼 빈 문서 만들기
    using (var copyTo = new HTMLDocument())
    {
        // 이전에 만든 문서에 내용 추가
        copyTo.DocumentElement.AppendChild(elements[i]);
        // 문서를 저장
        copyTo.Save(dataDir1 + "doc_" + i + ".html", HTMLSaveFormat.HTML);
    }
}

결론

이 기사에서는 C#을 사용하여 HTML 웹 페이지를 여러 파일로 분할하는 방법을 배웠습니다. 우리는 다른 단락 요소를 기반으로 파일을 분할하는 예를 고려했습니다. 마찬가지로, 각 출력 파일에서 5개 또는 10개 단락을 분할하는 논리를 즉석에서 수행할 수 있습니다. 요구 사항에 따라 HTML 웹 페이지를 분할하는 다른 사용 사례가 있을 수 있습니다. 다른 사용 사례나 시나리오에 대해 도움이 필요한 경우 무료 지원 포럼에 언제든지 문의해 주십시오. 기꺼이 도와드리겠습니다!

또한보십시오