본문 바로가기

SEO/SEO기초용어사전

XML 사이트 맵은? 사이트맵 작성방법

SEO에 사용되는 용어 「XML 사이트 맵: sitemap.xml」에 대해 설명합니다.

개요

XML 사이트맵은 웹사이트 내의 페이지를 검색엔진 크롤러에 알릴 수 있는 URL목록이다.

일반적으로 크롤러는 사이트 내의 링크를 추적하고, URL을 발견하고 인식하지만, 복잡한 사이트 구조 및 사이트 내 추적하기 어려운 페이지가 있으면 크롤링이 원활하지 못할 수 있다. 그런 상황을 피하기 위해 웹사이트 내의 URL을 미리 리스트화해 검색엔진에 알려줄 수 있다.

 

XML 사이트맵

 

XML 사이트맵 작성 방법

사이트맵(site map) 샘플

<?xml version="1.0″ encoding="UTF-8″?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9″>
<url>
<loc>http://www.example.com/</loc>
<lastmod>2014-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>http://www.example.com/contents/</loc>
<lastmod>2014-01-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.5</priority>
</url>
<url>
<loc>http://www.example.com/contents/0001/</loc>
<lastmod>2014-01-01</lastmod>
<changefreq>weekly</changefreq>
<priority>0.5</priority>
</url>

각 태그의 설명

<?xml version=”1.0″ encoding=”UTF-8″?>

문자 코드입니다. UTF-8로 작성한다.

<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>

네임 스페이스를 선언한다. 최신버전 0.9를 작성한다.

<url>

<url>과 <url>사이에 개별 URL정보를 작성한다.

<loc>

URL의 전체 경로를 작성한다.

<lastmod>

파일이나 소스의 최종 갱신일을 작성한다.
시간 부분을 생략하고 YYYY-MM-DD형식으로 작성한다.
※생략가능

<changefreq>

업데이트 빈도를 지정한다.
값은 always/hourly/daily/weekly 및 monthly/yearly/never 중에서 선택한다.
※생략가능

<priority>

웹사이트 내의 모든 URL을 비교했을 때의 우선순위를 작성한다.
0.0~1.0의 값 내에서 설정한다.
예) 제1계층 1.0, 제2계층 0.8, 제3계층 0.5
※생략가능

   

복수의 XML 사이트맵을 준비하는 경우

하나의 XML 사이트맵 파일에 기술 할 있는 URL은 50,000개이며, 파일 크기는 10MB(10485760 바이트)이하로 할 필요가 있다.
※gzip형식으로 10MB 이하로 압축하는 것도 가능함

위의 조건을 초과하는 경우, 여러 XML 사이트맵을 분할하고 분할된 XML 사이트맵을 정리할 인덱스 파일을 만든다. 인덱스 파일의 작성 방법은 XML사이트맵과 크게 다르지 않다.

샘플

<?xml version=”1.0″ encoding=”UTF-8″?>
<sitemapindex xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
    <sitemap>
       <loc>http://www.example.com/sitemap1.xml.gz</loc>
       <lastmod>20141-01</lastmod>
    </sitemap>
    <sitemap>
       <loc>http://www.example.com/sitemap2.xml.gz</loc>
       <lastmod>20141-01</lastmod>
    </sitemap>
</sitemapindex>

작성 방법 설명

<sitemapindex>

<sitemapindex> </sitemapindex>태그 사이에 XML 사이트맵을 작성한다.

<sitemap>

<sitemap> 사이에 각각의 XML 사이트맵의 URL정보를 작성한다.

<loc>

XML 사이트맵 URL의 전체경로를 작성한다.

<lastmod>

파일의 최종 갱신일을 작성한다.
시간부분은 생략하고 YYYY-MM-DD형식으로 작성한다.

 

서버로 업로드

여기까지 작성 후, 파일을 서버에 업로드 한다. 파일 이름, 위치는 임의로 정할 수 있지만 일반적으로 많은 사이트들이 아래와 같이 설정한다.

  • XML 사이트맵이 1개의 경우
    http://example.com/sitemap.xmlXML
  • 사이트맵이 여러 개일 경우
    http://example.com/catalog/sitemap_index.xml

 

Google 웹마스터 도구에 등록

서버에 업로드를 완료한 후, 마지막 작업이다. Google 웹마스터 도구에 XML 사이트맵을 등록하고, URL을 등록하고 검색엔진에 알린다.

 등록하면 XML 사이트맵에 작성된 URL을 순차적으로 인덱스 된다. 다만, 검색엔진에 제출한 URL이 반드시 등록되는 것은 아니다. 원인은 다양하지만 다른 URL에 중복된 내용이 있을 경우에는 전송된 URL수에 비해 인덱스에 등록되는 URL수가 적어지는 상황이 발생한다.

그런 경우에는 사이트 내의 콘텐츠를 검색엔진이 평가하기 힘든 상황이 될 가능성이 있기 때문에, SEO 대책을 바탕으로 사이트 전체의 검토를 실시하는 것을 추천한다.