며칠 전 운영하고 있던 블로그 중 하나인 워드프레스를 등록한 구글 서치 콘솔을 확인 중 이상한 현상을 발견하였습니다. 구글 서치 콘솔의 sitemaps에 등록 했던 /sitemap.xml 에서 “사이트맵을 읽을 수 있지만 오류가 있습니다. Sitemap이 HTML입니다.” 라는 오류였습니다. 해당 오류는 왜 발생되었는지 해결 방안은 무엇인지 이 글을 통해 확인해 보도록 하겠습니다.
sitemap
sitemap은 사이트의 방문자, 검색엔진의 크롤러가 해당 웹사이트를 방문했을 때 확인할 수 있는 웹페이지의 목록들을 말합니다. 쉽게 말해 네이버 포털에서는 검색, 메일, 카페, 블로그, 쇼핑, 뉴스, 증권, 부동산 등등 여러가지 큼직큼직한 목록의 페이지로 구성되어 있는 것을 확인할 수 있습니다. 또한 이 큼직한 목록에서 잘게 잘게 나눠서 구분이 가능하겠죠. 메일에는 받은 편지함, 보낸 편지함 등등이 있을 것이고, 뉴스에는 여러 언론사의 뉴스들로 나뉘는 것처럼 말입니다. 이러한 목록들 또한 사이트맵이라고 할 수도 있겠습니다.
sitemap은 네이버 서치 어드바이저, 구글 서치 콘솔 과 같은 웹 마스터 도구가 크롤링 할 수 있는 워드프레스의 페이지에 대해 검색엔진에 알릴 수 있는 가장 쉬운 방법 중 하나입니다. sitemap.xml을 등록하면 웹 마스터 도구가 나의 워드프레스 웹페이지의 변화들을 보다 쉽게 감지하고 쉽게 크롤링 할 수 있다는 뜻이 되겠죠.
HTML
Hyper Text Markup Language. 인터넷에 올릴 수 있는 글과 그림의 페이지를 만드는데 사용되는 컴퓨터 언어로 알려져 있습니다. 워드프레스 또는 티스토리 블로그에서 글을 작성할 때에 일반 모드 또는 HTML 모드로 글을 작성 할 수 있는데, 일반 모드는 평소 사람들이 읽을 수 있는 글이지만, HTML 모드로 변경하면 , 일반 사람들이 볼 때 무슨 뜻인지 알 수 없는 언어들이 섞여 있는 것을 확인할 수 있습니다.
사이트맵을 읽을 수 있지만 오류가 있습니다. sitemap이 HTML입니다.
워드프레스를 운영해본 경험이 짧아 해당 오류를 구글링을 해보았지만, 딱 마음에 드는 답변을 찾기는 어려웠습니다. 검색 결과 특정 플러그인의 설치에 대한 설명들이 대다수였으나, 필자는 사이트맵 /sitemap.xml을 생성하기 위한 특정한 플러그인도 설치하지 않았을 뿐만 아니라, 그 어떠한 작업도 하지 않았기 때문입니다. 단지 구글 서치 콘솔에 /sitemap.xml을 입력했을 뿐이었죠.
곰곰이 생각해보았습니다. 일단, 오류의 내용 그대로 제출된 사이트맵인 /sitemap.xml이 HTML, 즉 컴퓨터로 된 언어로 되어 있는지 확인해 보았습니다. 그래서 오류가 발생한 워드프레스의 사이트맵 https://oooo.com/sitemap.xml 을 접속해 보았습니다.
xml 사이트맵이 잘 출력 되고 있었고, XML 사이트맵은 워드프레스가 생성했다는 메시지도 확인할 수 있었습니다. 즉, sitemap.xml에 대한 문제는 없었습니다. 하지만 위의 이미지에서 보이듯이 https://oooo.com/sitemap.xml으로 접속했으나, XML 사이트맵은 https://oooo.com/wp-sitemap.xml 으로 주소가 자동으로 변경되어 접속 되는 것을 확인할 수 있었습니다. 문득 이 문제였나 싶어 구글 서치 콘솔의 sitemaps에서 /wp-sitemap.xml으로 추가 등록을 진행하였습니다.
생각대로 구글 서치 콘솔에서 워드프레스의 사이트맵을 잘 읽어주었고, 페이지 수 또한 적절하게 잘 나타내 주고 있었습니다. 워드프레스의 사이트맵 주소 문제였던 것으로 추측이 가능했습니다.
하지만 해당 문제가 해결되고 며칠 뒤 다시 구글 서치 콘솔의 sitemaps를 확인해 보니, /wp-sitemap.xml 의 상태도 성공으로 나타내고 있었지만, 문제의 /sitemap.xml 의 상태 또한 성공으로 나타나고 있었습니다. 필자는 구글 서치 콘솔 봇이 크롤링 하는 과정에서 /sitemap.xml을 접속했을 때, /wp-sitemap.xml 이라는 다른 링크로 변환되어 접속이 되다 보니 그 과정에서 불합리함을 느끼고, 오류 메시지를 출력했을 가능성을 예측하고 있습니다.
결론입니다. 워드프레스에서는 사이트맵을 자체적으로 제공하고 있습니다. 그래서 워드프레스의 장기적인 운영에서 보았을 때 무분별한 플러그인 설치는 도움이 되지 않을 것으로 보아, sitemap.xml을 생성해주는 플러그인 설치의 필요성은 크게 느껴지지 않았습니다.
그리고 구글 서치 콘솔에 사이트맵을 입력할 때 /sitemap.xml과 /wp-sitemap.xml 두 가지 다 입력해도 상관은 없는 것으로 예상됩니다. 하지만 /sitemap.xml 입력 시 이 글에서 발생되었던 오류 (구글 서치 콘솔 사이트맵을 읽을 수 있지만 오류가 있습니다. sitemap이 HTML입니다.)가 다시 안 나타날 것이라는 보장은 없습니다. 그러므로 워드프레스 사이트맵의 원 주소인 /wp-sitemap.xml로 입력해 보시는 것을 추천 드리겠습니다. 감사합니다.