[Github Blog] 블로그 검색 등록

Date:     Updated:

카테고리:

태그:

안녕하세요, 방문자 여러분. 허니테크입니다. 😊😊 이번 게시물은 깃블로그 검색 등록 과정을 고.스.란.히 담아보려 합니다. 그 과정이 상당히 고통스럽고 인내심이 필요했기 때문에 독백하듯 글을 작성하겠습니다 ㅎㅎ. 여러분에게 도움이 될만한 부분은 후에 정리해서 다시 올리도록 하겠습니다!!


22년 1월 목표 중 하나가 내 피,땀 그리고 눈물이 담겨있는 내 소오중한 깃블로그를 검색엔진에 등록하여 방문자를 만드는 것이다. 많은 깃블로그가 구글, 네이버 등 검색엔진에 등록 되었기에 ,, 나 또한 남들이 한 방식대로 옴삭옴삭 진행하면 쉽게 등록할 줄 알았는데 벌써 이 짓만 ,, 2주째인 것 같다. 앞이 깜깜하고 또 코딩이라는 거대한 산에 부딪힌 것 같지만 ,, 내가 반드시 헤쳐나가서 남들이 내 블로그를 방문할 수 있도록 할 것이다. 컴퓨터는 논리적이고 거짓말을 하지 않는다. 즉! 문제의 원인을 힘껏 쳐다보고 그에 대한 해결 방법을 계란으로 바위치듯 계속 시도해 나간다면? 언젠간 해결할 것이다. 늘 그래왔듯. 나? 해내고 말 것이야.

현재까지 진행했던 것들.

1_ 가장 우선적으론 깃허브 블로그를 모두 완성하였다. 특히 config 파일에서 url를 정확하게 설정하였다.

2_ 네이버, 다음 각각의 웹 마스터 도구에 내 블로그를 등록했다. -> 블로그 홈은 검색이 되지만 게시물 각각은 검색이 되진 않는다. (하지만 별 중요하지 않다.)

3_ 구글 검색 엔진에 깃헙 블로그를 등록하기 위해 3가지 파일을 만들었다.

sitemap.xml, robots.txt, feed.xml 각각은 검색 엔진에 자동으로 블로그 홈, 게시물 경로를 크롤링하여 연결해주는 역할을 하고 그것을 제어하는 역할을 수행한다. 각 파일에 대한 자세한 용도는 이해하진 않았다.

4_ 각 파일에 대한 문제가 없다는 것을 확인했다.

특히 sitemap.xml파일은 서버 상으로 크롤링이 잘 되었는지도 확인하였다. 이 과정도 매우 고단했다. 우선 가장 중요한건 게시물 파일이름에 한글, 특수기호, 언더바, 띄어쓰기를 쓰지 않고 최대한 간단하게 커밋하는 것이다. 이 사실을 알기 위해 매우 고생했다 ^^

5_ 구글 웹마스터 도구 - 서치 콘솔에 내 heoni00.github.io url을 등록하였고 그 html 파일을 다운 받아 블로그 레파지토리 root파일에 커밋하였다.

해당 파일이 커밋되서 잘 등록되는지 확인하는 방법이 있는데 ,, 나는 “127.0.0.1에서 연결을 거부했습니다.”라고 떴다. 이게 문제일까? 하지만 서치 콘솔에는 블로그가 문제없이 등록된 것 같다.

6_ 관리창에서 sitemaps부분에서 sitemap.xml을 제출했다! 근데 망했다.

image image

구문분석!!!!! 구문분석 오류가 도데체 뭐길래 ,, 문제의 437행이 뭔지도 사실 잘 모르겠다. 이에 대해 구글 서치 콘솔 고객센터의 게시판에 질문을 올렸다. 언더바가 문제인 것을 확인했지만 해당 행을 정확하게 확인하는 방법은 알아내지 못했다.

7_ 게시물 파일 이름을 모두 단순화하여 커밋하고 sitemap을 다시 제출했지만 여전히 해당행의 구문분석 오류가 뜬다. (구글 콘솔에서 새로고침을 하지 않은 것 같다.)

해결 방법 구상

  1. 구글 서치 콘솔 사이트맵 가져올 수 없음에 대한 블로그에서 먼저 색인 생성 요청을 한 뒤 sitemap, feed를 제출하는 방법을 찾았다. 해당 블로그 -> sitemap 파일을 변경했기 때문에 색인 생성 요청으로 다시 갱신하면 될거라 생각함 (월요일 저녁인데도 ,, 갱신되지 않음,,)

  2. 사실 sitemap.xml을 제출하는 것은 자동으로 나의 게시물 url을 검색 엔진에 등록하기 위해서 라는 생각이 있다. 때문에 내 게시물을 하나하나 등록하는 것도 나쁘지 않을 것 같다. -> 생각해보니 내가 깃 블로그에 게시물을 얼마나 자주 올린다고 ,, 블로그 게시물 url을 자동 크롤링할라고 이렇게 몇 주간 고생하느니 하나하나 직접 색인 생성을 하는게 낫다는 생각이 들었다. 그래서 지금 블로그 02 구글 색인까지 했다. 하루에 최대 4~5개 정도 가능 한 것 같다. 우선 하루에 가능한 정도로 색인을 생성할 계획이다. sitemap은 그때그때 알아보는 걸로 ,, ㅎㅎ

  3. 메일에서 가이드북을 보내줬다. 해당 방법을 따라서 해볼까 한다.

  4. 블로그 중 내가 사용했던 방법 이외에 검색 엔진 등록 방법을 작성한 글이 있다. 그 방법을 따라해본다.

  5. 최후의 방법 - 그러고 싶진 않지만 블로그 url 바꿔서 처음부터 다시 시작해보는 것, 하지만 이 방법을 하면 어디서부터 어디까지 손대야할지 감도 안온다.

완성된 해결 방법

우선 구문분석 오류란 sitemap.xml에서 문제가 있는 코드(행)이 있다는 것이다. 따라서 이 부분은 수정을 한 뒤 다시 커밋하는게 맞았다.

수정을 한 sitemap.xml은 시간이 지나거나 다시 제출하게 된다면 수정이 되는데 이때 구글 크롤링 프로그램이 언제 다시 읽어줄 지 모른다고 한다. 따라서 URL 검사를 통해서 색인 및 url 검사를 다시 실행해달라 요청하면 그나마 더 빨리 처리해 줄 수 있다. 즉 ,,, 시간을 갖고 기다리면 자동으로 sitemap을 크롤링해준다고 한다.

실제로 게시물 수가 500개가 넘지 않는다면 sitemap은 필요 없을 수도 있다고 한다. 구글 서치 콘솔에 블로그 등록을 마친다면 자동으로 크롤링을 해간다고 한다. 단, 블로그의 가치가 높아야 한다는 가정이 존재한다. 또한, 자주 글을 올려야한다고 한다. 언젠간 크롤링을 해주니 색인 생성 범위를 잘 확인하면 된다고 한다.

나의 경우 방법을 정확하게 몰랐기 때문에 게시물 하나하나 url 검사를 실시하여 색인 요청을 하였다. 실제로 ,,, 구글에 검색이 하나하나 된다..

이런식으로 조금 기다리게 된다면 sitemap의 수정된 오류도 잡아 줄거라고 믿는다. ㅎㅎ

해결 과정 중 얻어낸 것

  1. html 문서를 vscode로 읽는 방법을 알게 되었다.

페이지를 저장하듯 주소 말고 문서 확장명으로 저장한 뒤 vscode 프로그램으로 확인하면 된다. 이 방법으로 sitemap.xml의 구문분석 오류 부분이 어떤 곳인지 알게 되었다.

  1. 구글 엔진 등록 개념을 어렴풋하게 이해한 것 같다.

색인, sitemap기능, robots기능, 구글 크롤링 등을 검색 엔진 등록 매커니즘을 이해하였다.

은인 블로그

  1. 끝까지 찾고자 하는 의지와 인내심.

후후 ,, 아직 결과는 나오지 않았지만 게시물이 하나 둘 씩 검색이 가능해지고 있다. ㅎㅎ 결국 해낸 것이다. 꼭 보면 ,, 별 것도 아니고 뭔가 헛탕짓하긴 했지만 이게 인간 승리이다. peace

참고 블로그

https://yenarue.github.io/tip/2020/04/30/Search-SEO/ https://theorydb.github.io/envops/2019/05/11/envops-blog-tipue-search/ https://blog.slarea.com/git/blog/register-to-search/ https://sanghyuk.dev/blog/2/ https://mi-nya.tistory.com/188

Blog 카테고리 내 다른 글 보러가기

댓글 남기기