티스토리 뷰

지난 포스팅 내용은 자동 연동에 의존하지 않고,

①수동으로 '색인 생성 요청' 하는 이유
②서치콘솔에서 색인 생성 요청한 글을 서치콘솔 검색창에서 등록 확인
③서치콘솔에 등록되어 있는 글이 구글 검색창에서 표시되는지를 확인하는 것까지 설명하였습니다.

이번 포스팅은 구글 서치콘솔에서 발생하는 오류를 해석하고 원인 및 해결 방법을 다루어 보려고 합니다.

우선 '크롤링됨-현재 색인이 생성되지 않음' '발견됨-현재 색인이 생성되지 않음'에 대해서 살펴보겠습니다.

물론 모든 경우의 수를 다루는 것은 아니며, 체험한 사례를 중심으로 공유합니다. 

구글 서치콘솔: 'URL이 Google에 등록되어 있지 않음'
<오류 해석>
서치콘솔 설명: 이 URL은 Google 검색 결과에 표시되지 않지만, Google에서는 이를 의도된 결과라고 판단합니다.

비밀번호로 보호되는 페이지이거나 NOINDEX 명령어가 사용되었거나 표준 페이지의 대체 버전(대체 버전 페이지는 색인이 생성되지 않음)인 경우가 가장 일반적입니다. 

OKworld 해석: 위의 설명에서 3가지 이유는 ①비밀번호로 보호되는 페이지 → 블로그 운영자 해당 가능성 낮음 ②NOINDEX 명령어 사용 → 게시글에서 발견될 수 있음   ③표준 페이지 대체 버전 → 대체 버전 페이지는 색인이 생성되지 않으며, 대부분의 오류가 ③에 해당됩니다. 

 

오류 사례-1 : 색인 생성 범위 > '크롤링됨-현재 색인이 생성되지 않음'
'URL이 Google에 등록되어 있지 않음' > 색인 생성 범위 > '크롤링됨 - 현재 색인이 생성되지 않음'

▶ 구글 설명: Google에서 페이지를 크롤링했지만 색인이 생성되지는 않았습니다. 이후에 색인이 생성될 수도 있고 생성되지 않을 수도 있습니다. 크롤링을 위해 이 URL을 다시 제출할 필요는 없습니다.

해석·해법: 구글 설명에 의하면 크롤링(8/8 오전 02:20:31)은 되었으며, 이후에 '색인이 생성될 수도 있고 생성되지 않을 수도 있다'라고 애매모호한 설명입니다.

아래 사례-1은 8월 7일 색인 생성 요청을 하였고, 크롤링은 되었는데 색인 생성이 안되어 이전에 포스팅했던 내용과 유사한 내용은 보완하였습니다. 

크롤링이 되고 난 후 5~7일 경과 후에도 색인 생성이 완료 되지 않는 URL은 "실제 URL 테스트" 를 실행한 후 색인 생성 요청을 합니다.

실제 URL 테스트: URL 검사 > 오른쪽 상단에 있는 실제 URL 테스트 클릭합니다.

※ 크롤링 이후에도 색인이 안 되는 경우가 있다고 하니 참고하세요.

페이지에 noindex로 설정된 경우: 색인을 원하는 데 noindex를 설정하지 않는 것이 당연하지만 웹사이트 소유자의 의도와 다르게 사용하는 웹서비스 플랫폼 설정이 잘 못 되어 있을 수도 있습니다.
(이 부분은 아직 사례가 없어 차후 기회가 될 때 업데이트할 예정)

☞ 스팸, 멀웨어로 인식되는 경우: 이런 경우는 서치 콘솔에서 경고가 나가니 이유를 확인할 수 있습니다.
(이 부분은 아직 사례가 없음)

중복 콘텐츠: 중복인 경우 색인에서 제외될 수도 있습니다. 서치 콘솔의 색인 범위 페이지에 관련된 내용이 나옵니다. (사례-1은 이 항목과 관련된 것으로 추정)

크롤링 이후 색인까지 시간이 걸리는 경우: 수집 이후에 색인이 완료되기까지 시간이 걸릴 수 있습니다. 이때는 기다려보는 게 좋겠습니다. 

※ 확인하지 않을 사항
100% 색인 생성: 사이트의 모든 URL의 색인이 생성될 것이라고 기대해서는 안 됩니다. 위에서 설명된 것과 같이 표준 페이지의 색인만 생성됩니다.

즉시 색인 생성: 새 콘텐츠를 추가하면 Google에서 색인을 생성할 때까지 며칠이 걸릴 수도 있습니다. 색인 생성을 요청하여 색인 생성 지연을 줄일 수 있습니다.

 

[사례-1 참고 자료] 색인 생성 범위 > '크롤링됨-현재 색인이 생성되지 않음'

크롤링됨-현재 색인이 생성되지 않음
크롤링됨-현재 색인이 생성되지 않음

 

오류 사례-2 스터디: 색인 생성 범위 > '발견됨-현재 색인이 생성되지 않음' (상태: 제외됨)
▶ 구글 설명 : Google에서 페이지를 발견했지만 페이지가 아직 크롤링되지 않았습니다. 일반적으로 Google에서 URL을 크롤링하려고 했지만 이로 인해 사이트가 과부하 상태가 될 수 있기 때문에 Google에서 크롤링 일정을 변경한 경우입니다. 그렇기 때문에 보고서에 마지막 크롤링 날짜가 비어 있는 것입니다.

▶ 해석·해법: 구글 설명대로 크롤링 시 사이트가 과부하 상태가 될 수 있다는 설명이 있으므로 첨부한 이미지 파일 사이즈 경량화 및 자료 파일을 최소화한 후 색인 생성을 재요청하여 등록을 성공적으로 마칠 수 있었습니다.

유사한 이미지 파일은 삭제하거나 축소하고 ALT 태그 정보 입력 후색인 생성 재요청하여 등록 완료했습니다.

 첨부하는 이미지 파일은 웹피(WebP) 포맷으로 변환 후 올리고, 사이즈는 800px 이하로 사용하는 것을 추천합니다.(이미지 파일은 Pixlr, Photoscape X 등을 사용하여 변환 가능) 

 

[사례-2 참고 자료] 색인 생성 범위 > 발견됨-현재 색인이 생성되지 않음(상태: 제외됨)

발견됨-현재 색인이 생성되지 않음
발견됨-현재 색인이 생성되지 않음

 

오류 정보 확인 방법: 구글 서치콘솔 > 색인 생성 범위 
구글 서치 콘솔을 열고 왼쪽 스크롤바 창에서 색인 생성 범위를 클릭하고,  '제출된 모든 페이지'를 선택합니다.
표시되는 상태 유형은 오류 / 유효(경고 있음) / 유효 / 제외됨 네 종류로 구분하여 조회할 수 있습니다.

각각의 상태 유형을 클릭하면 구체적인 정보가 있습니다.

오류: 페이지의 색인이 생성되지 않았습니다. 구체적인 오류 유형 설명을 참고하여 자세한 내용을 알아보고 오류 수정 방법을 확인하세요. 이러한 문제를 먼저 집중해서 처리해야 합니다. (서치콘솔 설명)

유효(경고): 페이지의 색인은 생성되었지만 주의해야 할 문제가 있습니다.(서치콘솔 설명)

유효: 페이지의 색인이 생성되었습니다. 

제외됨: 페이지의 색인이 생성되지 않았으며 이는 게시자가 의도한 결과로 보입니다. 예를 들어 NOINDEX 명령어를 사용해 의도적으로 제외했거나 이미 사이트에서 색인 생성된 표준 페이지의 중복 페이지일 수 있습니다.(서치콘솔 설명)

여기서 주목해야 하는 부분은 상태(제외됨) '발견됨-현재 색인이 생성되지 않음'으로 표시되는 URL이며, 이들은 구글 검색에서 표시되지 않는 페이지입니다. 따라서 관련된 페이지에 대해 원인을 찾아 수정한 후 다시 '색인 생성 요청'을 할 필요가 있습니다.

 

[구글 서치콘솔 > 색인 생성 범위 ]

구글 서치콘솔 색인 생성 범위
구글 서치콘솔 색인 생성 범위

 

[구글 서치콘솔 > 색인 생성 범위 > 제외됨 ]

제외됨 / &#39;발견됨-현재 색인이 생성되지 않음&#39;
제외됨 / '발견됨-현재 색인이 생성되지 않음'


댓글
최근에 올라온 글