네이버, 웹 검색 개선…"양질의 외부 콘텐츠 더 많이 노출"

아시아경제

2017-12-07 17:30:25

외부 콘텐츠 범위 확대에 주력…내년 PDF 분석 솔루션 개발 예정
7일부터 웹문서·사이트 탭 통합…양질 정보·사이트 더 광범위하게 노출



[아시아경제 한진주 기자] 네이버가 외부의 학술 정보 등 유용한 콘텐츠 검색을 원활하게 할 수 있도록 웹문서·사이트 검색 서비스를 개선한다. AI 기술을 활용해 더 유용한 웹문서를 실시간으로 수집하고, 스팸 문서 처리 기술을 고도화한다.

7일 서울 강남구 역삼동 네이버 파트너스퀘어에서 진행된 웹커넥팅데이에서 김상범 네이버 웹검색 리더는 "올해 외부 문서를 잘 검색할 수 있도록 창사 이래 가장 많은 노력을 쏟았다"며 "네이버 검색 결과에 자체 콘텐츠가 많아 '가두리'라는 비판이 있었지만 앞으로는 외부 콘텐츠도 잘 가져오려고 한다"고 설명했다.

지금까지 네이버 검색은 구글 등과 비교해 외부 사이트 웹문서 검색 결과가 제대로 반영되지 않는다는 지적을 받아왔다. 네이버는 AI 기술을 토대로 외부 학술정보를 포함한 양질의 웹문서를 더 많이 노출시키는 데 주력하겠다는 계획이다.

네이버는 전 세계 1조개 링크 중 100억개 가량을 관찰한다. 네이버가 수집하는 정보는 3억개 이상의 도메인, 10억개 이상의 웹사이트다. 이 중 네이버에서 검색할 수 있는 웹사이트 규모는 1000만개다. 웹 상의 방대한 정보를 크롤러가 수집하고, 가치있는 정보를 검색 랭킹에 따라 선별해서 보여준다.

네이버는 학술전문자료나 해외 사이트 검색 강화를 위해 검증된 출처에서 발견된 문서를 수집·분석하는 '화이트 네트워크'를 구축해왔다. 출처가 지닌 가치, 문서 자체의 가치를 조합해서 수집 우선순위를 결정하는 방식이다. 여기에 AI 기술을 더해 더 유용한 학술 자료를 노출하기 위한 기술 개발도 힘쓰기로 했다.

김상범 리더는 "내년 2월 경 PDF 분석 솔루션을 만들어서 PDF 자료 검색을 강화할 것"이라며 "국내 연구소 자료, 페이지, 그래프 여부까지 분석해서 이용자가 자료 찾을 때 '네이버에서도 이런 결과가 나오네'라고 생각하도록 1년 안에 만들겠다"고 강조했다.


검색 품질을 결정짓는 또 한 축은 '스팸 필터링'이다. 네이버는 지난해부터 개발한 '그리핀 프로젝트'를 통해 딥러닝 기술로 스팸 문서를 걸러내고 있다. 스팸 문서들이 자주 쓰는 단어를 학습시켜 관련 문서는 검색 결과에서 제외시키는 것이다. 문서가 어디에 노출되는지, 어떤 사람들이 클릭하는지도 분석해서 스팸 여부를 판단한다.

강성구 네이버 엔지니어는 "전체 수집되는 문서 중 25~30%가 스팸 문서"라며 "앞으로 네이버에서 해당 문서가 가진 정보량을 측정해서 더 좋은 품질의 문서로 판단할 예정"이라고 말했다.

또한 네이버는 7일부터 검색결과에 웹문서·사이트 탭을 통합한다. 기존에 내부 기준에 따라 구분했던 것을 없애고 외부의 읽을만한 정보나 방문할만한 사이트를 더 광범위하게 노출시키겠다는 계획이다. 나아가 웹사이트 관리자들이 더 좋은 검색결과를 보여줄 수 있도록 검색 서비스를 개선할 수 있도록 교육과 가이드도 제공하기로 했다.

김상범 리더는 "기존과 동일하게 사이트나 웹문서는 서브탭에서 확인할 수 있지만 내년 1월에는 통합검색 결과에서 두 탭을 완전히 통합시킬 것"이라며 "사용자의 의도를 기반으로 좋은 검색 결과를 내는 데 중점을 두겠다"고 말했다.


한진주 기자 truepearl@asiae.co.kr
<ⓒ세계를 보는 창 경제를 보는 눈, 아시아경제(www.asiae.co.kr) 무단전재 배포금지>

핫포토

스토리카드
현재 논란이 되고 있는 고양이 품종 정리
콜레스테롤 수치 낮춰주는 일등 음식은?
세계 독재자의 후손들 근황
헝가리 윙크남, 샨도르… 임자있는 사랑꾼이었음
정당방위의 기준은 정당할까?
비교하는 재미가 있다! 국내 영화의 해외 포스터
윙크가 아름다운 나라, 헝가리 여행 간접 체험
땅값 비싼 곳 어디에나 있다는 트럼프 타워 구경하기
남자들의 세상 무너지는 것 같은 사소한 순간들
여드름이 났을 때 하면 안되는 행동
의외의 악역 캐스팅이 빛났던 영화들
그녀가 경기 후 얼어붙은 이유
한없이 순수한 웨딩사진
동물을 죽이지 않고 진짜 고기를 만들 수 있다면?
실제 존재하는 놀라운 세계 기괴한 건축물들
이런데서 용무를? 일본의 독특한 화장실
영미, 영미, 영미!!! 영미의 속 뜻
연예인들은 결혼식 손님으로 갈 때 뭘 입을까
75kg에서 46kg까지 뺀 신소율. 비결은?
현직 치과의사가 말하는 `과잉진료 피하는 법`
전직 CIA 요원이 밝힌 거짓말탐지기를 속이는 방법
나를 살찌게 하는 나쁜 행동 5가지
여자친구가 생기면 남자들에게 생기는 초능력 5가지
전세계 나라 별 해장 음식 BEST7
치즈 종류에 대해 얼만큼 알고 있는가 ?
이 꽃이 정말 몸에도 좋다고?
반려식물이 우리집에 주는 효능
비만인 강아지에게 맞는 다이어트 방법이 따로있다.
언니가 있다면 공감할 수 있는 일들
제 2의 데뷔곡으로 알려진 남돌 노래들
실시간 베스트
  • 1[영상] 짜릿한 막판 스퍼트! 스피드 스케이팅 5000m 이승훈 선수 경기 장면!
  • 2'메달 없어도 괜찮아' 김도겸, 임효준 위로하는 모습에 감동 자아내
  • 3번역기 잘못 돌려 큰일 날 뻔한 노르웨이 대표팀
  • 4'정글의법칙' 이승훈X슬기 합류 "멕시코行"
  • 5지난해 수출 중심 '경제 급성장' 이룬 동남아, 올해도 성장 지속할까
  • 6'이민호 화보 제작 사기' 기획사 대표 2심서 징역 1년
  • 7대한민국에서 여성으로 산다는 건? 장안의 화제 '이지혜 게임' 직접 해봤다!
  • 8식은 피자 촉촉하게 데우는 초간단 방법!
  • 9오달수, 채국희와 결별설…소속사 ‘묵묵부답’
  • 10소트니 코바, 뜬금없이 4년전 경기 추억 "이 순간을 언제나 기억할 것"
  • 11관광대국 몰디브, 비상사태 30일 연장
  • 12겨울철 새벽 5시~7시,무단횡단 교통사고 조심하세요
  • 13[영상] 도살 앞두고 눈물 떨구는 소…그리고 반전
  • 14요즘따라 너무 건조한 내 눈을 위한 안구건조증 예방법
  • 15설하윤, 트로트 가수 최초 맥심 표지모델 발탁 '남심 홀리는 베이글 몸매'
  • 16입장권 판매 불티…'흑자올림픽' 무르익는 평창
  • 17우병우의 '문체부 좌천 압박'은 왜 무죄일까?
  • 18일본 관방장관 "내년 G20 개최지 오사카시로 결정" 공식 발표
  • 19[영상] 당신이 수면마취를 하면 겪게 될 일들 (해외수면마취 레전드)
  • 20우리집 댕댕이는 몇 위? 똑똑한 강아지 Best5
  • 21‘고등래퍼 2’ 산이 “시즌 1보다 더 잘될 것”
  • 22[오피셜] 부산-대구, 박병현↔박태홍 맞임대 '서로 수비 보강'
  • 23日거래소 오류로 비트코인 10억개 0원에 거래 '해프닝'
  • 24'국정원 댓글부대' 민병주, 보석으로 157일만에 석방
  • 25[영상] 민유라-겜린, 아찔한 사고에도 혼신의 연기