IT



네이버 뉴스, 알고리즘 자동 배치..관리자 개입없이 운영



[파이낸셜데일리=이정수 기자]  '드루킹 댓글 조작 사건' 등으로 공정성 논란에 휩싸인 네이버가 뉴스 검색에서 알고리즘에 따라 관리자 개입 없이 적절하게 운영하고 있다는 평가가 나왔다. 

네이버 뉴스 알고리즘 검토위원회는 29일 서울 중구 프레스센터에서 ▲뉴스 검색(랭킹 알고리즘) 서비스 ▲에어스(AiRS) 뉴스 추천 서비스 ▲스포츠 및 연예 서비스 기사 추천 서비스 등 세 가지 항목에서 알고리즘과 학습 데이터 및 서비스 절차 등 검토 결과를 발표하며 이같이 밝혔다. 

검토위는 지난 5월 컴퓨터공학, 정보학, 커뮤니케이션 등 3개 분야 전문가 11명으로 발족했다. 이들은 각 서비스에 대한 데이터 확보 과정과 실제 검색 결과를 결정하는 알고리즘과 반영되는 자질, 이용자에게 서비스가 공개되는 과정, 전체 과정에 대해 수립된 업무 절차의 적절성 등을 검토했다. 

우선 검토위는 뉴스 검색 서비스 영역에서 가이드라인을 기반으로 품질 평가 방향이 정립돼 있다고 평가했다. 네이버 뉴스 랭킹 학습 알고리즘으로는 SVMRank가 사용되고 있으며, 다른 학습 알고리즘을 사용하기에 적합하지 않아 알고리즘 교체보다는 자질 발굴에 초점을 두고 있는 것으로 나타났다. 

맹성현 위원장은 "뉴스검색 결과는 알고리즘을 통해 자동으로 배치되기 때문에 관리자의 개입은 원칙적으로 불가능한 구조"라며 "뉴스 검색 개발-운영-개선에 대한 의사 결정 이력이 모두 기록되고, 이용자 피드백을 수집하고 반영해 실제 이용자들의 검색 품질 만족도를 꾸준히 평가하고 있다"고 밝혔다. 

다만 그는 "사고에 의해 인간이 개입된다면 충분히 있을 수 있는 일이다"며 "그런 경우에는 기록이 남는다. 원칙적으로는 임의의 인간 개입이 있을 수 없다"고 설명했다. 

 ​인공지능 뉴스 콘텐츠 추천 시스템인 AiRS(에어스)는 편집자 개입 없이 자동적으로 뉴스 이용자들의 피드백 데이터를 수집해 학습 데이터를 확보하고 있는 것으로 나타났다. 여기에는 최근 로그인 사용자가 본 뉴스와 기사 생성 후 일정 기간 동안 누적조회수 및 누적 체류시간, 가중치 상위·하위 기사를 긍정적·부정적 학습데이터로 사용했다.  

검토위는 "협력필터(Collaborative Filtering)와 품질모델(Quality Model)을 결합해 이용자의 기사 선호도와 기사 품질을 고려한 개인화된 추천 점수를 계산하는 알고리즘을 활용했다"며 "이용자의 기존 관심사와는 다른 분야의 기사도 함께 추천될 수 있도록 해 확증편향, 즉 '필터버블(Filter Bubbles)' 문제를 최소화하고 있다"고 평가했다. 

연예 및 스포츠 기사 추천 서비스는 뉴스 검색과 달리 최신성과 기사 클릭수 등 피드백 정보를 바탕으로 비(非) 맞춤형 뉴스 추천 서비스를 제공한 것으로 확인됐다. 전문 매체 여부에 따른 가산점, 실시간 업데이트 등 특화된 자질을 사용하고 최신성을 강조했다. 뉴스 서비스와 달리 규칙 기반의 알고리즘을 바탕으로 서비스가 운영됐다. 

맹 위원장은 "뉴스 서비스 전반에 걸친 알고리즘의 공정성 및 투명성과 관련해 발전 방안을 논의한 것은 세계 최초의 시도이며 고무적이다"며 "네이버의 뉴스 서비스 자동화는 공정성과 신뢰성 문제 ·해결을 위한 효율적인 대안으로 평가된다"고 평가했다. 

향후 검토위는 네이버가 학습 데이터 구축 주기를 단축시키고, 다양한 연령층을 포괄하며 고품질 2차 데이터 확보를 위한 빅데이터 주석 작업 체계를 구축해야 한다고 권고했다. '좋은 기사'에 대한 공통 기준을 확립하고, 기사 품질 평가 방법을 개발해 주기적으로 실행한 뒤 결과를 문서화해 전체 서비스에 공유하는 업무 관리체계를 갖출 것도 주문했다.   
 
이 밖에 서비스별로 시스템 개발-운영-평가 과정에서 변화되는 모든 것이 체계적으로 기록·관리되고 부서간 공유될 수 있도록 최고정보책임자(CIO)를 임명하는 등 시스템 구축도 제언했다. 





배너
배너
배너