데이터 소개
Komunity가 수집·분석하는 데이터의 범위와 방법론을 소개합니다.
데이터 수집 범위
- • 국내 주요 종합일간지, 방송사, 통신사의 공개 기사를 대상으로 합니다.
- • RSS, 사이트맵, 기사 목록 페이지를 통해 수집합니다.
- • 기사 제목, 기자명, 발행일, 섹션, 본문 요약 등 메타데이터를 정리합니다.
- • 수집 주기는 언론사별로 10분~1시간 단위입니다.
지표 정의
기사 수
특정 기간 내 해당 기자 또는 언론사가 발행한 기사의 수입니다.
주제 다양성
기자가 다루는 주제의 분포도를 나타냅니다. 다양한 주제를 고르게 다룰수록 높은 값을 가집니다.
활동 지속성
최근 30일 중 기사를 발행한 일수의 비율입니다. (발행일 수 / 30)
반응 지표
조회수, 댓글 수 등 공개된 반응 데이터의 평균값입니다. 언론사에 따라 수집 가능 범위가 다릅니다.
한계와 주의사항
- • 자동 수집 및 분류 결과이므로 오차가 포함될 수 있습니다.
- • 기자명 동명이인, 공동 기사, 통신사 재배포 기사 등으로 인한 매핑 오류가 발생할 수 있습니다.
- • 반응 지표(조회수, 댓글 수)는 언론사별 공개 범위에 따라 제한적입니다.
- • 주제 분류는 자동 분류 모델에 의한 것으로, 실제와 다를 수 있습니다.
- • 본 서비스는 기자나 언론사에 대한 가치 판단을 하지 않습니다.
- • 모든 데이터는 공개된 기사 정보에 기반하며, 비공개 정보는 수집하지 않습니다.
정정 요청
데이터 오류를 발견하셨거나 정정을 요청하시려면 아래 이메일로 연락해 주세요. 기자명 매핑 오류, 기사 정보 오류, 비노출 요청 등을 처리합니다.
개인정보처리방침
Komunity는 공개된 기사 데이터만을 수집하며, 기자의 개인 연락처나 사적 정보는 수집하지 않습니다. 서비스 이용 과정에서 수집되는 접속 로그 등의 정보는 서비스 개선 목적으로만 활용됩니다.