데이터 소개

Komunity가 수집·분석하는 데이터의 범위와 방법론을 소개합니다.

데이터 수집 범위

  • • 국내 주요 종합일간지, 방송사, 통신사의 공개 기사를 대상으로 합니다.
  • • RSS, 사이트맵, 기사 목록 페이지를 통해 수집합니다.
  • • 기사 제목, 기자명, 발행일, 섹션, 본문 요약 등 메타데이터를 정리합니다.
  • • 수집 주기는 언론사별로 10분~1시간 단위입니다.

지표 정의

기사 수

특정 기간 내 해당 기자 또는 언론사가 발행한 기사의 수입니다.

주제 다양성

기자가 다루는 주제의 분포도를 나타냅니다. 다양한 주제를 고르게 다룰수록 높은 값을 가집니다.

활동 지속성

최근 30일 중 기사를 발행한 일수의 비율입니다. (발행일 수 / 30)

반응 지표

조회수, 댓글 수 등 공개된 반응 데이터의 평균값입니다. 언론사에 따라 수집 가능 범위가 다릅니다.

한계와 주의사항

  • • 자동 수집 및 분류 결과이므로 오차가 포함될 수 있습니다.
  • • 기자명 동명이인, 공동 기사, 통신사 재배포 기사 등으로 인한 매핑 오류가 발생할 수 있습니다.
  • • 반응 지표(조회수, 댓글 수)는 언론사별 공개 범위에 따라 제한적입니다.
  • • 주제 분류는 자동 분류 모델에 의한 것으로, 실제와 다를 수 있습니다.
  • • 본 서비스는 기자나 언론사에 대한 가치 판단을 하지 않습니다.
  • • 모든 데이터는 공개된 기사 정보에 기반하며, 비공개 정보는 수집하지 않습니다.

정정 요청

데이터 오류를 발견하셨거나 정정을 요청하시려면 아래 이메일로 연락해 주세요. 기자명 매핑 오류, 기사 정보 오류, 비노출 요청 등을 처리합니다.

[email protected]

개인정보처리방침

Komunity는 공개된 기사 데이터만을 수집하며, 기자의 개인 연락처나 사적 정보는 수집하지 않습니다. 서비스 이용 과정에서 수집되는 접속 로그 등의 정보는 서비스 개선 목적으로만 활용됩니다.