ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 초간단! Kinolights의 드라마 리뷰를 쉽게 스크랩하기
    스크래핑 가이드 2024. 2. 21. 18:44

    OTT 시대에 접어들면서, 비디오 플랫폼의 오리지널 콘텐츠가 폭발적으로 증가하면서, 시청자들은 전에 없던 드라마 선택의 다양성을 마주하고 있습니다. 업계 종사자가 시장 추세를 파악하려 할 때, 연구원들이 영화와 TV 문화 현상을 탐구하려 할 때, 또는 일반 시청자가 보는 경험의 풍부함을 추구할 때, 모두가 드라마를 심층 분석함으로써 자신의 필요를 충족시키려 합니다.

     

    Kinolights 소개:
    Kinolights는 국내 온라인 플랫폼으로, 사용자에게 영화 및 드라마 정보, 평점, 추천을 제공합니다. 영화 애호가들에게 새로운 콘텐츠를 발견하고 시청 경험을 공유할 수 있는 공간을 제공합니다. 사용자는 다양한 영화와 드라마의 상세 정보를 탐색할 수 있으며, 이에는 줄거리 요약, 배우 명단, 감독 정보, 사용자 평점 및 리뷰가 포함됩니다.

     

    ScrapeStorm 소개:
    ScrapeStorm은 AI 기술을 적용된 강력한 자동 웹크롤러 입니다.이 소프트웨어는 웹사이트의 중요한 정보를 스마트하게 식별하고 추출합니다. 프로그래밍 경험이 없는 초보자도 데이터 수집을 쉽게 할 수 있습니다.

     

    자세한 과정:
    1. 소프트웨어 다운로드
    ScrapeStorm 공식 홈페이지에서 소프트웨어를 다운로드하고 설치합니다.( 해당 운영 시스템에 맞게 자동 다운로드 됩니다.)
    공홈 링크: https://kr.scrapestorm.com/

     

    2. 새 태스크 만들기
    소프트웨어 홈페이지의 입력란에 Kinolights 드라마 리뷰 웹사이트 주소를 입력하고, 오른쪽의 "스마트 모드"를 클릭합니다.
    Kinolights 링크: https://m.kinolights.com/title/112672/reviews

     

    열린 페이지는 다음과 같습니다:

    TIP: ScrapeStorm 스마트 모드를 사용할 때, 단일 페이지, 목록, 목록+상세 페이지 등 다양한 유형의 웹 페이지에 적용됩니다. 여러 개의 URL을 일괄 수집할 때는 같은 유형의 웹 페이지를 함께 수집하는 것이 좋습니다. 다른 유형의 웹 페이지의 경우, 별도의 수집 작업을 생성하는 것이 좋습니다.

     

    3. 필드 수정 및 추가
    소프트웨어 하단에 이미 자동으로 인식된 데이터 필드를 볼 수 있습니다. 마우스 우클릭하면, 필드 이름 수정, 데이터 처리, 필드 삭제 등의 작업을 할 수 있으며, 오른쪽의 "필드 추가"를 클릭하여 수집하려는 데이터를 추가할 수 있습니다.

     

    4. 스크래핑 시작
    오른쪽 하단의 "스크래핑 시작"을 클릭합니다.

     

    여기선 다양한 수집 작업을 설정할 수 있습니다, 예를 들어 스케줄러, IP 변경, 자동 내보내기, 파일 다운로드 등이 있습니다. 설정을 마친 후 "시작"을 클릭하면 스크래핑 작업이 시작됩니다.

     

    이렇게 실시간으로 수집되고 있는 데이터를 볼 수 있습니다.

     

    5. 스크래핑 결과 내보내기
    모든 데이터 수집이 완료되면, 소프트웨어는 자동으로 팝업을 띄워 "내보내기"또는 "나중에 내보내기"를 선택할 수 있게 합니다.

     

    ScrapeStorm은 Excel, CSV, TXT, HTML 및 데이터베이스 MySQL, SQL Server, PostgreSQL, MongoDB, GoogleSheet 등 다양한 파일 형식을 지원합니다.

     

    이번 글에서는 Excel 파일로 데이터를 내보내겠습니다. 아래 그림은 내보내기한 결과물입니다.

     

    이 글에서 보여준 스크랩 태스크는 댓글에 올려두었으며, 필요하시면 직접 연락주셔도 됩니다.

     

    오늘의 내용은 여기까지입니다. 스크래핑에 대해 궁금한 점이 있거나 더 많은 정보가 필요하다면 언제든지 댓글로 남겨주세요.다음에 또 만나요!

Designed by Tistory.