2023년 인기 주택 정보를 스크래평하는 방법
주택 정보를 찾을 때 이러한 방대한 양의 주택 정보를 어떻게 한 번에 수집 및 요약해야 할까요? 오늘은 ScrapeStorm(AI 기반 웹크롤링 툴 & 데이터 추출기 | ScrapeStorm)이라는 무료 웹 데이터 자동 수집 소프트웨어로 국내 인기 아파트 정보 사이트 Naver 부동산을 수집하는 방법을 알려드리겠습니다. 1. 태스크 만들기 수집할 웹 페이지 링크를 입력 상자에 복사하고 오른쪽에 있는 “스마트 모드” 버튼을 클릭하면 ScrapeStorm이 스마트 모드 태스크를 자동으로 설정하고 페이지에 있는 데이터를 자동으로 인식합니다. 2. 태스크 설정하기 태스크를 만든 후 소프트웨어는 현재 리스트 페이지의 데이터를 자동으로 식별하고 필요에 따라 필드를 조정할 수 있습니다. 여기 소프트웨어는 이미 페이지에 있는 주택 유형, 주소, 가격 책정 등의 데이터를 자동으로 인식했습니다. “심층 스크래핑” 기능을 사용하여 상세 페이지의 데이터를 수집할 수 있습니다. 여기에서 소프트웨어는 각 주택의 해당 상세 페이지에 대한 링크를 자동으로 식별했으며 “소재지 링크”열의 “상세 페이지로 이동” 버튼을 클릭하면 각 주택의 특정 정보가 포함된 페이지에 들어가 데이터를 수집할 수 있습니다. 필요에 따라 상세 페이지에서 필드를 수동으로 추가할 수 있습니다. 3. 태스크 시작하기 모든 데이터가 정리되면 스크래핑 시작 버튼을 클릭하면 구체적인 스크래핑 조건을 설정할 수 있습니다. 스케쥴러, 스마트 정책, 자동 추출, 파일 다운로드 등 다양한 기능 설정을 포함합니다. 설정이 완료되면 시작 버튼을 클릭하여 실행을 시작할 수 있으며 실행 페이지에서 상세한 스크래핑 상활을 볼 수 있습니다. 4. 데이터 내보내기 모든 데이터가 수집되면 소프트웨어가 자동으로 힌트를 보내므로 데이터를 바로 내보내거나 나중에 내보내도록 선택할 수 있습니다. 내보내기 유형에는 Excel, CSV, TXT, HTML 및 데이터베이스 MySQL, SQL Server, PostgreSQL, MongoDB, 그리고 Google Sheet가 포함되며 필요에 따라 적절한 데이터 내보내기 유형을 선택하시면 됩니다. 아래의 사진은 Excel로 내보낸 데이터 스크래핑 결과물입니다~ 페이지에서 볼 수 있는 데이터만 ScrapeStorm은 더 스크랩할 수 있습니다. 막강한 기능을 가지고 있는 동시에 모료로 사용할 수 있습니다. 이 튜토리얼을 따라서 한번 사용해 보세요~