PhantomJS와 CasperJS 사용법

프론트앤드 개발을 하거나 웹자동화에 관심이 있는 분이라면 PhantomJSCasperJS를 많이 들어봤을 것입니다.
저도 이번에 크롤링 공부를 하면서 알게되어 잊어버리지 않기위해 간단하게 정리를 하려고 합니다.

PhantomJS (팬텀JS)

tistory-image

팬텀JS는 화면이 없는 브라우저라고 보면 됩니다. 화면이 없는 브라우저를 어따가 써먹지? 라고 생각할 수도 있겠지만 웹프로그램으로 웹자동화를 개발하기에는 더없이 편리한 기능을 제공하고 있습니다.
입력상자에 값을 입력한다던가 마우스로 버튼을 클릭한다던가 특정 값을 확인한다던가 하는 일련의 작업(이벤트)들을 커맨드라인의 명령어나 javascript코드로 처리를 할 수가 있습니다.

예를들면 학교홈페이지에 로그인을 하여 공지사항 페이지로 이동하고 학생들에게만 공지한 공지사항 정보를 발췌하여 리스트에 보여주는 일련의 작업들을 PhantomJS를 통해 웹자동화로 구현하여 처리를 할 수가 있게 됩니다.

물론 이런 기능 말고도 웹 화면을 캡쳐하거나 WebApp을 테스트 하는 등.. 다양한 용도로 사용되는것이 PhantomJS 입니다.

설치

설치는 npm으로 간단하게 설치를 할 수 있습니다. 로컬에 설치를 해도 되지만 일반적으로 Global로 설치를 많이 합니다.

$ npm install -g phantomjs

정상적으로 잘 설치가 되었는지 확인하기 위해서 설치버전을 검색해 봅니다.

$ phantomjs -v
2.1.1

리눅스(CentOS)를 사용한다면 한글폰트의 사용을 위해 아래의 폰트관련 패키지를 별도로 설치해 주어야 합니다.

$ sudo yum install freetype
$ sudo yum install fontconfig

CasperJS (캐스퍼JS)

tistory-image

CasperJSPhantomJSSlimerJS를 좀더 쉽고 편하게 사용하기 위한 기능들을 모아놓은 라이브러리라고 보시면 됩니다.
그래서 CasperJS를 사용하기 위해서는 PhantomJS나 SlimerJS가 먼저 설치가 되어 있어야 합니다.

CasperJSstart()명령어와 run() 명령어 사이의 명령어를 순서대로 처리합니다.
다른 javascript와 마찬가지로 비동기로 처리가 기본이지만 then() 명령어를 사용하면 동기화 처리가 가능하여 위의 명령어가 끝나야지만 다음 명령어를 수행하게 됩니다.

사용에 대한 자세한 설명은 해당 CasperJS 홈페이지를 참조하시면 됩니다.

설치

CasperJS의 설치도 npm으로 간단하게 설치를 할 수 있습니다. 로컬에 설치를 해도 되지만 일반적으로 Global로 설치를 많이 합니다.

$ npm install -g casperjs

예제 프로그램

아래와 같이 몇가지 예제코드를 찾아서 공유 합니다.

CasperJS를 사용하여 Google 검색 결과 캡쳐

//CasperJS 객체 생성
var casper = require('casper').create();

// CasperJS처리 시작
casper.start();

// 화면 사이즈 설정
casper.viewport(1400, 800);

// UserAgent 설정
casper.userAgent('User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36');

// 강아지로 검색
var text = encodeURIComponent("강아지");
casper.open('https://www.google.co.kr/search?q=' + text);

// 화면 캡쳐---- (¦4)
casper.then(function(){
  this.capture('google-capture.png',{
    top:0, left:0, width: 1400, height: 800
  });
});

// 실행개시
casper.run();

페이스북에 로그인해서 이미지들 URL 가져오기

var fs = require('fs')

var casper = require('casper').create({
    pageSettings: {
        loadImages: false, // 이미지 로딩은 하지 않음
        loadPlugins: false, // 플러그인 로딩은 하지 않음
        userAgent: 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36'
    }
});

//Facebook 열기
casper.start().thenOpen("https://facebook.com", function() {
    console.log("Facebook website opened");
});

//Facebook 로그인
casper.then(function(){
    console.log("해당 id와 pw로 로그인 합니다.");
    this.evaluate(function(){
        document.getElementById("email").value="your_id";
            document.getElementById("pass").value="your_password";
            document.getElementById("loginbutton").children[0].click();
    });
});

//스크린샷 찍고 페이지 저장하기
casper.then(function(){
    console.log("6초 후에 AfterLogin.png 으로 저장됩니다.");
    this.wait(6000, function(){
      this.capture('AfterLogin.png');
      fs.write("./hello.html", this.getHTML(), "w")
    });
});

//이미지 주소 받아오기
casper.then(function(){
    var images = this.evaluate(function(){
        var facebookImages = document.getElementsByTagName('img');
        var allSrc = [];
        for(var i = 0; i < facebookImages.length; i++) {
            if(facebookImages[i].height >= 100 && facebookImages[i].width >= 100)
                allSrc.push(facebookImages[i].src);
        }
        return JSON.stringify(allSrc);
    });
    console.log(images);
})

casper.run();

Similar Posts

  • 구글 스프레드시트로 캘린더 이벤트 등록하기

    연초가 되어서 내년 계획를 잡던중 회원들의 생년월일을 구글 캘린더에 등록해야 할 일이 생겼습니다. 약 50명의 회원인데.. 일일이 구글 캘린더에 등록을 하려니 “내가 지금 뭘 하고 있는건가??” 라는 자괴감이 들어서 어떻게 편하게 등록할 방법이 없나 찾던중 구글의 쉬트에 작성한 내용을 한번에 구글 캘린더에 등록할 수 있는 방법을 찾아 냈습니다. 저는 약 2일에 걸쳐 프로그램을 해서 현재 […]

  • 내 핸드백을 지키는 확실한 방법 Handbag dyenator

    소매치기로 부터 나의 핸드백을 지키는 확실한 제품이 나왔습니다. 아직 시제품이긴 하지만 상당히 아이디어가 좋습니다. 말레이시아의 업체인 Ash Be Nimble에서 개발을 하였고 제품명은 Handbag Dytonator이라고 합니다. 핸드백 엑세서리 형태로 판매가 된다고 하네요. 사용방법은 내 핸드백이 소매치기를 당했을 경우 핸드폰으로 Handbag Dytonator에게 폭발코드를 문자메시지를 보내면 Handbag Dytonator에 있는 SIM카드가 이것을 인식하여 약 5초 후에 폭발을 한다고 합니다. […]

  • 구글 스프레드시트에서 콤보박스 적용하기

    MS 엑셀을 대체할 만한 제품 중에 구글 스프레드시트는 좋은 대안이 될 수 있습니다. 물론 MS 엑셀의 파워풀한 기능을 모두 사용할 수는 없지만 웬만한 기능은 동일하게 구현이 가능합니다. 더욱이 인터넷만 된다면 어디에서든지 사용할 수 있고 스마트폰에서도 무료로 사용이 가능하기 때문에 상당한 이점이 있습니다. 엑셀의 기능 중에 콤보박스 기능을 구글 스프레드시트에서도 쉽게 구현을 할 수 있습니다.. 콤보박스 […]

  • 폰트어썸 (Font Awesome) 아이콘 폰트 사용하기

    아이콘 폰트인 폰트어썸 (Font Awesome)을 사용하는 방법입니다. 아이콘폰트가 무엇인지 궁금하면 이전에 포스팅한 아이콘 폰트(Icon font) 자유자제로 사용하기를 먼저 읽어 보시는 것을 추천합니다. 폰트어썸 (Font Awesome) 폰트어썸 (Font Awesome) 홈페이지 바로가기 폰트어썸은 가장 유명한 대표적인 아이콘폰트 제공 사이트 입니다. 다양한 형태의 아이콘이 빠르게 업데이트되고 있으며 깃헙에서 51000여개의 star를 받고 있을 정도로 사랑을 받고있습니다. 현재 유료서비스를 시도하고 […]

  • 안전하게 무료로 인터넷 속도와 품질을 확인하는 방법

    인터넷을 사용하다보면 속도가 막~ 느려지는 듯한 느낌이 들 때가 있습니다. 그럴때 인터넷 속도를 한번 확인해 보고 싶을 때가 있는데요. 물론 자신의 ISP회사의 속도측정 웹사이트가 있기는 하지만 자기네 인터넷이다보니 좀 뻥튀기를 시킬 것 같기도 해서 믿음이 별로 잘 가지 않을수 있습니다. 공식적으로 한국정보화진흥원에서 제공하는 속도 측정 웹사이트가 있습니다. 한국정보화진흥원은 국가에서 운영하는 웹사이트라 최소한 뻥튀기는 하지 않을 […]

  • 시놀로지 DSM7.0!! 좋아진 점 5가지

    RAM을 16 Gbyte로 잘못 업그레이드하는 바람에 5개월 동안 개고생 하다가 겨우겨우 복구해서 초기화한 김에 DSM 7.0 베타버전을 설치해 봤습니다. 시놀로지의 장점이라고 한다면 하드웨어에 못지않은 강력한 소프트웨어를 가지고 있다는 것입니다. 그것의 기반이 되는 것이 DSM(DiskStation Manager)인데 2020년까지는 DSM 버전이 6.2였으며 21년도에 7.0으로 오픈을 목적으로 현재 베타 버전을 제공하고 있습니다. 베타버전이기는 하지만 DSM 7.0을 사용해 보면서 느낀 […]

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다