PhantomJS와 CasperJS 사용법

프론트앤드 개발을 하거나 웹자동화에 관심이 있는 분이라면 PhantomJSCasperJS를 많이 들어봤을 것입니다.
저도 이번에 크롤링 공부를 하면서 알게되어 잊어버리지 않기위해 간단하게 정리를 하려고 합니다.

PhantomJS (팬텀JS)

tistory-image

팬텀JS는 화면이 없는 브라우저라고 보면 됩니다. 화면이 없는 브라우저를 어따가 써먹지? 라고 생각할 수도 있겠지만 웹프로그램으로 웹자동화를 개발하기에는 더없이 편리한 기능을 제공하고 있습니다.
입력상자에 값을 입력한다던가 마우스로 버튼을 클릭한다던가 특정 값을 확인한다던가 하는 일련의 작업(이벤트)들을 커맨드라인의 명령어나 javascript코드로 처리를 할 수가 있습니다.

예를들면 학교홈페이지에 로그인을 하여 공지사항 페이지로 이동하고 학생들에게만 공지한 공지사항 정보를 발췌하여 리스트에 보여주는 일련의 작업들을 PhantomJS를 통해 웹자동화로 구현하여 처리를 할 수가 있게 됩니다.

물론 이런 기능 말고도 웹 화면을 캡쳐하거나 WebApp을 테스트 하는 등.. 다양한 용도로 사용되는것이 PhantomJS 입니다.

설치

설치는 npm으로 간단하게 설치를 할 수 있습니다. 로컬에 설치를 해도 되지만 일반적으로 Global로 설치를 많이 합니다.

$ npm install -g phantomjs

정상적으로 잘 설치가 되었는지 확인하기 위해서 설치버전을 검색해 봅니다.

$ phantomjs -v
2.1.1

리눅스(CentOS)를 사용한다면 한글폰트의 사용을 위해 아래의 폰트관련 패키지를 별도로 설치해 주어야 합니다.

$ sudo yum install freetype
$ sudo yum install fontconfig

CasperJS (캐스퍼JS)

tistory-image

CasperJSPhantomJSSlimerJS를 좀더 쉽고 편하게 사용하기 위한 기능들을 모아놓은 라이브러리라고 보시면 됩니다.
그래서 CasperJS를 사용하기 위해서는 PhantomJS나 SlimerJS가 먼저 설치가 되어 있어야 합니다.

CasperJSstart()명령어와 run() 명령어 사이의 명령어를 순서대로 처리합니다.
다른 javascript와 마찬가지로 비동기로 처리가 기본이지만 then() 명령어를 사용하면 동기화 처리가 가능하여 위의 명령어가 끝나야지만 다음 명령어를 수행하게 됩니다.

사용에 대한 자세한 설명은 해당 CasperJS 홈페이지를 참조하시면 됩니다.

설치

CasperJS의 설치도 npm으로 간단하게 설치를 할 수 있습니다. 로컬에 설치를 해도 되지만 일반적으로 Global로 설치를 많이 합니다.

$ npm install -g casperjs

예제 프로그램

아래와 같이 몇가지 예제코드를 찾아서 공유 합니다.

CasperJS를 사용하여 Google 검색 결과 캡쳐

//CasperJS 객체 생성
var casper = require('casper').create();

// CasperJS처리 시작
casper.start();

// 화면 사이즈 설정
casper.viewport(1400, 800);

// UserAgent 설정
casper.userAgent('User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36');

// 강아지로 검색
var text = encodeURIComponent("강아지");
casper.open('https://www.google.co.kr/search?q=' + text);

// 화면 캡쳐---- (¦4)
casper.then(function(){
  this.capture('google-capture.png',{
    top:0, left:0, width: 1400, height: 800
  });
});

// 실행개시
casper.run();

페이스북에 로그인해서 이미지들 URL 가져오기

var fs = require('fs')

var casper = require('casper').create({
    pageSettings: {
        loadImages: false, // 이미지 로딩은 하지 않음
        loadPlugins: false, // 플러그인 로딩은 하지 않음
        userAgent: 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/44.0.2403.157 Safari/537.36'
    }
});

//Facebook 열기
casper.start().thenOpen("https://facebook.com", function() {
    console.log("Facebook website opened");
});

//Facebook 로그인
casper.then(function(){
    console.log("해당 id와 pw로 로그인 합니다.");
    this.evaluate(function(){
        document.getElementById("email").value="your_id";
            document.getElementById("pass").value="your_password";
            document.getElementById("loginbutton").children[0].click();
    });
});

//스크린샷 찍고 페이지 저장하기
casper.then(function(){
    console.log("6초 후에 AfterLogin.png 으로 저장됩니다.");
    this.wait(6000, function(){
      this.capture('AfterLogin.png');
      fs.write("./hello.html", this.getHTML(), "w")
    });
});

//이미지 주소 받아오기
casper.then(function(){
    var images = this.evaluate(function(){
        var facebookImages = document.getElementsByTagName('img');
        var allSrc = [];
        for(var i = 0; i < facebookImages.length; i++) {
            if(facebookImages[i].height >= 100 && facebookImages[i].width >= 100)
                allSrc.push(facebookImages[i].src);
        }
        return JSON.stringify(allSrc);
    });
    console.log(images);
})

casper.run();

Similar Posts

  • Angular에서 iframe사용시 unsafe value 에러 해결법

    HTML에서 iframe을 사용할 경우 XSS(Cross Site Scripting) 공격에 대한 방어의 목적으로 SOP( Same Oringin Policy) 정책을 걸어놨습니다. iframe을 이용한 XSS공격은 간단히 설명하면 해커가 어떤 게시판에 글을 작성할때 iframe으로 해킹코드가 있는 문서를 불러오도록 해 놓을 경우 해당 게시물을 열어 보는 대부분의 사용자 정보를 탈취할 수 있게 되는 해킹 기법을 말합니다. 하지만 보안이 검증된 youtube 영상을 불러온다던가 […]

  • 무료로 아이콘 폰트 사용하기 – XEICON 편

    웹사이트를 개발 시 아이콘을 제작하려고 하는데 딱히 디자이너가 없는경우~, 아이콘을 사용하고 싶은데 라이선스를 구매하기 어려운경우~ 이렇때 고맙게도 무료이면서 간단하게 아이콘을 사용할 수 있는 방법이 있습니다. 대표적으로 폰트어썸이 있지만 우리나라에서도 서비스를 해주는 곳이 있습니다. 바로 XEICON 입니다. XEICON XEICON 홈페이지 바로가기 XEICON은 예전에는 제로보드로 이름을 날렸고 현재는 Xpressengine이라는 브랜드네임으로 서비스를 하고 있는 XE프로젝트에서 Fonts형 아이콘 형태로 […]

  • CSS로 그럴듯한 버튼효과를 내보자

    별도의 라이브러리를 사용하지 않고 순수하게 CSS3만을 활용하여 버튼의 효과를 줄 수 있습니다. 급하게 퍼블리싱할때 써먹을 수 있게 정리해 놓겠습니다. 미리보기 BUTTON 1 BUTTON 2 BUTTON 3 BUTTON 4 코드설명 HTML HTML은 기본 버튼을 사용하고 .btn으로 기본속성을 지정하고 .hover로 효과의 형태를 변경하겠습니다. <button class=”btn hover1″> BUTTON 1 </button> <button class=”btn hover2″> BUTTON 2 </button> <button class=”btn […]

  • CSS3의 선택자 정리

    Front-end개발을 한다고 하면서 CSS3를 사용하는데.. 주로 사용하는 선택자들은 쉽게 사용하는데.. 많이 사용하지 않는 선택자에 대해서는 가끔씩 잊어버리거나 사용법을 잊어버리는 경우가 있습니다. 그래서 항상 참조할 수 있게 간단히 정리를 해 보려고 합니다. 선택자는 크게 기본 선택자, 속성 선택자, 상태 선택자로 나눌수 있습니다. 기본 선택자 CSS3를 다루기 위해서는 반드시 알아야 하는 선택자 입니다. 서식 설명 CSS레벨 * […]

  • 회원가입 없이 이용할 수 있는 무료 타자연습 웹사이트 TOP3

    지금이야 키보드를 보지도 않고 사용하지만 저도 예전에는 독수리 타법을 사용했던 적이 있었습니다. 누구나 초보의 시절은 있으닌까요. 저도 컴퓨터 좀 잘 해보고 싶어서 타자연습을 했던 적이 있습니다. 예전에는 주로 타자연습 프로그램을 다운로드 받아서 설치해서 사용했지만 지금은 굳이 그럴필요 없이 인터넷에서 바로 타자연습을 할 수 있는 웹사이트들이 있습니다. 지금 가장 유명한 인터넷 타자연습사이트 TOP 3를 소개하려고 합니다. […]

  • 폰트어썸 (Font Awesome) 아이콘 폰트 사용하기

    아이콘 폰트인 폰트어썸 (Font Awesome)을 사용하는 방법입니다. 아이콘폰트가 무엇인지 궁금하면 이전에 포스팅한 아이콘 폰트(Icon font) 자유자제로 사용하기를 먼저 읽어 보시는 것을 추천합니다. 폰트어썸 (Font Awesome) 폰트어썸 (Font Awesome) 홈페이지 바로가기 폰트어썸은 가장 유명한 대표적인 아이콘폰트 제공 사이트 입니다. 다양한 형태의 아이콘이 빠르게 업데이트되고 있으며 깃헙에서 51000여개의 star를 받고 있을 정도로 사랑을 받고있습니다. 현재 유료서비스를 시도하고 […]

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다