Crawlers

Overview

WEB上の画像投稿サイトから、画像を自動収集します。

Requirement

Firefox(各サイトへのログイン情報をFirefoxのCookieから取得するため)

Usage

下記のファイル内容をファイルに保存する。

---[sample_dsl.txt]---
# vim:set fileencoding=utf-8 ts=2 sw=2 sts=2 et:

# #: コメント
# /: フォルダ分け(インデントで閉じられたかを判定)
# @: フォルダ分けを伴わない分類(フォルダ分けの閉じタグとしても機能)

#:pixiv --type=renew  --max_page=2 --r18=false
#:pixiv --type=append --max_page=2 --r18=false
:pixiv --type=new    --max_page=2 --r18=false
 /chars
   /ドラゴンボール
     孫悟空 ドラゴンボール
     ベジータ ドラゴンボール
   
   /ドラえもん
     のび太

 /風景画
   山 風景
   海 風景

下記のコマンドを実行する ruby crawlers/bin/fire_all.rb -f sample_dsl.txt
インストール時に指定した画像保存ディレクトリ下のpixiv/search/下に画像が保存される。

Install

my_libにパスを通す

---[~/.bashrc など]---
RUBYLIB=path/to/this/ruby/my_lib

依存するgemをインストール(crawlers/crawlers.gemspecを参照)
画像保存ディレクトリをプログラムに設定

---[~/.mtk/crawlers/config.rb]---
# vim:set fileencoding=utf-8:

require 'pathname'

# monkey patching
class Crawlers::Config
  class << self
    def app_dir
      return Pathname('/home/xxxx/generated_data/crawlers')
    end
  end
end

画像保存ディレクトリを作成 ruby crawlers/bin/installer_crawlers.rb
PixivのサイトにFirefoxでログインする(自動ログインを有効にする)

ログイン後、Firefoxは終了してよい。

Author

MotokiMiyahara

Name		Name	Last commit message	Last commit date
Latest commit History 194 Commits
_external_app_data/massigra/user/mtk		_external_app_data/massigra/user/mtk
browser		browser
crawlers		crawlers
my_lib		my_lib
old		old
spec		spec
win		win
.gitignore		.gitignore
README.md		README.md
Rakefile		Rakefile
memo.txt		memo.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

_external_app_data/massigra/user/mtk

_external_app_data/massigra/user/mtk

browser

browser

crawlers

crawlers

my_lib

my_lib

old

old

spec

spec

win

win

.gitignore

.gitignore

README.md

README.md

Rakefile

Rakefile

memo.txt

memo.txt

Repository files navigation

Crawlers

Requirement

Usage

Install

Author

About

Releases

Packages

Languages

MotokiMiyahara/ruby

Folders and files

Latest commit

History

Repository files navigation

Crawlers

Requirement

Usage

Install

Author

About

Resources

Stars

Watchers

Forks

Languages