gallery-dl/gallery_dl/extractor/imgcandy.py

# -*- coding: utf-8 -*-

# Copyright 2016 Mike Fährmann
#
# This program is free software; you can redistribute it and/or modify
# it under the terms of the GNU General Public License version 2 as
# published by the Free Software Foundation.

"""Extract images from http://imgcandy.net/"""

from .common import Extractor, Message
from .. import text

class ImgcandyImageExtractor(Extractor):
    """Extractor for single images from imgcandy.net"""
    category = "imgcandy"
    subcategory = "image"
    directory_fmt = ["{category}"]
    filename_fmt = "{filename}"
    pattern = [(r"(?:https?://)?(?:www\.)?imgcandy\.net/img-([a-z0-9]+)"
                r"(?:_(.+))?\.html")]
    test = [("http://imgcandy.net/img-57d02527efee8_test-テスト.png.html", {
        "url": "bc3c9207b10dbfe8e65ccef5b9e3194a7427b4fa",
        "keyword": "381e036374742a091cac7dd7a3eca90ee725afa3",
        "content": "0c8768055e4e20e7c7259608b67799171b691140",
    })]

    def __init__(self, match):
        Extractor.__init__(self)
        self.token, self.filename = match.groups()

    def items(self):
        data = {"category": self.category, "token": self.token}
        params = {"imgContinue": "Continue+to+image+...+"}
        page = self.request("http://imgcandy.net/img-" + self.token + ".html",
                            method="post", data=params).text
        url = text.extract(page, "<img class='centred' src='", "'")[0]
        text.nameext_from_url(self.filename or url, data)
        yield Message.Version, 1
        yield Message.Directory, data
        yield Message.Url, url, data
[imgcandy] add extractor 8 years ago			`# -- coding: utf-8 --`

			`# Copyright 2016 Mike Fährmann`
			`#`
			`# This program is free software; you can redistribute it and/or modify`
			`# it under the terms of the GNU General Public License version 2 as`
			`# published by the Free Software Foundation.`

			`"""Extract images from http://imgcandy.net/"""`

			`from .common import Extractor, Message`
			`from .. import text`

			`class ImgcandyImageExtractor(Extractor):`
			`"""Extractor for single images from imgcandy.net"""`
			`category = "imgcandy"`
consistent extractor naming scheme + docstrings 8 years ago			`subcategory = "image"`
[imgcandy] add extractor 8 years ago			`directory_fmt = ["{category}"]`
			`filename_fmt = "{filename}"`
			`pattern = [(r"(?:https?://)?(?:www\.)?imgcandy\.net/img-([a-z0-9]+)"`
			`r"(?:_(.+))?\.html")]`
			`test = [("http://imgcandy.net/img-57d02527efee8_test-テスト.png.html", {`
			`"url": "bc3c9207b10dbfe8e65ccef5b9e3194a7427b4fa",`
			`"keyword": "381e036374742a091cac7dd7a3eca90ee725afa3",`
			`"content": "0c8768055e4e20e7c7259608b67799171b691140",`
			`})]`

			`def __init__(self, match):`
			`Extractor.__init__(self)`
			`self.token, self.filename = match.groups()`

			`def items(self):`
			`data = {"category": self.category, "token": self.token}`
			`params = {"imgContinue": "Continue+to+image+...+"}`
			`page = self.request("http://imgcandy.net/img-" + self.token + ".html",`
			`method="post", data=params).text`
			`url = text.extract(page, "<img class='centred' src='", "'")[0]`
			`text.nameext_from_url(self.filename or url, data)`
			`yield Message.Version, 1`
			`yield Message.Directory, data`
			`yield Message.Url, url, data`