') ], "characters": text.split_html(extr( '

', ''): cnt += 1 yield self._parse_post(post) if not cnt and params["page"] == 1: if self._accept_content_warning(page): continue return if cnt < 18: return params["page"] += 1 def _accept_content_warning(self, page): pos = page.find(' name="_token"') + 1 token, pos = text.extract(page, ' value="', '"', pos) user , pos = text.extract(page, ' value="', '"', pos) if not token or not user: return False data = {"_token": token, "user": user} self.request(self.root + "/~account/warnings/accept", method="POST", data=data, allow_redirects=False) return True class ToyhouseArtExtractor(ToyhouseExtractor): """Extractor for artworks of a toyhouse user""" subcategory = "art" pattern = BASE_PATTERN + r"/([^/?#]+)/art" example = "https://www.toyhou.se/USER/art" def posts(self): return self._pagination("/{}/art".format(self.user)) def metadata(self): return {"user": self.user} class ToyhouseImageExtractor(ToyhouseExtractor): """Extractor for individual toyhouse images""" subcategory = "image" pattern = (r"(?:https?://)?(?:" r"(?:www\.)?toyhou\.se/~images|" r"f\d+\.toyhou\.se/file/[^/?#]+/(?:image|watermark)s" r")/(\d+)") example = "https://toyhou.se/~images/12345" def posts(self): url = "{}/~images/{}".format(self.root, self.user) return (self._parse_post(self.request(url).text, '