gallery-dl/test/test_text.py

#!/usr/bin/env python3
# -*- coding: utf-8 -*-

# Copyright 2015-2018 Mike Fährmann
#
# This program is free software; you can redistribute it and/or modify
# it under the terms of the GNU General Public License version 2 as
# published by the Free Software Foundation.

import unittest

from gallery_dl import text


INVALID = ((), [], {}, None, 1, 2.3)
INVALID_ALT = ((), [], {}, None, "")


class TestText(unittest.TestCase):

    def test_clean_xml(self, f=text.clean_xml):
        # standard usage
        self.assertEqual(f(""), "")
        self.assertEqual(f("foo"), "foo")
        self.assertEqual(f("\tfoo\nbar\r"), "\tfoo\nbar\r")
        self.assertEqual(f("<foo>\ab\ba\fr\v</foo>"), "<foo>bar</foo>")

        # 'repl' argument
        repl = "#"
        self.assertEqual(f("", repl), "")
        self.assertEqual(f("foo", repl), "foo")
        self.assertEqual(f("\tfoo\nbar\r", repl), "\tfoo\nbar\r")
        self.assertEqual(
            f("<foo>\ab\ba\fr\v</foo>", repl), "<foo>#b#a#r#</foo>")

        # removal of all illegal control characters
        value = "".join(chr(x) for x in range(32))
        self.assertEqual(f(value), "\t\n\r")

        # 'invalid' arguments
        for value in INVALID:
            self.assertEqual(f(value), "")

    def test_remove_html(self, f=text.remove_html):
        result = "Hello World."

        # standard usage
        self.assertEqual(f(""), "")
        self.assertEqual(f("Hello World."), result)
        self.assertEqual(f(" Hello  World.  "), result)
        self.assertEqual(f("Hello<br/>World."), result)
        self.assertEqual(
            f("<div><b class='a'>Hello</b><i>World.</i></div>"), result)

        # empty HTML
        self.assertEqual(f("<div></div>"), "")
        self.assertEqual(f(" <div>   </div> "), "")

        # malformed HTML
        self.assertEqual(f("<div</div>"), "")
        self.assertEqual(f("<div<Hello World.</div>"), "")

        # invalid arguments
        for value in INVALID:
            self.assertEqual(f(value), "")

    def test_split_html(self, f=text.split_html):
        result = ["Hello", "World."]
        empty = []

        # standard usage
        self.assertEqual(f(""), empty)
        self.assertEqual(f("Hello World."), ["Hello World."])
        self.assertEqual(f(" Hello  World.  "), ["Hello  World."])
        self.assertEqual(f("Hello<br/>World."), result)
        self.assertEqual(f(" Hello <br/> World.  "), result)
        self.assertEqual(
            f("<div><b class='a'>Hello</b><i>World.</i></div>"), result)

        # empty HTML
        self.assertEqual(f("<div></div>"), empty)
        self.assertEqual(f(" <div>   </div> "), empty)

        # malformed HTML
        self.assertEqual(f("<div</div>"), empty)
        self.assertEqual(f("<div<Hello World.</div>"), empty)

        # invalid arguments
        for value in INVALID:
            self.assertEqual(f(value), empty)

    def test_filename_from_url(self, f=text.filename_from_url):
        result = "filename.ext"

        # standard usage
        self.assertEqual(f(""), "")
        self.assertEqual(f("filename.ext"), result)
        self.assertEqual(f("/filename.ext"), result)
        self.assertEqual(f("example.org/filename.ext"), result)
        self.assertEqual(f("http://example.org/v2/filename.ext"), result)
        self.assertEqual(
            f("http://example.org/v2/filename.ext?param=value#frag"), result)

        # invalid arguments
        for value in INVALID:
            self.assertEqual(f(value), "")

    def test_ext_from_url(self, f=text.ext_from_url):
        result = "ext"

        # standard usage
        self.assertEqual(f(""), "")
        self.assertEqual(f("filename.ext"), result)
        self.assertEqual(f("/filename.ext"), result)
        self.assertEqual(f("example.org/filename.ext"), result)
        self.assertEqual(f("http://example.org/v2/filename.ext"), result)
        self.assertEqual(
            f("http://example.org/v2/filename.ext?param=value#frag"), result)

        # invalid arguments
        for value in INVALID:
            self.assertEqual(f(value), "")

    def test_nameext_from_url(self, f=text.nameext_from_url):
        empty = {"filename": "", "extension": ""}
        result = {"filename": "filename", "extension": "ext"}

        # standard usage
        self.assertEqual(f(""), empty)
        self.assertEqual(f("filename.ext"), result)
        self.assertEqual(f("/filename.ext"), result)
        self.assertEqual(f("example.org/filename.ext"), result)
        self.assertEqual(f("http://example.org/v2/filename.ext"), result)
        self.assertEqual(
            f("http://example.org/v2/filename.ext?param=value#frag"), result)

        # invalid arguments
        for value in INVALID:
            self.assertEqual(f(value), empty)

    def test_clean_path_windows(self, f=text.clean_path_windows):
        self.assertEqual(f(""), "")
        self.assertEqual(f("foo"), "foo")
        self.assertEqual(f("foo/bar"), "foo_bar")
        self.assertEqual(f("foo<>:\"\\/|?*bar"), "foo_________bar")

        # invalid arguments
        for value in INVALID:
            self.assertEqual(f(value), "")

    def test_clean_path_posix(self, f=text.clean_path_posix):
        self.assertEqual(f(""), "")
        self.assertEqual(f("foo"), "foo")
        self.assertEqual(f("foo/bar"), "foo_bar")
        self.assertEqual(f("foo<>:\"\\/|?*bar"), "foo<>:\"\\_|?*bar")

        # invalid arguments
        for value in INVALID:
            self.assertEqual(f(value), "")

    def test_extract(self, f=text.extract):
        txt = "<a><b>"
        self.assertEqual(f(txt, "<", ">"), ("a", 3))
        self.assertEqual(f(txt, "X", ">"), (None, 0))
        self.assertEqual(f(txt, "<", "X"), (None, 0))

        # 'pos' argument
        for i in range(1, 4):
            self.assertEqual(f(txt, "<", ">", i), ("b", 6))
        for i in range(4, 10):
            self.assertEqual(f(txt, "<", ">", i), (None, i))

        # invalid arguments
        for value in INVALID:
            self.assertEqual(f(value   , "<"  , ">")  , (None, 0))
            self.assertEqual(f(txt, value, ">")  , (None, 0))
            self.assertEqual(f(txt, "<"  , value), (None, 0))

    def test_extract_all(self, f=text.extract_all):
        txt = "[c][b][a]: xyz! [d][e"

        self.assertEqual(
            f(txt, ()), ({}, 0))
        self.assertEqual(
            f(txt, (("C", "[", "]"), ("B", "[", "]"), ("A", "[", "]"))),
            ({"A": "a", "B": "b", "C": "c"}, 9),
        )

        # 'None' as field name
        self.assertEqual(
            f(txt, ((None, "[", "]"), (None, "[", "]"), ("A", "[", "]"))),
            ({"A": "a"}, 9),
        )
        self.assertEqual(
            f(txt, ((None, "[", "]"), (None, "[", "]"), (None, "[", "]"))),
            ({}, 9),
        )

        # failed matches
        self.assertEqual(
            f(txt, (("C", "[", "]"), ("X", "X", "X"), ("B", "[", "]"))),
            ({"B": "b", "C": "c", "X": None}, 6),
        )

        # 'pos' argument
        self.assertEqual(
            f(txt, (("B", "[", "]"), ("A", "[", "]")), pos=1),
            ({"A": "a", "B": "b"}, 9),
        )

        # 'values' argument
        self.assertEqual(
            f(txt, (("C", "[", "]"),), values={"A": "a", "B": "b"}),
            ({"A": "a", "B": "b", "C": "c"}, 3),
        )

        vdict = {}
        rdict, pos = f(txt, (), values=vdict)
        self.assertIs(vdict, rdict)

    def test_extract_iter(self, f=text.extract_iter):
        txt = "[c][b][a]: xyz! [d][e"

        def g(*args):
            return list(f(*args))

        self.assertEqual(
            g("", "[", "]"), [])
        self.assertEqual(
            g("[a]", "[", "]"), ["a"])
        self.assertEqual(
            g(txt, "[", "]"), ["c", "b", "a", "d"])
        self.assertEqual(
            g(txt, "X", "X"), [])
        self.assertEqual(
            g(txt, "[", "]", 6), ["a", "d"])

    def test_extract_from(self, f=text.extract_from):
        txt = "[c][b][a]: xyz! [d][e"

        e = f(txt)
        self.assertEqual(e("[", "]"), "c")
        self.assertEqual(e("[", "]"), "b")
        self.assertEqual(e("[", "]"), "a")
        self.assertEqual(e("[", "]"), "d")
        self.assertEqual(e("[", "]"), "")
        self.assertEqual(e("[", "]"), "")

        e = f(txt, pos=6, default="END")
        self.assertEqual(e("[", "]"), "a")
        self.assertEqual(e("[", "]"), "d")
        self.assertEqual(e("[", "]"), "END")
        self.assertEqual(e("[", "]"), "END")

    def test_parse_bytes(self, f=text.parse_bytes):
        self.assertEqual(f("0"), 0)
        self.assertEqual(f("50"), 50)
        self.assertEqual(f("50k"), 50 * 1024**1)
        self.assertEqual(f("50m"), 50 * 1024**2)
        self.assertEqual(f("50g"), 50 * 1024**3)
        self.assertEqual(f("50t"), 50 * 1024**4)
        self.assertEqual(f("50p"), 50 * 1024**5)

        # fractions
        self.assertEqual(f("123.456"), 123)
        self.assertEqual(f("123.567"), 124)
        self.assertEqual(f("0.5M"), round(0.5 * 1024**2))

        # invalid arguments
        for value in INVALID_ALT:
            self.assertEqual(f(value), 0)
        self.assertEqual(f("NaN"), 0)
        self.assertEqual(f("invalid"), 0)
        self.assertEqual(f(" 123 kb "), 0)

    def test_parse_int(self, f=text.parse_int):
        self.assertEqual(f(0), 0)
        self.assertEqual(f("0"), 0)
        self.assertEqual(f(123), 123)
        self.assertEqual(f("123"), 123)

        # invalid arguments
        for value in INVALID_ALT:
            self.assertEqual(f(value), 0)
        self.assertEqual(f("123.456"), 0)
        self.assertEqual(f("zzz"), 0)
        self.assertEqual(f([1, 2, 3]), 0)
        self.assertEqual(f({1: 2, 3: 4}), 0)

        # 'default' argument
        default = "default"
        for value in INVALID_ALT:
            self.assertEqual(f(value, default), default)
        self.assertEqual(f("zzz", default), default)

    def test_parse_float(self, f=text.parse_float):
        self.assertEqual(f(0), 0.0)
        self.assertEqual(f("0"), 0.0)
        self.assertEqual(f(123), 123.0)
        self.assertEqual(f("123"), 123.0)
        self.assertEqual(f(123.456), 123.456)
        self.assertEqual(f("123.456"), 123.456)

        # invalid arguments
        for value in INVALID_ALT:
            self.assertEqual(f(value), 0.0)
        self.assertEqual(f("zzz"), 0.0)
        self.assertEqual(f([1, 2, 3]), 0.0)
        self.assertEqual(f({1: 2, 3: 4}), 0.0)

        # 'default' argument
        default = "default"
        for value in INVALID_ALT:
            self.assertEqual(f(value, default), default)
        self.assertEqual(f("zzz", default), default)

    def test_parse_query(self, f=text.parse_query):
        # standard usage
        self.assertEqual(f(""), {})
        self.assertEqual(f("foo=1"), {"foo": "1"})
        self.assertEqual(f("foo=1&bar=2"), {"foo": "1", "bar": "2"})

        # missing value
        self.assertEqual(f("bar"), {})
        self.assertEqual(f("foo=1&bar"), {"foo": "1"})
        self.assertEqual(f("foo=1&bar&baz=3"), {"foo": "1", "baz": "3"})

        # keys with identical names
        self.assertEqual(f("foo=1&foo=2"), {"foo": "1"})
        self.assertEqual(
            f("foo=1&bar=2&foo=3&bar=4"),
            {"foo": "1", "bar": "2"},
        )

        # invalid arguments
        for value in INVALID:
            self.assertEqual(f(value), {})


if __name__ == '__main__':
    unittest.main()
add tests for text-module 9 years ago			`#!/usr/bin/env python3`
			`# -- coding: utf-8 --`

add tests for 'text.clean_xml()' and improve it 7 years ago			`# Copyright 2015-2018 Mike Fährmann`
add tests for text-module 9 years ago			`#`
			`# This program is free software; you can redistribute it and/or modify`
			`# it under the terms of the GNU General Public License version 2 as`
			`# published by the Free Software Foundation.`

			`import unittest`
add tests for 'text.clean_xml()' and improve it 7 years ago
			`from gallery_dl import text`
add tests for text-module 9 years ago
code adjustments according to pep8 8 years ago
rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago			`INVALID = ((), [], {}, None, 1, 2.3)`
rename safe_int to parse_int; move parse_* to text module 7 years ago			`INVALID_ALT = ((), [], {}, None, "")`
rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago

add tests for text-module 9 years ago			`class TestText(unittest.TestCase):`

add tests for 'text.clean_xml()' and improve it 7 years ago			`def test_clean_xml(self, f=text.clean_xml):`
			`# standard usage`
			`self.assertEqual(f(""), "")`
			`self.assertEqual(f("foo"), "foo")`
			`self.assertEqual(f("\tfoo\nbar\r"), "\tfoo\nbar\r")`
			`self.assertEqual(f("<foo>\ab\ba\fr\v</foo>"), "<foo>bar</foo>")`

			`# 'repl' argument`
			`repl = "#"`
			`self.assertEqual(f("", repl), "")`
			`self.assertEqual(f("foo", repl), "foo")`
			`self.assertEqual(f("\tfoo\nbar\r", repl), "\tfoo\nbar\r")`
			`self.assertEqual(`
			`f("<foo>\ab\ba\fr\v</foo>", repl), "<foo>#b#a#r#</foo>")`

			`# removal of all illegal control characters`
			`value = "".join(chr(x) for x in range(32))`
			`self.assertEqual(f(value), "\t\n\r")`

			`# 'invalid' arguments`
rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago			`for value in INVALID:`
add tests for 'text.clean_xml()' and improve it 7 years ago			`self.assertEqual(f(value), "")`

rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago			`def test_remove_html(self, f=text.remove_html):`
add tests for text-module 9 years ago			`result = "Hello World."`
rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago
			`# standard usage`
			`self.assertEqual(f(""), "")`
			`self.assertEqual(f("Hello World."), result)`
			`self.assertEqual(f(" Hello World. "), result)`
			`self.assertEqual(f("Hello<br/>World."), result)`
			`self.assertEqual(`
			`f("<div><b class='a'>Hello</b><i>World.</i></div>"), result)`

			`# empty HTML`
			`self.assertEqual(f("<div></div>"), "")`
			`self.assertEqual(f(" <div> </div> "), "")`

			`# malformed HTML`
			`self.assertEqual(f("<div</div>"), "")`
			`self.assertEqual(f("<div<Hello World.</div>"), "")`

			`# invalid arguments`
			`for value in INVALID:`
			`self.assertEqual(f(value), "")`

implement text.split_html() 6 years ago			`def test_split_html(self, f=text.split_html):`
			`result = ["Hello", "World."]`
			`empty = []`

			`# standard usage`
			`self.assertEqual(f(""), empty)`
			`self.assertEqual(f("Hello World."), ["Hello World."])`
add 'text.parse_float()' + cleanup in text.py 6 years ago			`self.assertEqual(f(" Hello World. "), ["Hello World."])`
implement text.split_html() 6 years ago			`self.assertEqual(f("Hello<br/>World."), result)`
add 'text.parse_float()' + cleanup in text.py 6 years ago			`self.assertEqual(f(" Hello <br/> World. "), result)`
implement text.split_html() 6 years ago			`self.assertEqual(`
			`f("<div><b class='a'>Hello</b><i>World.</i></div>"), result)`

			`# empty HTML`
			`self.assertEqual(f("<div></div>"), empty)`
			`self.assertEqual(f(" <div> </div> "), empty)`

			`# malformed HTML`
			`self.assertEqual(f("<div</div>"), empty)`
			`self.assertEqual(f("<div<Hello World.</div>"), empty)`

			`# invalid arguments`
			`for value in INVALID:`
			`self.assertEqual(f(value), empty)`

rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago			`def test_filename_from_url(self, f=text.filename_from_url):`
add tests for text-module 9 years ago			`result = "filename.ext"`
add helper method to text module 9 years ago
rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago			`# standard usage`
			`self.assertEqual(f(""), "")`
			`self.assertEqual(f("filename.ext"), result)`
			`self.assertEqual(f("/filename.ext"), result)`
			`self.assertEqual(f("example.org/filename.ext"), result)`
add 'ext_from_url' to text.py 6 years ago			`self.assertEqual(f("http://example.org/v2/filename.ext"), result)`
			`self.assertEqual(`
			`f("http://example.org/v2/filename.ext?param=value#frag"), result)`

			`# invalid arguments`
			`for value in INVALID:`
			`self.assertEqual(f(value), "")`

			`def test_ext_from_url(self, f=text.ext_from_url):`
			`result = "ext"`

			`# standard usage`
			`self.assertEqual(f(""), "")`
			`self.assertEqual(f("filename.ext"), result)`
			`self.assertEqual(f("/filename.ext"), result)`
			`self.assertEqual(f("example.org/filename.ext"), result)`
rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago			`self.assertEqual(f("http://example.org/v2/filename.ext"), result)`
			`self.assertEqual(`
			`f("http://example.org/v2/filename.ext?param=value#frag"), result)`

			`# invalid arguments`
			`for value in INVALID:`
			`self.assertEqual(f(value), "")`

			`def test_nameext_from_url(self, f=text.nameext_from_url):`
change results of text.nameext_from_url() Instead of getting a complete 'filename' from an URL and splitting that into 'name' and 'extension', the new approach gets rid of the complete version and renames 'name' to 'filename'. (Using anything other than {extension} for a filename extension doesn't really work anyway) Example: "https://example.org/path/filename.ext" before: - filename : filename.ext - name : filename - extension: ext now: - filename : filename - extension: ext 6 years ago			`empty = {"filename": "", "extension": ""}`
			`result = {"filename": "filename", "extension": "ext"}`
rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago
			`# standard usage`
			`self.assertEqual(f(""), empty)`
			`self.assertEqual(f("filename.ext"), result)`
			`self.assertEqual(f("/filename.ext"), result)`
			`self.assertEqual(f("example.org/filename.ext"), result)`
			`self.assertEqual(f("http://example.org/v2/filename.ext"), result)`
			`self.assertEqual(`
			`f("http://example.org/v2/filename.ext?param=value#frag"), result)`

			`# invalid arguments`
			`for value in INVALID:`
			`self.assertEqual(f(value), empty)`

			`def test_clean_path_windows(self, f=text.clean_path_windows):`
			`self.assertEqual(f(""), "")`
			`self.assertEqual(f("foo"), "foo")`
			`self.assertEqual(f("foo/bar"), "foo_bar")`
			`self.assertEqual(f("foo<>:\"\\/\|?*bar"), "foo_________bar")`

			`# invalid arguments`
			`for value in INVALID:`
			`self.assertEqual(f(value), "")`

			`def test_clean_path_posix(self, f=text.clean_path_posix):`
			`self.assertEqual(f(""), "")`
			`self.assertEqual(f("foo"), "foo")`
			`self.assertEqual(f("foo/bar"), "foo_bar")`
			`self.assertEqual(f("foo<>:\"\\/\|?bar"), "foo<>:\"\\_\|?bar")`

			`# invalid arguments`
			`for value in INVALID:`
			`self.assertEqual(f(value), "")`
add tests for text-module 9 years ago
rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago			`def test_extract(self, f=text.extract):`
			`txt = "<a><b>"`
			`self.assertEqual(f(txt, "<", ">"), ("a", 3))`
			`self.assertEqual(f(txt, "X", ">"), (None, 0))`
			`self.assertEqual(f(txt, "<", "X"), (None, 0))`

			`# 'pos' argument`
			`for i in range(1, 4):`
			`self.assertEqual(f(txt, "<", ">", i), ("b", 6))`
			`for i in range(4, 10):`
			`self.assertEqual(f(txt, "<", ">", i), (None, i))`

			`# invalid arguments`
			`for value in INVALID:`
			`self.assertEqual(f(value , "<" , ">") , (None, 0))`
			`self.assertEqual(f(txt, value, ">") , (None, 0))`
			`self.assertEqual(f(txt, "<" , value), (None, 0))`

			`def test_extract_all(self, f=text.extract_all):`
more tests 9 years ago			`txt = "[c][b][a]: xyz! [d][e"`

improve 'parse_query()' and add tests - another irrelevant micro-optimization ! - use urllib.parse.parse_qsl directly instead of parse_qs, which just packs the results of parse_qsl in a different data structure - reduced memory requirements since no additional dict and lists are created 7 years ago			`self.assertEqual(`
rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago			`f(txt, ()), ({}, 0))`
improve 'parse_query()' and add tests - another irrelevant micro-optimization ! - use urllib.parse.parse_qsl directly instead of parse_qs, which just packs the results of parse_qsl in a different data structure - reduced memory requirements since no additional dict and lists are created 7 years ago			`self.assertEqual(`
rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago			`f(txt, (("C", "[", "]"), ("B", "[", "]"), ("A", "[", "]"))),`
			`({"A": "a", "B": "b", "C": "c"}, 9),`
			`)`

			`# 'None' as field name`
			`self.assertEqual(`
			`f(txt, ((None, "[", "]"), (None, "[", "]"), ("A", "[", "]"))),`
			`({"A": "a"}, 9),`
			`)`
			`self.assertEqual(`
			`f(txt, ((None, "[", "]"), (None, "[", "]"), (None, "[", "]"))),`
			`({}, 9),`
			`)`

			`# failed matches`
improve 'parse_query()' and add tests - another irrelevant micro-optimization ! - use urllib.parse.parse_qsl directly instead of parse_qs, which just packs the results of parse_qsl in a different data structure - reduced memory requirements since no additional dict and lists are created 7 years ago			`self.assertEqual(`
rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago			`f(txt, (("C", "[", "]"), ("X", "X", "X"), ("B", "[", "]"))),`
			`({"B": "b", "C": "c", "X": None}, 6),`
			`)`
improve 'parse_query()' and add tests - another irrelevant micro-optimization ! - use urllib.parse.parse_qsl directly instead of parse_qs, which just packs the results of parse_qsl in a different data structure - reduced memory requirements since no additional dict and lists are created 7 years ago
rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago			`# 'pos' argument`
improve 'parse_query()' and add tests - another irrelevant micro-optimization ! - use urllib.parse.parse_qsl directly instead of parse_qs, which just packs the results of parse_qsl in a different data structure - reduced memory requirements since no additional dict and lists are created 7 years ago			`self.assertEqual(`
rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago			`f(txt, (("B", "[", "]"), ("A", "[", "]")), pos=1),`
			`({"A": "a", "B": "b"}, 9),`
			`)`

			`# 'values' argument`
			`self.assertEqual(`
			`f(txt, (("C", "[", "]"),), values={"A": "a", "B": "b"}),`
			`({"A": "a", "B": "b", "C": "c"}, 3),`
			`)`

			`vdict = {}`
			`rdict, pos = f(txt, (), values=vdict)`
			`self.assertIs(vdict, rdict)`

			`def test_extract_iter(self, f=text.extract_iter):`
			`txt = "[c][b][a]: xyz! [d][e"`

			`def g(*args):`
			`return list(f(*args))`

improve 'parse_query()' and add tests - another irrelevant micro-optimization ! - use urllib.parse.parse_qsl directly instead of parse_qs, which just packs the results of parse_qsl in a different data structure - reduced memory requirements since no additional dict and lists are created 7 years ago			`self.assertEqual(`
rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago			`g("", "[", "]"), [])`
improve 'parse_query()' and add tests - another irrelevant micro-optimization ! - use urllib.parse.parse_qsl directly instead of parse_qs, which just packs the results of parse_qsl in a different data structure - reduced memory requirements since no additional dict and lists are created 7 years ago			`self.assertEqual(`
rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago			`g("[a]", "[", "]"), ["a"])`
			`self.assertEqual(`
			`g(txt, "[", "]"), ["c", "b", "a", "d"])`
			`self.assertEqual(`
			`g(txt, "X", "X"), [])`
			`self.assertEqual(`
			`g(txt, "[", "]", 6), ["a", "d"])`

implement convenience wrapper for text.extract functionality 6 years ago			`def test_extract_from(self, f=text.extract_from):`
			`txt = "[c][b][a]: xyz! [d][e"`

			`e = f(txt)`
			`self.assertEqual(e("[", "]"), "c")`
			`self.assertEqual(e("[", "]"), "b")`
			`self.assertEqual(e("[", "]"), "a")`
			`self.assertEqual(e("[", "]"), "d")`
			`self.assertEqual(e("[", "]"), "")`
			`self.assertEqual(e("[", "]"), "")`

			`e = f(txt, pos=6, default="END")`
			`self.assertEqual(e("[", "]"), "a")`
			`self.assertEqual(e("[", "]"), "d")`
			`self.assertEqual(e("[", "]"), "END")`
			`self.assertEqual(e("[", "]"), "END")`

rename safe_int to parse_int; move parse_* to text module 7 years ago			`def test_parse_bytes(self, f=text.parse_bytes):`
			`self.assertEqual(f("0"), 0)`
			`self.assertEqual(f("50"), 50)`
			`self.assertEqual(f("50k"), 50 * 1024**1)`
			`self.assertEqual(f("50m"), 50 * 1024**2)`
			`self.assertEqual(f("50g"), 50 * 1024**3)`
			`self.assertEqual(f("50t"), 50 * 1024**4)`
			`self.assertEqual(f("50p"), 50 * 1024**5)`

			`# fractions`
			`self.assertEqual(f("123.456"), 123)`
			`self.assertEqual(f("123.567"), 124)`
			`self.assertEqual(f("0.5M"), round(0.5 * 1024**2))`

			`# invalid arguments`
			`for value in INVALID_ALT:`
			`self.assertEqual(f(value), 0)`
			`self.assertEqual(f("NaN"), 0)`
			`self.assertEqual(f("invalid"), 0)`
			`self.assertEqual(f(" 123 kb "), 0)`

			`def test_parse_int(self, f=text.parse_int):`
			`self.assertEqual(f(0), 0)`
			`self.assertEqual(f("0"), 0)`
			`self.assertEqual(f(123), 123)`
			`self.assertEqual(f("123"), 123)`

			`# invalid arguments`
			`for value in INVALID_ALT:`
			`self.assertEqual(f(value), 0)`
			`self.assertEqual(f("123.456"), 0)`
			`self.assertEqual(f("zzz"), 0)`
			`self.assertEqual(f([1, 2, 3]), 0)`
			`self.assertEqual(f({1: 2, 3: 4}), 0)`

			`# 'default' argument`
			`default = "default"`
			`for value in INVALID_ALT:`
			`self.assertEqual(f(value, default), default)`
			`self.assertEqual(f("zzz", default), default)`

add 'text.parse_float()' + cleanup in text.py 6 years ago			`def test_parse_float(self, f=text.parse_float):`
			`self.assertEqual(f(0), 0.0)`
			`self.assertEqual(f("0"), 0.0)`
			`self.assertEqual(f(123), 123.0)`
			`self.assertEqual(f("123"), 123.0)`
			`self.assertEqual(f(123.456), 123.456)`
			`self.assertEqual(f("123.456"), 123.456)`

			`# invalid arguments`
			`for value in INVALID_ALT:`
			`self.assertEqual(f(value), 0.0)`
			`self.assertEqual(f("zzz"), 0.0)`
			`self.assertEqual(f([1, 2, 3]), 0.0)`
			`self.assertEqual(f({1: 2, 3: 4}), 0.0)`

			`# 'default' argument`
			`default = "default"`
			`for value in INVALID_ALT:`
			`self.assertEqual(f(value, default), default)`
			`self.assertEqual(f("zzz", default), default)`

rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago			`def test_parse_query(self, f=text.parse_query):`
			`# standard usage`
			`self.assertEqual(f(""), {})`
			`self.assertEqual(f("foo=1"), {"foo": "1"})`
			`self.assertEqual(f("foo=1&bar=2"), {"foo": "1", "bar": "2"})`

			`# missing value`
			`self.assertEqual(f("bar"), {})`
			`self.assertEqual(f("foo=1&bar"), {"foo": "1"})`
			`self.assertEqual(f("foo=1&bar&baz=3"), {"foo": "1", "baz": "3"})`
improve 'parse_query()' and add tests - another irrelevant micro-optimization ! - use urllib.parse.parse_qsl directly instead of parse_qs, which just packs the results of parse_qsl in a different data structure - reduced memory requirements since no additional dict and lists are created 7 years ago
			`# keys with identical names`
rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago			`self.assertEqual(f("foo=1&foo=2"), {"foo": "1"})`
improve 'parse_query()' and add tests - another irrelevant micro-optimization ! - use urllib.parse.parse_qsl directly instead of parse_qs, which just packs the results of parse_qsl in a different data structure - reduced memory requirements since no additional dict and lists are created 7 years ago			`self.assertEqual(`
rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago			`f("foo=1&bar=2&foo=3&bar=4"),`
improve 'parse_query()' and add tests - another irrelevant micro-optimization ! - use urllib.parse.parse_qsl directly instead of parse_qs, which just packs the results of parse_qsl in a different data structure - reduced memory requirements since no additional dict and lists are created 7 years ago			`{"foo": "1", "bar": "2"},`
			`)`

rewrite text tests and improve functions - test more edge cases - consistently return an empty string for invalid arguments - remove the ungreedy-flag in 'remove_html()' 7 years ago			`# invalid arguments`
			`for value in INVALID:`
			`self.assertEqual(f(value), {})`
improve 'parse_query()' and add tests - another irrelevant micro-optimization ! - use urllib.parse.parse_qsl directly instead of parse_qs, which just packs the results of parse_qsl in a different data structure - reduced memory requirements since no additional dict and lists are created 7 years ago
code adjustments according to pep8 8 years ago
add tests for text-module 9 years ago			`if __name__ == '__main__':`
			`unittest.main()`