H.1. data_generator#
H.1. data_generator #
H.1.1. Обзор #
data_generator — это скрипт на Python, который сгенерирует для вас фейковые данные.
usage: populate.py [-h] --table {address,city,country,first_name,last_name,company,email,iban,lorem_ipsum,postcode}
[{address,city,country,first_name,last_name,company,email,iban,lorem_ipsum,postcode} ...] [--locales LOCALES] --output_dir OUTPUT_DIR
[--lines LINES] [--seed SEED]
Внутри скрипта используется библиотека Faker
Чтобы создать 5000 писем на русском и английском языках, вызовите скрипт следующим образом:
populate.py --table country email --locales ru_RU,en --lines 5000 --output_dir out
Это выведет фальшивые данные в формате CSV.
Используйте populate.py --help для получения более подробной информации о параметрах скрипта.
Вы можете загрузить фейковые данные непосредственно в расширение следующим образом:
TRUNCATE transp_anon.email;
COPY transp_anon.email
FROM
PROGRAM 'populate.py --table country email --locales ru_RU,en --lines 5000 --output_dir out';
SELECT setval('transp_anon.email_oid_seq', max(oid))
FROM transp_anon.email;
CLUSTER transp_anon.email;
H.1.2. Фейкер #
Faker — это пакет Python, который генерирует фейковые данные. Независимо от того, нужно ли вам заполнить вашу базу данных начальными данными, создать красиво выглядящие XML-документы, заполнить хранилище для стресс-тестирования или анонимизировать данные, взятые из производственного сервиса, Faker вам поможет. Для получения дополнительной информации смотрите документацию Faker.