Обработка базы в Allsubmitter
Обработка базы в Allsubmitter
Когда составили проект, можно начинать регистрировать его, но для регистрации нужна база каталогов, которую можно скачать, купить или напарсить самостоятельно. После чего, ее необходимо обработать на наличие ошибок и форм.
Для обработки базы вам необходимо собрать эталонные сайты, согласно которым, и будет собираться база. Сайты в базе могут быть без каптчи, с каптчей, или с обязательной установкой обратной ссылки (надеюсь, все знают, что такое каптча – это защита от спама, просьба ввести код на картинке или выбрать правильный вариант ответа).
Для того, что бы установить базу в Allsubmitter, выбираем «База каталогов» и «Импортировать», после чего у вас откроется окно, где вам нужно выбрать файл с базой каталогов. Когда файл выбран, появятся варианты сохранения базы, я рекомендую оставить все как есть.
Для того, что бы собрать эталонные сайты необходимо запустить «утилиты – регистрация – полуавтоматическая регистрация» и выбираем категорию с базой, затем жмем «Начать регистрацию». После чего у вас загрузится сайт, внимательно просмотрите его и убедитесь в наличие формы для регистрации сайта, или такой, что бы можно было вставить ссылку на сайт. Если на сайте есть форма, внимательно посмотрите, что бы все поля указывали нужную информацию (поле сайт – ваш сайт, поле email – ваш email и т.д.), если что то не так, то исправьте на нужное. А если в форме обязательно нужно указать параметры, которых у вас нет при их выборе, то впишите их во вкладке дополнительные параметры, в проекте. После этого нажмите кнопку для подтверждения введенных данных и отправки (обычно это – Далее, Продолжить, Подтвердить, Отправить и т.д.).
Когда вы увидите, что ваш сайт успешно добавлен или что то вроде этого, то жмите кнопку «следующий сайт». Перед вами откроется окно, где вы можете указать папку для сохранения сайта (если вы собираете эталон, то создайте папку «Эталон») и другие параметры сайта, такие как: нужна ли обратная ссылка, можно ли регистрировать сайт в автоматическом режиме и т.д. Таким образом, нужно собрать несколько сайтов, чем больше, тем лучше, но не менее 30. Какие сайты собирать зависит только от вас, но я собираю сайты исключительно без каптчи и делю их на «с обраткой» и «без обратки».
Таким образом, получился эталон сайтов, вы можете собирать базу, ориентируясь на него. Для этого выделите из эталона до 50 сайтов (если пользуетесь бесплатной Allsubmitter 4.7) или до 200 сайтов (если используете Allsubmitter версии выше 5.3) и нажмите вкладку «Распознать однотипные формы». После чего все сайты с необработанной базы и нажмите «Распознать однотипные формы.
У вас откроется окошечко с параметрами, где вы можете выбрать следующее:
- В скольких потоках производить проверку (зависит от параметров компьютера и Интернет соединения, если кабель то -100)
- Куда переносить сайты имеющие форму, но не подходящие эталону
- Куда переносить сайты без формы или с ошибочными загрузками
- Куда переносить сайты, которые подходят под эталон
После того, как выбрали нужные параметры, жмите продолжить и процесс пойдет.
Когда процесс обработки закончится на 100%, у вас получится обработанная база, по которой вы можете прогонять сайты.





Уважаемые пользователи, прошу вас не грубить и не применять красноречивые слова и выражения.
С уважением Администратор сайта.