Парсер e-mail по списку сайтов

Скачай прямо сейчас!
Покупаю прямо сейчас!

Часто возникает необходимость взять список ссылок или доменов, и просканировать их на наличие ящиков электронной почты. Для этой задачи мы разработали мощный комбайн, и в результате у вас появилась возможность наполнять емейлами любую таблицу, содержащую сайты. На входе может быть например таблица с организациями, выгруженными из 2гис или другого справочника; либо таблица с доменами, выгруженная из парсера выдачи Яндекса, либо простой список ссылок.

Несмотря на мощный функционал, программа довольно проста в использовании и имеет интуитивно понятный интерфейс.

Скриншот парсера email по списку url

Парсер имеет два базовых режима работы. Первый — «Загрузить список сайтов из файлов Excel и вернуть результаты в исходные файлы» позволяет взять готовую Excel-таблицу, взять из неё в заданной колонке сайты, взять в заданной колонке уже имеющиеся в таблицы емейлы, просканировать сайты, собрать с них емейлы, добавить собранные к имеющимся, убрать дубли, отфильтровать специальным образом, и вернуть в таблицу обработанный список ящиков.

Второй режим работы — «Взять сайты/ссылки в окошке ниже, и вывести результаты в новый файл» используется в случае, когда нет возможности/необходимости брать емейлы из имеющейся таблицы, или нужно получить просто список ящиков, или нужно просто наполнить кэш-базу для будущей работы.
В этом режиме работать проще всего. Если у Вас есть любая таблица из любого источника, где имеется колонка с сайтами, Вы можете дополнить её колонкой с емейлами. Скопируйте колонку с сайтами из таблицы в парсер, сделайте выгрузку, скопируйте результаты сканирования в исходную таблицу.
Важно! Парсер поддерживает полное соответствие порядка найденных емейлов в результатах сканирования исходному списку сайтов — они не перепутаются!

Подробнее о функциях первого режима «Загрузить список сайтов из файлов Excel и вернуть результаты в исходные файлы».

Кнопка «Выбрать файлы» позволяет задать один или несколько файлов, которые нужно обработать.

Галочка «Ящики с доменом сайта» позволяет отфильтровать корпоративные емейлы от ящиков с общедоступных почтовых сервисов, или фейковые ящики email@site.com.

Галочка «Ящики из списка доменов справа» позволяет отфильтровать домены бесплатной почты из списка справа (этот список используется только для работы этой галочки, более нигде).

Галочка «Все ящики» позволяет быстро отключить фильтрацию, чтобы выводились все ящики.

Галочка «Удалять емейлы из файлов BlackList, BlackListTemp» управляет двумя черными списками. Список BlackList.txt, наполняемый пользователем, содержит постоянно фильтруемые ящики, которые никогда не станут рабочими — как mail@domain.com. Список BlackListTemp.txt содержит временно фильтруемые ящики, которые в данный момент не работают, но возможно ещё заработают (например, выдают ошибку переполненного ящика).

Кроме того, парсер использует белый список ящиков, который хранится в файле TrustBase.xlsx.

При подготовке итогового списка емейлов парсер выводит ящики в следующем порядке (это играет роль, когда количество выводимых емейлов ограничено значением параметра «Емейлов в ячейке, не более») — сначала идут ящики из обрабатываемого файла, затем из белого списка TrustBase, затем идут ящики с сайта.

Подробнее о работе во втором режиме «Взять сайты/ссылки в окошке ниже, и вывести результаты в новый файл»

При работе во втором режиме, результаты сканирования автоматически выделяются в окне программы, чтобы сразу нажать Ctrl+C и перенести их в нужное место, и автоматически сохраняются в файл Excel, название которого указано в логах.

Можно отключить сканирование сайтов галочкой «Выполнять сканирование сайтов, на каждом сайте сканировать страниц:», в этом случае работа будет идти только с файлами. При включенной галочке, можно управлять количеством сканируемых страниц даже в процессе сканирования. Программа берёт в список сканирования только те страницы, которые видны с заданного адреса (главной страницы домена или заданной ссылки) — это позволяет не зарываться на больших сайтах.

Для того, чтобы программа не заходила на какие-то сайты (соцсети, википедия, глючные сайты и тд), домены таких сайтов пользователь вносит в файл skip.txt в папке программы.

Программа при построении списка ссылок для сканирования заданного сайта может брать наиболее приоритетные страницы (по маркерам из файла prioritymarkers.txt), их она передвинет наверх общего списка страниц, и просканирует их в первую очередь (это важно, когда общее число найденных страниц превышает заданный лимит сканирования). В файле prioritymarkers можно указать слова, наличие которых в ссылке означает повышенную вероятность нахождения там контактов — contact, kontakty, контакты, about, и тд.

Для ускорения выгрузок программа использует кэш собранных емейлов, который хранится в файле DB.txt. Его использование позволяет не тратить время на повторное сканирование сайта, а почти мгновенно находить ранее найденные на сайте емейлы.

Если Вы делаете разные сканирования в разных папках (либо для ускорения общего процесса, либо для разделения выгрузок по тематикам/проектам), Вы можете потом объединить несколько баз в одну общую, путём нажатия кнопки «Слить базы в одну» и выбора нескольких файлов баз.

Так выглядят результаты сканирования списка сайтов во втором режиме:

Файл Excel с электронной почтой с просканированных сайтов

Файл Excel с электронной почтой с просканированных сайтов

 

Скачать демо-версию парсера email по списку URL

 

Программа умеет приостанавливать свою работу, и продолжать её. Паузу можно включать вручную, а если отключится интернет — программа поставит себя на паузу автоматически.

Стоимость парсера сегодня: 5.000Р   3000р!

100% безопасности!


Чтобы приобрести нашу программу для сбора ящиков email по любому списку ссылок, укажите в данной форме имя, email, и способ оплаты (Webmoney / ЯД / Paypal / Liqpay / Qiwi / Visa / Mastercard / наличные / другое). После нажатия кнопки «Заказать!» вы получите на указанный ящик ДЕМО-версию и все подробности об условиях приобретения программы, о процедуре оплаты, о техподдержке и обновлениях.



 

Хотите заказать подобную программу для других сайтов —  закажите у нас создание парсера.

Заказать разработку парсера!
Обратная связь

Мы Вас услышим!

Отправить