Необходимо спарсить табличные данные с 800 URLs. Сайт защищен от парсинга, но с правильной задержкой и локальным парсингом задача выполнима. После выполнения проекта возможны дальнейшие заказы. Прокси будут предоставлены при необходимости.
Веб скрепинг данных Crunchbase Pro по патентам
Нужно выгрузить все данные Crunchbase по патентам.
Ключевая проблема в том, что на сайте стоит ограничение скачивания в 1,000 строк, а скачать нужно >1 миллиона.
Нужны все колонки, патенты с 01/01/2000:
1. Patents
2. Patent Number
3. First Publication Date
4. Filing office
5. Patent Category
6. Patent title
7. Patent status
8. Issue date
9. Filing Date
10. Class description
11. Abstract
12. Patent owner (название)
13. Patent owner (ссылка)
Я вижу следующий способ: (Скриншот 1) В Advanced Filters пройтись по всем страничкам (на одной страничке максимум 50 строк), нажимать "Next" и парсить каждую. Но при достижении 1000-ой строки "Next" не кликабельная, поэтому нужно брать дату с последней строки и вставлять ее в фильтр сверху
Может, можно более по-умному
Формат результата: В папку гугл драйв залить CSV файл со всеми строками (или несколько, если большой размер)
К задаче приложить код
Дедлайн: 3 марта в 20:00
Заявки фрилансеров
Похожие заказы
- Базы данных5 заявокЗакрыт4 года назад
Требуется разработка внешней обработки для формирования txt-файлов с данными о продажах и алкокодах из конфигурации 'Далион Управление Магазином ПРО'. Файлы должны быть упакованы в zip-архив, с возможностью выгрузки за определенный период. Каждая смена выгружается отдельным файлом с заданным форматом имени. Необходима поддержка формата АТОЛ 1.3 TXT и обязательное заполнение алкокода.
Базы данныхнет заявокЗакрыт4 года назадИщется оператор для удаленного ввода данных. Работа заключается в выполнении четких задач, таких как фиксация показаний, создание путевых листов и ведение учета. Необходимы компьютер, доступ к интернету и 4 часа свободного времени в день.
Базы данных10 заявокЗакрыт4 года назадТребуется автоматизировать выгрузку отчетов ОЗОН через API или Zennoposter с обязательной выгрузкой в Google Таблицы. Оцените стоимость и сроки выполнения задачи. Подробности в предоставленном ТЗ и видеоинструкции.
Базы данныхнет заявокЗакрыт4 года назад- $8
Требуется PHP программист для поддержки и развития самописной CRM, работающей на php, js и bootstrap. Необходим опыт парсинга данных и работы с MySQL. Задачи включают исправление багов, разработку алгоритмов и интеграцию с Asterisk. Удаленная работа, частичная занятость, почасовая оплата 550 руб. в час.
Базы данных2 заявкиЗакрыт4 года назад Разработайте Dashboard в Excel или Google Таблицах, который будет автоматически подтягивать данные из других таблиц. Включите графики и автоматические подсчеты для отображения ключевых показателей о компании. Необходимо обеспечить удобный интерфейс и наглядность данных.
Базы данных4 заявкиЗакрыт4 года назадТребуется перенести сайт с использованием ASP.Net на новый хостинг. Необходимо также обеспечить миграцию базы данных, которая работает на MS SQL. Укажите опыт работы с подобными проектами.
Базы данных1 заявкаЗакрыт4 года назадНеобходимо создать таблицу сравнения для API систем комплайнса, включая интеграцию с WorldCheck и Acuris. В таблице должны быть указаны количество источников, закрытые базы, собственные базы данных, англоязычные источники и стоимость доступа к аналогичным системам.
Базы данныхнет заявокЗакрыт4 года назад- $1000
Необходимо разработать удаленный сервис для синхронизации данных между базами FireBird и MySQL. Требуется создать класс для чтения и записи данных на локальном сервере с FireBird и второй класс для удаленного управления. Задача включает обмен данными, связанными с выдачей топлива на АЗС и топливными картами, а также синхронизацию таблиц между двумя базами данных.
Базы данных7 заявокЗакрыт4 года назад Требуются базы данных зарубежных и российских предприятий по различным тематикам. Рассматриваются как готовые базы, так и услуги парсинга. Также интересуют источники для скачивания старых и новых данных.
Базы данных5 заявокЗакрыт4 года назад