Создать сайт на фреймворке с парсером контента

Гость3 года в сервисе
Данные заказчика будут вам доступны после подачи заявки
17.01.2023

Необходимо создать сайт на любом фреймворке с парсингом контента. Всего будет более 6 миллионов страниц, следовательно нужно тщательно проработать БД, чтобы сайт под нагрузкой не ложился. Ориентировочно на сайте ежедневно будет не менее 10 тысяч человек трафика.

Что необходимо сделать:

  • Необходимо будет спарсить весь контент, который находится на странице https://infourok.ru/biblioteka
  • На данном сайте есть возможность скачивать файлы, следовательно все файлы также нужно будет скачать.
  • На сайте весь контент находится в iframe, следовательно нужно будет сделать так же. Это необходимо для того, чтобы верстка страницы не сломалась. Также у пользователей должна быть возможность скачать файл. При нажатии на скачивание файла должно появляться окно для указания e-mail'а. После указания e-mail'а пользователю должно отправляться письмо с ссылкой на скачивание файла, а сам e-mail должен сохраняться в БД и соответственно отображаться в админке в определенном разделе.
  • Для каждого материала указано от 2 до 3 меток, их также необходимо парсить.
  • После того, как все материалы спарсены и опубликованы, парсен по cron должен проверять наличие новых материалов раз в сутки и если они появляются - парсить и добавлять на сайт.
  • Дизайн для сайта необходимо взять с сайта ensib.ru из вебархива.
Технические требования:

  • Редирект с www на без www.
  • Редирект с http на https.
  • Возможность редактировать robots.txt из админки.
  • Возможность редактировать htaccess из админки.
  • Добавить 404 страницу с ссылкой на главную.
  • Настройка кэширования и gzip сжатия.
  • Для каждой страницы возможность изменять title, description, h1.
  • Удобный редактор контента.
  • Возможность прописывать title, description, h1 по шаблону (создать раздел шаблоны СЕО).
  • Автоматическая генерация карты сайта. Основная карта сайта будет sitemap.xml. В ней будут ссылки на последующие карты сайта sitemap1.xml, sitemap2.xml и так далее. В sitemap1.xml и других не более 10к ссылок на страницы с контентом.
  • Микроразметка Schema и Open Graph.

Заявки фрилансеров