Создать сайт на фреймворке с парсером контента
Гость3 года в сервисе
Данные заказчика будут вам доступны после подачи заявки
17.01.2023
Необходимо создать сайт на любом фреймворке с парсингом контента. Всего будет более 6 миллионов страниц, следовательно нужно тщательно проработать БД, чтобы сайт под нагрузкой не ложился. Ориентировочно на сайте ежедневно будет не менее 10 тысяч человек трафика.
Что необходимо сделать:
- Необходимо будет спарсить весь контент, который находится на странице https://infourok.ru/biblioteka
- На данном сайте есть возможность скачивать файлы, следовательно все файлы также нужно будет скачать.
- На сайте весь контент находится в iframe, следовательно нужно будет сделать так же. Это необходимо для того, чтобы верстка страницы не сломалась. Также у пользователей должна быть возможность скачать файл. При нажатии на скачивание файла должно появляться окно для указания e-mail'а. После указания e-mail'а пользователю должно отправляться письмо с ссылкой на скачивание файла, а сам e-mail должен сохраняться в БД и соответственно отображаться в админке в определенном разделе.
- Для каждого материала указано от 2 до 3 меток, их также необходимо парсить.
- После того, как все материалы спарсены и опубликованы, парсен по cron должен проверять наличие новых материалов раз в сутки и если они появляются - парсить и добавлять на сайт.
- Дизайн для сайта необходимо взять с сайта ensib.ru из вебархива.
- Редирект с www на без www.
- Редирект с http на https.
- Возможность редактировать robots.txt из админки.
- Возможность редактировать htaccess из админки.
- Добавить 404 страницу с ссылкой на главную.
- Настройка кэширования и gzip сжатия.
- Для каждой страницы возможность изменять title, description, h1.
- Удобный редактор контента.
- Возможность прописывать title, description, h1 по шаблону (создать раздел шаблоны СЕО).
- Автоматическая генерация карты сайта. Основная карта сайта будет sitemap.xml. В ней будут ссылки на последующие карты сайта sitemap1.xml, sitemap2.xml и так далее. В sitemap1.xml и других не более 10к ссылок на страницы с контентом.
- Микроразметка Schema и Open Graph.