Сделать php парсер сайта
Собрать данные с сайта
----------1----------
со страницы
Собрать слова из блоков:
1) Со словом «кухня» ассоциируются слова
2) Слово «кухня» ассоциируется со словами
Важно:
- Сохранять новое слово/фразу с новой строки в файле
- В файле писать заголовок каждого раздела. Например, АССОЦИАЦИИ, и далее текст построчно. Потом пустая строка. И новый раздел С ПРИЛАГАТЕЛЬНЫМИ
- Удалить дубли
----------2----------
со страницы
Сохранить результаты из блоков:
С прилагательными
С существительными (главное слово)
С существительными (зависимое слово)
С глаголами (субъект)
С глаголами (аргумент)
Важно:
1. В файле писать заголовок каждого раздела заглавными буквами. Например, АССОЦИАЦИИ, и далее текст построчно. Потом пустая строка. И новый раздел С ПРИЛАГАТЕЛЬНЫМИ
2. Заменить символ переноса столбца на пробел
Общее:
1. Сохранить в файл Excel 2003. Название файла: {№слова}{слово латиницей}
2. Файл с результатами класть в папку /ass
3. Пути относительные.
4. Запуск с сервера вручную и кроном.
5. Процесс работы выводить в эхо и в лог писать
6. Ошибки фиксировать в логах.
7. Сервер php CGI 5.6.40 (native)
Слова берутся из списка, который я указываю. words.txt
Ограничение скорости работы парсера, чтобы не перегружать сайт (1 запрос в 3 секунды).
Капчи быть не должно.
Образец конечного файла во вложении.
Напишите стоимость, сроки.