Доработка парсера html страниц / PHP
Александр6 лет в сервисе
Данные заказчика будут вам доступны после подачи заявки
13.09.2019
Парсер работает, но с ошибками - их нужно устранить.
+ Требуется развитие функционала парсера.
Общие исх данные по парсеру на PHP:
- есть произвольный url
- список ключевых фраз в CSV (заранее создается)
- сторонняя, проверенная библиотека по лематизации (приведение с простой словоформе)
Что требуется от парсера:
- очистить HTML от тегов и превратить в "плоский текст"
- сравнить текст со списком ключевых фраз в CSV
- отметить цветом в тексте найденные ключевые фразы.
- выделить в списке ключевые фразы, которые встретились в тексте
на скриншоте показан результат работы и ошибка, которая мешает...