Перенос HTML на WordPress
1 строка, разделитель запятая
page/post - рубрика (ID для page)/родительская (ID родительской страницы)
16.11.1999,14:22 - дата и время (если нет или даты или времени или и даты и времени - то ставится та дата/время, которое актуально на момент заливки)
т.е. визуально первая строка будет выглядеть так (запятую можно заменить на иной символ) - page/post,,11,123,1645/5764,16.11.1999,14:22
2 строка = title (совпадает с url, если 3 строка пустая) = Заголовок (title) для фото (если не заполнено то повторяет title)
3 строка = url, url миниатюра записи, url фото внутри контента
по урл - без указания домена
по фото внутри контента - тут указать размер "средний" и установить в самое начало поста/страницы, выравнивание "слева" и урл по факту только имя файла и разрешение ( пример1234.jpg)
4 строка h2 + , = description для All In One SEO Pack (если не заполнено то повторяет H2) = Описание (description) (если не заполнено то повторяет H2) = description для Yoast SEO (если не заполнено то повторяет H2)
5 строка keywords для All In One SEO Pack (через запятую) = Ключевые слова (keywords) для фото (через запятую, если не заполнено то повторяет keywords) = метки (через запятую, если не заполнено то повторяет keywords) = Focus keyword для Yoast SEO (только слова до первой запятой, т.е. главное ключевое слово)
6 строка content блок (с сохранение формата - т.е. обзацы, новые строки и т.п.)
AND - конец page/post
и пошел следующий пост
общие правила для парсера:
- вся заливка в html режиме, чтобы сохранялось html редактирование оригинала
- строка пуста или нет каких-то значений - парсер их пропускает
- загрузка картинок идет с сервера из папки парсера - Img
- загрузка page/post идет с сервера из папки парсера - Html
- те page/post, которые были загружены из папки удаляются
- возможность выставления кодировки
- количество рубрик может быть несколько, можно реализовать через дефис 1-14-456
мониторинг заливки:
хотелось бы видеть, что залилось, что нет
вариант осуществления, как я писал ранее - подойдет
я о том, что если в папке остались файлы - то они не были загружены
вопрос по урлам:
если такой урл уже есть в базе
это проверить заранее не всегда возможно
какое решение видится мне - добавить к предлагаемому урлу "-2", как это и делает WP
было бы не плохо сделать url.txt файлик - куда бы заносились урлы, которые в итоге были записаны в таком виде: "/1/ http://2/"
1 - адрес размещения, без указания имени сайта
2 - полный адрес фактического размещения