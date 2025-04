Написать парсер

• кладёт данные в mysql-базу вида штат|город|тайтл|«поля тела объявления» (изучить, какие поля есть)

• парсить все штаты США -> все города в них

• сайт — craigslist.org, парсить только подраздел /search/cas, например, для города Хьюстно — http://houston.craigslist.org/search/cas

• каждый новый запуск парсера — добавляет те, что ещё не попали в базу

• глубина начального парсинга — всё, что относится к 2015-му году

• убирать однообразные поля, по которым виден источник. На данный момент это «do NOT contact me with unsolicited services or offers» и всё, что внизу — post id и т. п.

• для картинок просто хранить значение img src