Спарсить данные с сайта – парсинг
Нужно собрать с сайта eslprintables.com все данные (все, что можно скачать). У скачивания есть препятствия – чтобы что-то скачать, нужно сначала что-то загрузить. Но зато есть возможность предпросмотра файлов. Возможно, это поможет. Может, вы найдете другой способ.
Сохраненные файлы желательно разложить по папкам или как-то их упорядочить. На сайте есть характеристики, по которым они упорядочены: уровень языка, возраст, вид файла.
В общем, рассмотрю все варианты. По оплате предлагайте свои варианты – все обсудим.
*дополнение к описанию:
Авторизация:
логин и пароль одинаковые: d654525
слева внизу есть блок Contents
Grammar worksheets
Vocabulary worksheets
Listening worksheets
Speaking worksheets
Reading worksheets
Writing worksheets
Cinema and television worksheets
Games worksheets
Worksheets with songs
Teaching resourcesвнутри каждого раздела есть подразделы (внизу страниц).
собирать нужно из 1 колонки Worksheets и из 2 колонки Powerpoint презентации (т.е. файлы, которые можно скачать).
помимо файла нужно сохранять: название, описание, level, age
** дополнение 2
при скачивании у файла адрес: http://www.eslprintables.com/download.asp?id=309
в предпросмотре во фрейме адрес: http://www.eslprintables.com/mostrarprevisual/mostrar.asp?id=309
во фрейм выводится картинка в виде: http://www.eslprintables.com.es/preview/Microsoft%20Word%20-%20801231846480931001.jpg
т.е. если не удастся собрать оригиналы в ворде (а там иенно в ворде файлы), то можно собрать картинки, сделав на каждый файл папку и закачав картинки страниц от файла в одну папку