Консультация по python
Есть скрипт на питоне (50 строк) выдает ошибку, нужно её исправить.
import urllib, re, sys
p_key = re.compile('http:\/\/lib\.aldebaran\.ru\/getpage\/1\/.*?"')
p_span = re.compile('(.*?)')
p_s = re.compile('\';s \+= \'')
p_p = re.compile('(
.*?
)')p_url_name = re.compile('^(http:\/\/lib.aldebaran.ru\/author\/.*?__)')
def getpage(url):
try:
key = p_key.findall(urllib.urlopen(url).read())[0][-33:-1]
except:
return None
urllib.urlopen("http://lib.aldebaran.ru/getpage/1/" + key) .read()
page = urllib.urlopen("http://lib.aldebaran.ru/getpage/2/" + key) .read()
page = p_span.sub('', page)
page = ''.join(p_p.findall(page))
page = p_s.sub('', page)
return page
url = sys.argv[1]
url = p_url_name.findall(url)[0]
i = 1
while True:
page = getpage(url + str(i) + '.html')
i += 1
if page != None:
print page
else:
sys.exit(0)
Пользоватся им очень просто:
python lit.py http://lib.aldebaran.ru/author/sadov_sergei/sadov_sergei_klinki_u_trona/sadov_sergei_klinki_u_trona__0.html > lit.html
Скрипт неправильно работает...