Вопрос про Python,библиотека lxml
Пользователи, просматривающие топик: none
|
Зашли как: Guest
|
Имя |
Сообщение |
<< Старые топики Новые топики >> |
|
|
Вопрос про Python,библиотека lxml - 2011-09-09 19:15:31.363333
|
|
|
Mikro
Сообщений: 36
Оценки: 0
Присоединился: 2011-06-03 22:40:25.670000
|
Всем привет,если кто работал с lxml подскажите,можно ли выбрать текст из html к примеру из этих тегов вытащить "аа"- <p>aa</p> ? .cssselect(''): я так понимаю подходит только для css ?
|
|
|
RE: Вопрос про Python,библиотека lxml - 2011-09-10 18:53:50.296666
|
|
|
bob3r
Сообщений: 67
Оценки: 0
Присоединился: 2011-06-03 02:30:17.840000
|
Достаточно просто. Так, на стартовой странице xakep.ru нет тегов p, поэтому выполняется перебор тегов div. # coding=utf-8
import lxml.html
htmltree = lxml.html.parse("http://xakep.ru/")
root = htmltree.getroot()
for div in root.findall(".//div"):
print div.text
|
|
|
RE: Вопрос про Python,библиотека lxml - 2011-09-10 20:46:01.516666
|
|
|
Mikro
Сообщений: 36
Оценки: 0
Присоединился: 2011-06-03 22:40:25.670000
|
вот так спасибо большое!!!
|
|
|
|
|