Автоматизированная загрузка нескольких HTML

 
+
-
edit
 

TheFreak

старожил

Извиняюсь за ламерский вопрос.
Нужно автоматизированно загрузить несколько (штук 10-20) ХТМЛ файлов из инета и взять из них инфу (ну или хотя бы сохранить их на диске - дальше и сам могу). Желательно используя Excel и/или VB. Как это можно и легче сделать?
Насколько я понял Web Query работают только с таблицами, это не подходит. И расположение данных в нужных ХТМЛ меняется.
И еще, URL может быть в виде Старые форумы Balancer'а
 
+
-
edit
 

Balancer

администратор
★★★★★
Час неторопливого программирования на Perl'е.
Если без затыков, то и минут за 15 управиться можно

get(...) на нужный URL, потом регекспами вырезаем нужную инфу и сбрасываем её хоть в том же CSV-виде (если потом в Excel захочется втянуть).
 

AP

втянувшийся

>Нужно автоматизированно загрузить несколько (штук 10-20) ХТМЛ файлов из инета ... (ну или хотя бы сохранить их на диске - дальше и сам могу).

Если Perl по каким-либо причинам не подходит, то можно wget или curl приспособить. Первый (wget) есть и для Windows. Второй - не знаю.
 
+
-
edit
 

TheFreak

старожил

Balancer, 04.02.2004 12:58:35:
get(...) на нужный URL, потом регекспами вырезаем нужную инфу
 

Спасибо. То, что нужно.
Но неужели в VB нет подобного?!

Подскажи пожалуста IDE для Perl. Чтоб по-проще и с хелпом.
 
+
-
edit
 

Balancer

администратор
★★★★★
IDE не знаю, да и за года 4 программинга на Perl'е ни разу в них надобности не возникло. Дока хорошая ставится вместе с Perl'ом, можно в HTML-виде смотреть, но удобнее обычно с консоли: "perldoc -f
get() - это очень простая функция, просто возвращает содержимое указанного HTTP. Входит в модуль LWP::Simple. В стандартной поставке есть гораздо более продвинутые функции из серии того же LWP, позволяющие сформировать любой запрос.

Прога будет в духе:
[/color] [color=#696969; ]# [/color] [color=#696969; ]# Вот по нему и ищем:[/color] [color=#696969; ]# (Одновременно выходя с ошибкой, если не нашли)[/color] die [color=#0000e6; ]"Не могу оределить температуру!"[/color] [color=#808030; ]unless[/color][color=#0000e6; ] [/color][color=#800000; ]/[/color][color=#0000e6; ].^[/color][color=#007997; ]*Максимальная[/color][color=#0000e6; ]
температура.*?align=center>(.+?)open FH[color=#808030; ],[/color] [color=#0000e6; ]">moscow-temp.txt"[/color] [color=#808030; ]or[/color] die [color=#0000e6; ]"Не могу создать файл: $!"[/color][color=#800080; ];[/color] print FH $1[color=#800080; ];[/color] close FH[color=#800080; ];[/color]
use strict[color=#800080; ];[/color] [color=#696969; ]# strict, всегда strict![/color] use LWP::Simple [color=#808030; ]/[/color]get[color=#808030; ]/[/color][color=#800080; ];[/color] [color=#696969; ]# импортируем нашу функцию и только её, нефиг мусорить[/color] [color=#696969; ]# Утянем страницу[/color] [color=#696969; ]# Для простоты запишем в переменную по умолчанию.[/color] $_[color=#808030; ]=[/color]get[color=#808030; ]([/color][color=#0000e6; ]"[/color][color=#5555dd; ]http://pda.gismeteo.ru/27612.htm[/color][color=#0000e6; ]"[/color][color=#808030; ])[/color][color=#800080; ];[/color] [color=#696969; ]# Нужный нам фрагмент (хотим поглядеть макс. температуру на сегодня) на странице такой:[/color] [color=#696969; ]# Максимальная
температура
-7
-9
Created with colorer-take5 library. Type 'perl'
 
+
-
edit
 

TheFreak

старожил

Класс! Спасибо.
Нашел Perl Builder 2.0e Pro в архиве rar (1.39 Мб)... А че он такой маленький?! :blink:
 
+
-
edit
 

Balancer

администратор
★★★★★
TheFreak, 04.02.2004 16:59:21:
Класс! Спасибо.
 

Есть непонятные места - спрашивай

>Нашел Perl Builder 2.0e Pro в архиве rar (1.39 Мб)... А че он такой маленький?! :blink:

Фиг знает. М.б. на Перле написан?
 
+
-
edit
 

TheFreak

старожил

Попробовал. Это что-то!
Почитал описание самого языка... Сильно.
 
+
-
edit
 

Balancer

администратор
★★★★★
TheFreak, 04.02.2004 18:01:01:
Попробовал. Это что-то!
Почитал описание самого языка... Сильно.
 

Для работ, связанных с извлечением и обработкой текста, думаю, вряд ли что-то компактнее есть

Плюс море всевозможных библиотек и модулей. Да ещё, например, систематизированных и с автоматизированной установкой - The Comprehensive Perl Archive Network - www.cpan.org, например
 

в начало страницы | новое
 
Поиск
Настройки
Твиттер сайта
Статистика
Рейтинг@Mail.ru