| Autor |
Mensaje |
|
|
Asunto: HTML-Links via Perl auslesen?
Publicado: 08 Nov, 2006 - 01:05 PM
|
|
Registrado: 30 Jun, 2005
Mensajes: 449
|
|
Hallo Linux-Freunde,
ein Freund von mir sucht eine Möglichkeit HTML-Links mit Perl auszulesen. Dazu greift er via Perl auf den Online-Sourcecode zu, speichert ihn in einer String-Variable und nun benötigt er noch die Möglichkeit sich die Inhalte von allen
Código:
<a href> DAS BRAUCHEN WIR </a href>
auszugeben. Im Prinzip möchte er einfach alle auf einer HTML-Seite verfügbaren Downloads und Links auflisten und das Ganze _muss_ mit regulären Ausdrücken passieren
Ich würd' ihm gern helfen, aber habe offen gestanden bisher keine Ahnung von Perl. Wäre super, wenn jemand eine Idee hätte.
Greetz
DANNYBOY |
|
|
| |
|
|
|
 |
|
|
Asunto: RE: HTML-Links via Perl auslesen?
Publicado: 08 Nov, 2006 - 01:38 PM
|
|

Registrado: 20 Jul, 2004
Mensajes: 316
|
|
| Er soll nicht in einen String speichern, sondern in ein Array (die Dinger mit dem @ am Anfang). Dann jagt er eine Suche drüber und speichert für jede Zeile in der der entsprechende Tag vorkommt eine neue Variable. |
_________________ Wenn Windows die Lösung ist...
kann ich dann bitte das Problem zurück haben?
|
| |
|
|
|
 |
|
|
Asunto:
Publicado: 10 Nov, 2006 - 04:02 PM
|
|

Registrado: 05 Abr, 2005
Mensajes: 499
Ubicación: Bielefeld <:-P
|
|
Ein apt-cache search html|grep perl|more fördert u.a. diese Perl-Module zu Tage (neben vielen anderen die sich mit HTML beschäftigen):libhtml-linkextractor-perl - Perl module used to extract links from HTML documents
libhtml-parser-perl - A collection of modules that parse HTML text documents
was wohl für die Aufgabenstellung Arbeit abnehmen könnte.
Bei installierten perl-doc Paket kann dann die Doku dazu per
perldoc HTML::LinkExtractor & perldoc HTML::LinkExtor eingesehen werden.
(siehe auch /usr/share/doc/libhtml-linkextractor-perl/README)
mfg. Hack-o-Master |
_________________ sidux2007-02 64Bit, Kernel 2.6.23rc..(Crypto-root), X.org 7.3, KDE 3.5.7
http://bernd-das-brot.de.be | Gästebuch , certified B.O.F.H.
Ultima edición por Hack-o-Master el 10 Nov, 2006 - 04:17 PM, editado 1 vez
|
| |
|
|
|
 |
|
|
Asunto:
Publicado: 10 Nov, 2006 - 04:15 PM
|
|
Registrado: 01 Nov, 2006
Mensajes: 32
|
|
Mein bester Freund hatte so komplizierte Hausaufgaben.
Also alpha=40° und jetzt brauche ich a, muss aber mit dem Satz des Pythagoras gemacht werden
Ja ne, schon klar. |
|
|
| |
|
|
|
 |
|
|
Asunto: Re: HTML-Links via Perl auslesen?
Publicado: 10 Nov, 2006 - 06:04 PM
|
|

Registrado: 05 Jul, 2006
Mensajes: 127
|
|
|
Dannyboy escribió:
Im Prinzip möchte er einfach alle auf einer HTML-Seite verfügbaren Downloads und Links auflisten und das Ganze _muss_ mit regulären Ausdrücken passieren
dein freund muss dafür nicht perl können
dieses hier für die console
Código:
lynx -dump http://kanotix.com/index.html | sed '1,/^References/d' | grep http | awk '{print $NF}'
|
|
|
| |
|
|
|
 |
|
|