21 Dic, 2025 - 02:01 PMDeutsch | English
Hola invitado [ Register | Entrar ]

Publicar nuevo tema   Responder al tema
Ver tema anterior Versión imprimible Entre para ver sus mensajes privados Ver tema siguiente
Autor Mensaje
Dannyboy
Asunto: HTML-Links via Perl auslesen?  MensajePublicado: 08 Nov, 2006 - 01:05 PM



Registrado: 30 Jun, 2005
Mensajes: 449

Hallo Linux-Freunde,
ein Freund von mir sucht eine Möglichkeit HTML-Links mit Perl auszulesen. Dazu greift er via Perl auf den Online-Sourcecode zu, speichert ihn in einer String-Variable und nun benötigt er noch die Möglichkeit sich die Inhalte von allen
Código:
<a href> DAS BRAUCHEN WIR </a href>
auszugeben. Im Prinzip möchte er einfach alle auf einer HTML-Seite verfügbaren Downloads und Links auflisten und das Ganze _muss_ mit regulären Ausdrücken passieren

Ich würd' ihm gern helfen, aber habe offen gestanden bisher keine Ahnung von Perl. Wäre super, wenn jemand eine Idee hätte.

Greetz
DANNYBOY
 
 Ver perfil de usuario Enviar mensaje privado  
Responder citando Volver arriba
Geier0815
Asunto: RE: HTML-Links via Perl auslesen?  MensajePublicado: 08 Nov, 2006 - 01:38 PM



Registrado: 20 Jul, 2004
Mensajes: 316

Er soll nicht in einen String speichern, sondern in ein Array (die Dinger mit dem @ am Anfang). Dann jagt er eine Suche drüber und speichert für jede Zeile in der der entsprechende Tag vorkommt eine neue Variable.

_________________
Wenn Windows die Lösung ist...
kann ich dann bitte das Problem zurück haben?
 
 Ver perfil de usuario Enviar mensaje privado  
Responder citando Volver arriba
Hack-o-Master
Asunto:   MensajePublicado: 10 Nov, 2006 - 04:02 PM



Registrado: 05 Abr, 2005
Mensajes: 499
Ubicación: Bielefeld <:-P
Ein apt-cache search html|grep perl|more fördert u.a. diese Perl-Module zu Tage (neben vielen anderen die sich mit HTML beschäftigen):
    libhtml-linkextractor-perl - Perl module used to extract links from HTML documents
    libhtml-parser-perl - A collection of modules that parse HTML text documents

was wohl für die Aufgabenstellung Arbeit abnehmen könnte.

Bei installierten perl-doc Paket kann dann die Doku dazu per
perldoc HTML::LinkExtractor & perldoc HTML::LinkExtor eingesehen werden.
(siehe auch /usr/share/doc/libhtml-linkextractor-perl/README)

mfg. Hack-o-Master

_________________
sidux2007-02 64Bit, Kernel 2.6.23rc..(Crypto-root), X.org 7.3, KDE 3.5.7
http://bernd-das-brot.de.be | Gästebuch , certified B.O.F.H.


Ultima edición por Hack-o-Master el 10 Nov, 2006 - 04:17 PM, editado 1 vez
 
 Ver perfil de usuario Enviar mensaje privado Enviar email Visitar sitio web del autor  
Responder citando Volver arriba
gummibaerchen
Asunto:   MensajePublicado: 10 Nov, 2006 - 04:15 PM



Registrado: 01 Nov, 2006
Mensajes: 32

Mein bester Freund hatte so komplizierte Hausaufgaben.

Also alpha=40° und jetzt brauche ich a, muss aber mit dem Satz des Pythagoras gemacht werden Smilie

Ja ne, schon klar.
 
 Ver perfil de usuario Enviar mensaje privado  
Responder citando Volver arriba
p500xl
Asunto: Re: HTML-Links via Perl auslesen?  MensajePublicado: 10 Nov, 2006 - 06:04 PM



Registrado: 05 Jul, 2006
Mensajes: 127

Dannyboy escribió:
Im Prinzip möchte er einfach alle auf einer HTML-Seite verfügbaren Downloads und Links auflisten und das Ganze _muss_ mit regulären Ausdrücken passieren


dein freund muss dafür nicht perl können Sehr glücklich
dieses hier für die console

Código:
lynx -dump http://kanotix.com/index.html | sed '1,/^References/d' | grep http | awk '{print $NF}'
 
 Ver perfil de usuario Enviar mensaje privado  
Responder citando Volver arriba
Mostrar mensajes anteriores:     
Cambiar a:  
Todas las horas son GMT + 1 Hora
Publicar nuevo tema   Responder al tema
Ver tema anterior Versión imprimible Entre para ver sus mensajes privados Ver tema siguiente
Powered by PNphpBB2 © 2003-2007 The PNphpBB Group
Créditos
 
Deutsch | English
Logos and trademarks are the property of their respective owners, comments are property of their posters, the rest is © 2004 - 2006 by Jörg Schirottke (Kano).
Consult Impressum and Legal Terms for details. Kanotix is Free Software released under the GNU/GPL license.
This CMS is powered by PostNuke, all themes used at this site are released under the GNU/GPL license. designed and hosted by w3you. Our web server is running on Kanotix64-2006.