Regex Probleme ODER

S

smileyep1

Neues Mitglied
0
Hi habe ein problem mit meinem Regex.

Und zwar möchte ich dinge aus einem HTML Text herausholen und in eine ListView hauen.
Dabei stehen 2 verschiedene Informationen die ich haben möchte zwischen verschiedenen html befehlen.

das ganze sollte dann so aussehen:

PHP:
<html quatsch>(ERSTER TEXT den ich haben will)<html quatsch> 

<anderer html quatsch>(ZWEITER TEXT den ich haben will)<anderer html quatsch>
Das Regex soll also bei dem ersten ODER dem 2ten anschlagen und die Group einfach in meine ListView hämmern.

Mit einem text den ich suche geht das auch wunderbar mit:

PHP:
"<html quatsch> (.*?) <htmlquatsch>"
Versucht habe ich schon:

PHP:
"<html quatsch>(.*?)<html quatsch> | <anderer html quatsch>(.*?)<anderer html quatsch>"
Komme leider auf keinen grünen zweig ... vielleicht steh ich auch nur auf der leitung und es ist einfacher zu realisieren.
 
Im Prinzip müsste das gehen, es sei denn, in dem einen oder anderen "html quatsch" befindet sich ein Zeichen, das in reg. Ausdrücken gequotet werden will.

Wenn das nicht geht, kannst Du auch direkt nach dem Html Quatsch suchen und mittels MatchResult.start() und so weiter dir die Position im String holen (Hilft evtl auch bei der Fehlersuche bzgl des Quotens).

Übrigens gibt es für HTML Extraktion auch extra Bibliotheken wie TagSoup. Da kannst du den Text per XQuery suchen.
 
Zuletzt bearbeitet:

Ähnliche Themen

S
Antworten
4
Aufrufe
995
Sempervivum
S
R
Antworten
3
Aufrufe
1.625
Ritartet
R
A
Antworten
1
Aufrufe
637
swa00
swa00
Zurück
Oben Unten