Jetzt kostenlos registrieren. Mitglieder surfen ohne Werbung auf Android-Hilfe.de!
Zurück   Android-Hilfe.de > Android Developer > Android App Entwicklung

HTML Parsing

Das Thema "HTML Parsing" befindet sich unter Android App Entwicklung auf Android-Hilfe.de.


Antwort

 

Themen-Optionen Ansicht
Alt 17.08.2009, 19:27   #1 (permalink)
Android-Hilfe.de Mitglied

Registriert seit: 16.08.2009
Beiträge: 112
Abgegebene Danke: 0
Erhielt 4 Danke für 3 Beiträge
Standard HTML Parsing

Ich habe gerade erst mit der Enwticklung von Androidanwendungen angefangen. Da ich bereits ein erfahrener Java-Enwtickler bin war nicht allzu viel Eingewöhnung nötig. Allerdings veruche ich im Moment eine HTML-Seite zu parsen. In den Androidlibs direkt gibt es nur nen XML-Parser. Leider ist die Seite die ich parsen möchte nicht in XHTML sondern normalen (unsauberen) HTML geschrieben. Hat jemand schon Erfahrungen mit brauchbaren Libs für dieses Problem? Ich habe bisher NekoHTML ausprobiert, aber das läuft leider nicht unter Android und scheint eine Portierung zu benötigen. Aber vielleicht hat ja jemand von euch schon eine brauchbare Lib in Benutzung?
Bin mittlerweile recht verzweifelt was das angeht
Danke im Voraus
dereulenspiegel ist offline   Mit Zitat antworten
Alt 17.08.2009, 19:29   #2 (permalink)
Fortgeschrittenes Mitglied

Registriert seit: 14.08.2009
Beiträge: 354
Abgegebene Danke: 23
Erhielt 49 Danke für 43 Beiträge
Standard AW: HTML Parsing

wieso nimmst du nicht einfach Regex um deine Infos aus der Seite zu ziehen?
MichaelS ist offline   Mit Zitat antworten
Alt 17.08.2009, 19:58   #3 (permalink)
Android-Hilfe.de Mitglied

Registriert seit: 16.08.2009
Beiträge: 112
Abgegebene Danke: 0
Erhielt 4 Danke für 3 Beiträge
Standard AW: HTML Parsing

An sowas habe ich auch schon gedacht, allerdings möchte ich schon recht viel daraus ziehen und eine vernünftige Lib zum Parsen von HTML genauso wie bei XML wäre schon schöner und besser zu handeln.
Zur Not parse ich die Seite natürlich manuell auch per RegEx aber ist halt nicht die schönste Variante. Gibt ja sicher noch mehr Leute die schon HTML-Seiten für ihre Anwendung geparst haben. Kann mir nicht direkt Vorstellen, dass alle das mit RegEx gemacht haben.
dereulenspiegel ist offline   Mit Zitat antworten
Alt 17.08.2009, 20:14   #4 (permalink)
Fortgeschrittenes Mitglied

Registriert seit: 14.08.2009
Beiträge: 354
Abgegebene Danke: 23
Erhielt 49 Danke für 43 Beiträge
Standard AW: HTML Parsing

also das parsen von html in alle elemente verbraucht aufjedenfall viel viel mehr power also das parsen mit regex... Regex ist ultra schnell und damit wirst du alles bekommen was du willst Die Logik dahinter ist wirklich sehr geil =) ich persönlich arbeite sehr viel mit regex, da man einfach schnell viel bewirken kann =) Ansonsten abwarten bis jemand was schreibt
MichaelS ist offline   Mit Zitat antworten
Alt 17.08.2009, 20:21   #5 (permalink)
Android-Hilfe.de Mitglied

Registriert seit: 16.08.2009
Beiträge: 112
Abgegebene Danke: 0
Erhielt 4 Danke für 3 Beiträge
Standard AW: HTML Parsing

Ok, hast mich überzeugt. RegEx habe ich bisher immer vermieden weil es mich doch stark an Perl erinnert. Ich weiß zwar, dass ein guter Entwickler keine persönlichen Abneigungen gegen Sprachen haben sollte, aber mit Perl bin ich nie warm geworden. Kannst du mir vielleicht ein kleines Code Beispiel geben wie ich Regex einsetze um an einzelne Nodes inkl Subnodes in einem HTML-File zu kommen?
dereulenspiegel ist offline   Mit Zitat antworten
Alt 17.08.2009, 20:23   #6 (permalink)
Fortgeschrittenes Mitglied

Registriert seit: 14.08.2009
Beiträge: 354
Abgegebene Danke: 23
Erhielt 49 Danke für 43 Beiträge
Standard AW: HTML Parsing

Regex hat nichts mit Perl zu tun such einfach mal bei google nach regex... glaub der erste treffer ist schon perfekt für den einstieg =) (für die faulen: Regular-Expressions.info - Regex Tutorial, Examples and Reference - Regexp Patterns)
MichaelS ist offline   Mit Zitat antworten
Alt 17.08.2009, 20:31   #7 (permalink)
Android-Hilfe.de Mitglied

Registriert seit: 16.08.2009
Beiträge: 112
Abgegebene Danke: 0
Erhielt 4 Danke für 3 Beiträge
Standard AW: HTML Parsing

Naja, Perl macht schon recht exzessiven Gebrauch von Regular Expressions und geht auch dabei über das was in POSIX definiert ist hinaus. Für mich hat daher RegEx schon recht viel mit Perl zu tun und weckt immer wieder negative Erinnerungen. Aber ist ja auch egal.
Wie man Regular Expressions aussehen ist mir bekannt, aber wie benutze ich die in Java? In Perl gehören die ja zur Syntax. Ist das bei Java auch so?
dereulenspiegel ist offline   Mit Zitat antworten
Alt 17.08.2009, 20:33   #8 (permalink)
Fortgeschrittenes Mitglied

Registriert seit: 14.08.2009
Beiträge: 354
Abgegebene Danke: 23
Erhielt 49 Danke für 43 Beiträge
Standard AW: HTML Parsing

hm du bist net so der freund von google was? naja hier nochmal Java Regular Expressions
MichaelS ist offline   Mit Zitat antworten
Alt 17.08.2009, 20:41   #9 (permalink)
Android-Hilfe.de Mitglied

Registriert seit: 16.08.2009
Beiträge: 112
Abgegebene Danke: 0
Erhielt 4 Danke für 3 Beiträge
Standard AW: HTML Parsing

Sorry, heute scheint nicht so mein Tag zu sein. An google hatte ich gerade gar nicht gedacht. Hatte in der String Klasse was passendes gesucht und habe nicht an andere Klassen wie Matcher gedacht. Werde dann mal mein Glück über diesen Weg versuchen. Aber falls jemand noch ne brauchbare HTML-Lib findet, immer Bescheid sagen.
dereulenspiegel ist offline   Mit Zitat antworten
Alt 20.08.2009, 08:06   #10 (permalink)
Android-Hilfe.de Mitglied

Registriert seit: 16.08.2009
Beiträge: 112
Abgegebene Danke: 0
Erhielt 4 Danke für 3 Beiträge
Standard AW: HTML Parsing

Sorry für den Doppelpost, aber ich wollte nur kurz vermelden, dass mein Problem gelöst ist. Ich verwende jetzt TagSoup um HTML zu parsen. Die Lib ist recht klein und sehr angenehm zu benutzen. Leider etwas dürftig dokumentiert. Aber dafür ist auch alles recht selbsterklärend.
dereulenspiegel ist offline   Mit Zitat antworten
Antwort

Stichworte
-

Themen-Optionen
Ansicht


Ähnliche Themen

Thema Autor Forum Antworten Letzter Beitrag
[HTML?] Telefonnummer auf Website Wählen TomS Android Allgemein 14 01.07.2009 02:15
gmail und html androidmen Kommunikation 1 17.04.2009 22:57




Du liest gerade: "HTML Parsing" unter "Android App Entwicklung" auf Android-Hilfe.de.


Powered by vBulletin®
Copyright ©2000 - 2012, vBulletin Solutions, Inc.
Search Engine Friendly URLs by vBSEO
© Android-Hilfe.de 2012 - All rights reserved.