StefMa
Dauergast
- 450
Hallo,
mit folgendem Code möchte ich eine HTML Seite auslesen:
Das problem ist jetzt:
Er liest bzw. bekommt nicht die Komplette seite!
Das Log.v - also sc hat nur ca 8 zeilen:
Wieso liest er nicht den Kompletten Quelltext?
Liegt das an Android und deren "Internetverbdinung"? Da er einfach wieder "schnell" anwesend sein will (Also die Activity) und dadurch halt das Parsen hinten anstellt?
Denn wenn ich alles komplett in Java programmire funktionier es..!
MfG
mit folgendem Code möchte ich eine HTML Seite auslesen:
Code:
InputStream is = null;
try
{
URL url = new URL("https://www.android-hilfe.de/forum/android-app-entwicklung.9/html-parsing.5288.html");
is = url.openStream();
String sc = new Scanner( is ).useDelimiter("\\Z").next();
Log.v("INDEX=1", sc);
// Ligen - ausschlielich LIEGEN!
Pattern pattern = Pattern.compile("document.*?<img");
Matcher match = pattern.matcher(sc);
Er liest bzw. bekommt nicht die Komplette seite!
Das Log.v - also sc hat nur ca 8 zeilen:
02-23 17:01:52.950: V/INDEX=1(2402): <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" dir="ltr" lang="de"> <head>
02-23 17:01:52.950: V/INDEX=1(2402): <base href="https://www.android-hilfe.de/forum/android-app-entwicklung.9/html-parsing.5288.html" /> <meta http-equiv="Content-Type" content="text/html; charset=ISO-8859-1" /> <meta name="keywords" content="HTML,Parsing, HTML Parsing, android, android forum, samsung galaxy s, htc desire, nexus one, htc hero, motorola milestone" /> <meta name="description" content="Ich habe gerade erst mit der Enwticklung von Androidanwendungen angefangen. Da ich bereits ein erfahrener Java-Enwtickler bin war nicht allzu viel" /> <style type="text/css" id="vbulletin_css">
02-23 17:01:52.950: V/INDEX=1(2402): /**
02-23 17:01:52.950: V/INDEX=1(2402): * vBulletin 3.8.7 CSS
02-23 17:01:52.950: V/INDEX=1(2402): * Style: 'Android-Hilfe.de - Standard'; Style ID: 8
02-23 17:01:52.950: V/INDEX=1(2402): */
02-23 17:01:52.950: V/INDEX=1(2402): @import url("https://www.android-hilfe.de/clientscript/vbulletin_css/style-5603827b-00008.css");
02-23 17:01:52.950: V/INDEX=1(2402): </st
02-23 17:01:52.950: V/!Hallo(2402): INDEX=0
Wieso liest er nicht den Kompletten Quelltext?
Liegt das an Android und deren "Internetverbdinung"? Da er einfach wieder "schnell" anwesend sein will (Also die Activity) und dadurch halt das Parsen hinten anstellt?
Denn wenn ich alles komplett in Java programmire funktionier es..!
MfG