1. Hast Du Lust, bei uns mitzuarbeiten und das AH-Team zu verstärken? Alle Details zu dieser aktuellen Herausforderung findest Du hier.
  1. StefMa, 23.02.2012 #1
    StefMa

    StefMa Threadstarter Gewerbliches Mitglied

    Hallo,

    mit folgendem Code möchte ich eine HTML Seite auslesen:
    Code:
            InputStream is = null;
            
            try
            {
                URL url = new URL("https://www.android-hilfe.de/forum/android-app-entwicklung.9/html-parsing.5288.html");
                is = url.openStream();
    
                String sc = new Scanner( is ).useDelimiter("\\Z").next();
                Log.v("INDEX=1", sc);
                
    // Ligen - ausschlielich LIEGEN!
                Pattern pattern = Pattern.compile("document.*?<img");
                Matcher match = pattern.matcher(sc);
    Das problem ist jetzt:
    Er liest bzw. bekommt nicht die Komplette seite!
    Das Log.v - also sc hat nur ca 8 zeilen:
    Wieso liest er nicht den Kompletten Quelltext?

    Liegt das an Android und deren "Internetverbdinung"? Da er einfach wieder "schnell" anwesend sein will (Also die Activity) und dadurch halt das Parsen hinten anstellt?

    Denn wenn ich alles komplett in Java programmire funktionier es..!

    MfG
     
  2. StefMa, 24.02.2012 #2
    StefMa

    StefMa Threadstarter Gewerbliches Mitglied

    Hallo,

    ich bearbeite den Source später mit Regexp:
    Code:
                Pattern pattern = Pattern.compile("<a.*?</a>");
                Matcher match = pattern.matcher(sc);
                
                while(match.find())
                {
                    String format = match.group().replaceAll("<a style=.*?>", "").replaceAll("</a>", "");
                    
                    format = replaceUml(format);
                    
                    ligen.add(format);
                }
    Also benötige ja den Code ja nur als String.
    Wäre dafür auch (sogar besser weil "Android-Comform") diese möglichkeit gut -> How to get HTML source code from url in android? - Stack Overflow

    Zum schluss hätte ich ja dann auch das result (also den Source Code der seite) als String und kann ihn über regexp bearbeiten..

    Oder?

    mfG Ice
     
Die Seite wird geladen...
Ähnliche Themen Forum Datum
[OFFEN] ClickListener in ViewPager (dynamischer Seitenaufruf) Android App Entwicklung 09.04.2017
[RÜCKMELDUNG FEHLT] Text und Bilder in View einbinden Android App Entwicklung 26.03.2017
Unschönes XML parsen Android App Entwicklung 30.11.2016
Data-Matrix scannen Android App Entwicklung 24.11.2016
Wie macht ihr einen Barcode-Scanner? Android App Entwicklung 29.09.2016
Du betrachtest das Thema "Parse HTML mit Scanner" im Forum "Android App Entwicklung",