ich habe eine Seite die mit Java Script geschrieben ist. Ich müsste die Website aufrufen und dann den erstellten Quelltext irgendwie lesen. Vllt in nem String speichern oder direkt nach bestimmten Elementen suchen.
Leider weiss ich nicht genau wie das geht. Die Webseite soll NICHT angezeigt werden, ich brauche nur ein paar Daten aus dem Quelltext.

Ich habe das mit http Client probiert aber das wird nicht unterstützt (vermutlich weils ne Java Script Seite ist?) Auch mit einem URL Objekt habe ich es versucht aber das ging auch nicht.... Ich weiss jetzt gar nicht ob ich da überhaupt auf dem richtigen Weg bin.
Zunächst mal eine Sache vorweg. JavaScript wird beim Client und nicht auf dem Server ausgeführt. Wenn du also den Quelltext der Seite einliest wirst du (anders als z. B. bei PHP) auch den JavaScript Quelltext sehen und nicht den Output des JavaScript.

Wenn es das ist was du willst, dann kannst du AsyncTask eine URLConnection aufbauen und dir den Quelltext als String zurückgeben lassen.
Ist das deine Seite? Oder versuchst du Infos aus fremden Seiten zu holen?

Beides erfordert unterschiedliche Techniken.

Es handelt sich um die Seite Pass.Telekom.De ich möchte dort mein internetvolumen auslesen. Ich habe die Seite mal auf dem Laptop im Firefox angeschaut... Wenn ich einfach den Quelltext anschaue, sehe ich nur Java Script, wenn ich die Seite speicher und dann mit dem Texteditor angucke sehe ich den Code, den ich auslesen möchte.
Du musst herrausfinden wie die Seite funktioniert. Also vergiss erstmal die Android App Sache und löse erstmal dieses Problem.

Wenn der Javascript Code z.B. dein Volumen vom Server abfragt, dann kannst du das auch tun.

Das wäre meine erste Vermutung, ist heutzutage eine beliebte und verbreitete Technik.

D.h. es wäre möglich das du nur ne bestimmte URL aufrufen musst und dann die Daten in einer json/xml Datei bekommst.

Meine Idee war es die Internet Seite irgendwie temporär zu speichern und dann auszulesen. So wie ich es am PC auch gemacht habe
Geht das nicht auch irgendwie?
Deine Idee ist nicht zielführend. Und die macht auch wesentlich mehr Arbeit als es gleich richtig zu machen ;-)

Wenn du Daten aus fremden Webseiten klauen willst musst du erstmal die Funktionsweise dieser Seiten verstehen.

Aber wenns unbedingt sein muss. Schau dir mal Webview an. Da sollte man die Seite laden können und dann auf die fertige Seite zugreifen können.


Das Problem ist halt das ich nicht blicke wie die Seite funktioniert :D sonst würde ich es auch richtig und professionell machen. Naja ich werde mir das ändert dann nochmal angucken. Danke
Dann poste doch mal den Quelltext
(Am besten hier
Aber vorher schauen ob persönliche Daten drin sind und diese AusXen.

Also hier mal der komplette Java script Code der Website:

function contains(b, a) {
  return b.indexOf(a, 0) > 0
function notifyApp(a) {
  if (window.external && typeof window.external.notify === 'function') {
function getStyle(c, a, b) {
  return getAutoStyle(c, a, a, b)
function getAutoStyle(d, c, a, b) {
  var e = b;
  if (d === undefined) {
    return e
  if (d.currentStyle) {
    e = d.currentStyle[c]
  } else {
    if (document.defaultView && document.defaultView.getComputedStyle) {
      e = document.defaultView.getComputedStyle(d, null).getPropertyValue(a)
  if (isNaN(parseInt(e))) {
    e = b
  return e
function getPassListWidth() {
  var b = parseInt(getStyle(document.getElementsByClassName('container').item(0), 'max-width', window.innerWidth));
  var c = parseInt(getStyle(document.getElementById('content'), 'margin-left', 0));
  var a = Math.min(window.innerWidth, b) - c;
  return a
function getBoxWidth(b, c) {
  var a = parseInt(getStyle(b, 'width', c));
  a += getBoxHorizontalSpacing(b, 0);
  return a
function getBoxHorizontalSpacing(b, e) {
  var c = parseInt(getStyle(b, 'margin-left', 0)) + parseInt(getStyle(b, 'margin-right', 0));
  var a = parseInt(getStyle(b, 'border-left-width', 0)) + parseInt(getStyle(b, 'border-right-width', 0));
  var d = 0;
  if (!contains(navigator.userAgent.toLowerCase(), 'firefox')) {
    d = parseInt(getStyle(b, 'padding-left', 0)) + parseInt(getStyle(b, 'padding-right', 0))
  } else {
    a -= 1
  if (contains(navigator.userAgent.toLowerCase(), 'webkit')) {
    a += 1
  return d + c + a
function getBoxHeight(b, e) {
  var f = parseInt(getStyle(b, 'height', e));
  var d = parseInt(getStyle(b, 'padding-top', 0)) + parseInt(getStyle(b, 'padding-bottom', 0));
  var c = parseInt(getStyle(b, 'margin-top', 0)) + parseInt(getStyle(b, 'margin-bottom', 0));
  var a = parseInt(getStyle(b, 'border-top-width', 0)) + parseInt(getStyle(b, 'border-bottom-width', 0));
  f += d + c + a;
  return f
function getMaxHeight(b) {
  var d = document.getElementsByClassName(b);
  var c = 0;
  for (var a = 0;
  a < d.length;
  a++) {
    if (d[a].clientHeight > c) {
      c = d[a].clientHeight
  return c
function alignHeightByClassName(b) {
  var d = document.getElementsByClassName(b);
  var c = getMaxHeight(b);
  for (var a = 0;
  a < d.length;
  a++) {
    d[a].style.height = c + 'px'
function alignTopMarginByClassName(c, a) {
  var e = document.getElementsByClassName(c);
  var d = getMaxHeight(c);
  for (var b = 0;
  b < e.length;
  b++) {
    var f = parseInt(d - e[b].clientHeight);
    e[b].style.marginTop = parseInt(a + f) + 'px'
function determineBoxesPerRow(c, b) {
  var a = Math.ceil(c / b);
  return Math.ceil(c / a)
function calculateOptimalOfferBoxWidth(b, c) {
  var a = b / c;
  return Math.min(a, 1.75 * offerBoxWidth)
function updateOrientation() {
  popup = document.getElementById('popup');
  if (popup) {
  window.scrollTo(0, 1)
function layoutPassBoxes() {
  var l = document.getElementById('offers');
  if (l) {
    var c = Math.max(1, Math.floor(getPassListWidth() / offerBoxWidth));
    var n ='offer_list'));
    var g ='offer_box'));
    var f = n.length;
    var b = Math.ceil(g.length / c);
    var m = determineBoxesPerRow(g.length, c);
    for (var p = 0;
    p < b;
    p++) {
      var j = document.createElement('div');
      j.className = 'offer_list';
      var d = p * m;
      for (var k = d;
      k - d < m && k < g.length;
      k++) {
        var h = g[k];
        var o = calculateOptimalOfferBoxWidth(getPassListWidth(), m) - spacingForOfferBoxes; = o + 'px';
        h.getElementsByClassName('offer_features').item(0).style.height = '';
    for (var e = 0;
    e < f;
    e++) {
    alignTopMarginByClassName('offer_title', originalOfferTitleMarginTop);
    alignTopMarginByClassName('listHeader', originalListHeaderMarginTop)
  var a = document.getElementById('popup');
  if (a) {
function centerPopup(a) {
  var c = (window.innerWidth - getBoxWidth(a, 500)) / 2; = c + 'px';
  var b = (window.innerHeight - getBoxHeight(a, 500)) / 2; = b + 'px'
function getBaseUrl() {
  var a = document.getElementsByTagName('script') [0].src;
  a = a.replace(/scripts\/.*/, '');
  return a
function cancelSelection(c) {
  var a = new XMLHttpRequest();'GET', c, false);
  if (a.status === 200) {
    var d = document.getElementById('overlay');
    var b = document.getElementById('popup'); = 'none'; = 'none';
    b.innerHTML = '';
    return false
  return true
function requestInPopup(i, d, a, e, b) {
  if (i.indexOf('voucher') >= 0) {
    return true
  var g = document.getElementById('overlay');
  var c = document.getElementById('popup');
  c.innerHTML = '<div class="loading"> </div>'; = 'block'; = 'block';
  var f = new XMLHttpRequest();, i, true);
  f.onreadystatechange = function () {
    if (f.readyState === 4) {
      if (f.status !== 200) {
        window.location = self.location;
      var j = f.responseText;
      var n = j.match(/.*<meta name="apollo-page-id" content="(transparency|confirmPass|error|xtcError|errorPurchase|redeemVoucher)" \/>.*/);
      if (!n) {
        document.body.innerHTML = j;
      j = j.replace(new RegExp('<head>.*</head>', 'ig'), '<HUT/>');
      j = j.replace(new RegExp('.*<div id="page_', 'ig'), '<div id="popup_');
      var k = document.getElementById('popup');
      k.innerHTML = j;
      var m = document.getElementById('btnCancel');
      if (m === null) {
        var l = document.createElement('div');
        l.setAttribute('id', 'buttonBar');
        m = document.createElement('a');
        m.setAttribute('id', 'btnCancel');
        m.setAttribute('class', 'button');
        m.setAttribute('href', b);
        m.innerHTML = e;
        k.getElementsByClassName('container') [0].appendChild(l)
      m.setAttribute('onclick', 'return cancelSelection(\'' + b + '\');');
  var h = null;
  if (d) {
    h = getMessageBody(d);
    f.setRequestHeader('Content-Type', 'application/x-www-form-urlencoded')
  return false
function openInPopup(c, b, a) {
  return requestInPopup(c, null, 'GET', b, a)
function submitInPopup(d, c, e, b, a) {
  return requestInPopup(d, c, e, b, a)
function getMessageBody(a) {
  var f = '';
  for (var g = 0;
  g < a.elements.length;
  g++) {
    var d = a.elements[g];
    if ( {
      var l = d.nodeName.toLowerCase();
      var k = d.type ? d.type.toLowerCase()  : '';
      if (l === 'input' && (k === 'checkbox' || k === 'radio')) {
        if (!d.checked) {
      var c = '';
      if (l === 'select') {
        for (var e = 0;
        e < d.options.length;
        e++) {
          var h = d.options[e];
          if (h.selected) {
            var b = h.getAttributeNode('value');
            var m = (b && b.specified) ? h.value : h.text;
            if (c != '') {
              c += '&'
            c += encodeURIComponent( + '=' + encodeURIComponent(m)
      } else {
        c = encodeURIComponent( + '=' + encodeURIComponent(d.value)
      if (f != '') {
        f += '&'
      f += c
  return f
var responseText;
function openUri(e, c) {
  if (c === 0) {
    return true
  var b = document.getElementById('overlay');
  var a = document.getElementById('popup'); = 'block'; = 'block';
  a.innerHTML = '<div class="loading"> </div>';
  var d = new XMLHttpRequest();'GET', e, true);
  d.onreadystatechange = function () {
    if (d.readyState === 4) {
      if (d.status === 200 && !d.responseText.match(/.*"apollo-page-id" content="restartRequired".*/)) {
        responseText = d.responseText;
        setTimeout('document.body.innerHTML = responseText; init();', c)
      } else {
        setTimeout('window.location.reload();', c)
  return false
function init() {
  if (document.getElementsByClassName('offer_box').length > 0) {
    offerBoxWidth = getBoxWidth(document.getElementsByClassName('offer_box').item(0), 250);
    spacingForOfferBoxes = getBoxHorizontalSpacing(document.getElementsByClassName('offer_box').item(0), 0);
    originalOfferTitleMarginTop = parseInt(getAutoStyle(document.getElementsByClassName('offer_title') [0], 'marginTop', 'margin-top', 0));
    originalListHeaderMarginTop = parseInt(getAutoStyle(document.getElementsByClassName('listHeader') [0], 'marginTop', 'margin-top', 0));
    window.onresize = layoutPassBoxes;
    window.onorientationchange = updateOrientation;
  if (document.getElementById('purchaseNotification')) {
Da fehlt doch noch was. Das ist doch nicht die komplette Website.

Und hier im Forum gepostet ist das nicht lesbar.

Also bin grad am Laptop. Wenn ich mir im Firefox den Quellcode anzeigen lasse, sieht der so aus :

(Sorry für die Foramtierung aber er zeigt mit trotz diesem Pastebin alles in einer Zeile an.)
[*]<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "">
<html><head><meta name="viewport" content="width=device-width" /><meta name="apollo-target-device" content="Firefox_6up" /><meta name="apollo-page-id" content="home" /><meta name="language" content="de" /><meta name="mobile-web-app-title" content="Datennutzung" /><meta name="apple-mobile-web-app-title" content="Datennutzung" /><title>Datennutzung - SpeedOn</title><link rel="stylesheet" type="text/css" href="/styles/css3-web-firefox$web$TMDE.css" /><link rel="apple-touch-icon-precomposed" href="../images/touch-icon.png" /><link rel="icon" sizes="192x192" href="../images/favicon.png" /><script type="text/javascript" src="/scripts/web.js"></script></head><body class="speed pad" onload="init();"><div id="screenHeaderBar"> </div><div id="page_home" class="container"><a id="lnkHome" name="lnkHome" href="/home" class="logoLink"><div id="logoBar"><div id="logoLeft"> </div><div id="logoRight">SpeedOn</div></div></a><div id="titleBar"><div class="filterOptions roamingInfo"><a href="/home" class="filterButton left active">Inland</a><a href="/info/roaming" class="filterButton right">Ausland</a></div><h2 id="pageTitle" class="title">SpeedOn</h2><div class="hr"><hr /></div></div><div id="content" class="pageContent"><div class="passStatus"><div class="progress emphasized"><div class="barTextAbove color_default"></div><div class="progressBar"><div class="indicator color_default" style="width:7%"> </div></div><div class="barTextBelow color_default"><span class="colored">65,13 MB</span> von 1 GB verbraucht</div></div><table class="frame"><tr class="infoLine"><td><table><tr><td class="infoLabel totalVolume">Datenvolumen:</td><td class="infoValue totalVolume">1 GB</td></tr></table></td></tr><tr class="infoLine"><td><table><tr><td class="infoLabel maxBandwidth">Download-Geschwindigkeit:</td><td class="infoValue maxBandwidth">max. 21,6 Mbit/s</td></tr></table></td></tr><tr class="hrUnderlyingPass"><td /></tr><tr class="infoLine"><td><table><tr><td colspan="2" class="infoLabel passName">Ihr Telekom Datentarif</td></tr></table></td></tr><tr class="infoLine"><td><table><tr><td class="infoLabel billingPeriod">Abrechnungsmonat:</td><td class="infoValue billingPeriod">Februar 2015</td></tr></table></td></tr><tr class="infoLine"><td><table><tr><td class="infoLabel remainingTime">Verbleibende Zeit:</td><td class="infoValue remainingTime"><span class="value">7</span> Tage <span class="value">12</span> Std.</td></tr></table></td></tr></table></div><div class="infoBox exhaustionInfo">Nach Verbrauch Ihres SpeedOn Passes gilt wieder Ihr Telekom Datentarif.</div><p>Die angezeigten Informationen sind zeitverzögert und können vom tatsächlichen Verbrauch abweichen.<br/>Letzte Aktualisierung: 21.02.2015 um 10:56 Uhr (MEZ/MESZ)</p><p></p><div><p class="bookmark">Tipp: Richten Sie sich für diese Seite ein Lesezeichen ein - und Sie sind immer über Ihren Datenverbrauch informiert. </p></div></div><div id="footer"><p id="customerCare" class="customerCare">Bei Fragen wenden Sie sich an den Kundenservice:<br/>Privatkunden:<br/>Kurzwahl vom Handy: <a class="phonenr" href="tel:2202">2202</a><br/>aus dem Festnetz: <a class="phonenr" href="tel:08003302202">0800 330-2202</a><br/>Geschäftskunden:<br/>Kurzwahl vom Handy: <a class="phonenr" href="tel:2828">2828</a><br/>aus dem Festnetz: <a class="phonenr" href="tel:08003302828">0800 330-2828</a></p><p id="costInfo" class="costInfo">Diese Seite ist für Sie kostenfrei.</p><div id="links"><div id="copyright">© 2011 - 2014 Deutsche Telekom  </div><p><span id="lang_switching">Sprache wechseln:  <a href="/home?lang=en" class="lnkLang"><span>English</span></a> | </span><a href="/history/domestic">Buchungen</a> | <a href="/imprint">Impressum</a> | <a href="/faqs">FAQ</a></p></div></div></div><div id="overlay" class="hidden"> </div><div id="popup" class="hidden"><div class="loading"> </div></div></body></html>

Die Idee ist das du den Text auf Pastebin eingibst und dann die URL postest ;-)
Das ist doch nicht due die Webseite wie sie vom Server kommt, diese Seite wurde doch schon durch das JavaScript verändert. Oder?

Ja, das ist das was ich bekomme wenn ich die Seite aufrufe. Wie sie davor aussieht weiss ich nicht. Ich habe gerade probiert JavaScript auszuschalten aber irgendwie wird es trotzdem noch angezeigt... Keine Ahnung, lassen wir das einfach, ist hoch ne Nummer zu hoch für mich....

Aber danke für deine Mühe...
Das Javascript ist gänzlich unwichtig ... das macht ein paar Layoutmanipulationen, das braucht dich eigtl. nicht interessieren. Im HTML-Quelltext steht doch folgendes: "<span class="colored">65,13 MB</span> von 1 GB verbraucht</div>" das ist doch die Information die du benötigst?

Reading Directly from a URL (The Java™ Tutorials > Custom Networking > Working with URLs)
Reading from and Writing to a URLConnection (The Java™ Tutorials > Custom Networking > Working with URLs)

Du holst dir den Quelltext, parst diesen und holst dir die für dich wichtige Information heraus ...

Wobei du zu 99% noch mehr Probleme haben wirst, da du dich noch um Session, Login, etc. kümmern musst ...
@Kleinerkathe: Das hatte ich schon porbiert, jedoch kommt es hier zu einem Fehler. Die Webseite wird nicht richtig aufgerufen... "Direkter Zugriff auf die Seite nicht möglich."

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "">
<!--     <meta http-equiv="Refresh" -->
<!--    content="5; url=portal/home?event=meta_refresh" /> -->    
<title>Travel & Surf - Weiterleitung</title>    
<link rel="stylesheet" type="text/css" href="stylesheet-telekom.css" />
<div id="container">
    <div id="logo">
        <div id="logoLeft">
        <div id="logoFill">
    <div id="title" class="pageTitle">
    <h1 class="header">Weiterleitung</h1>
    <div id="content" class="pageContent">
    <p>Direkter Zugriff auf die Seite nicht möglich.</p>
     <p>Sie werden in 5 Sekunden auf die Startseite weitergeleitet.  Wenn dies nicht automatisch geschieht klicken Sie bitte <a  href="portal/home?event=unknown_browser">hier</a>.</p>
    <div id="footer">
        <div id="links"><a href="portal/imprint?event=unknown_browser">Impressum</a>
        <p id="costInfo" class="costInfo">Diese Seite ist für Sie kostenfrei.</p>
Das ist kein Fehler ;-)

Das ist die Seite die unter dieser URL ist.

Hängst du an die URL ein "portal/home?event=meta_refresh" dann bekommst du gleich die richtige.


Dann ist dein Problem nicht das JavaScript (wie anfangs vermutet) sondern das....

Ja, wenn man so was macht dann am besten per wget in der Konsole. Das was der Browser da automatisch macht verwirrt nur.

Du hast im Browser immer eine andere Seite gesehen als du aufgerufen hast weil die Seite automatisch ne andere geladen hat.

rihntrha schrieb:

Hängst du an die URL ein "portal/home?event=meta_refresh" dann bekommst du gleich die richtige.
Ja, wenn man so was macht dann am besten per wget in der Konsole. Das was der Browser da automatisch macht verwirrt nur.

Du hast im Browser immer eine andere Seite gesehen als du aufgerufen hast weil die Seite automatisch ne andere geladen hat.


Nein, wenn ich "portal/home?event=meta_refresh" dran hänge bekomme ich eine FileNotFaoundExcetion. Die URL existiert dann nicht. wgat sagt dazu:
--2015-02-21 13:38:44-- Datennutzung
Connecting to||:80... connected.
HTTP request sent, awaiting response... 302 Moved Temporarily
Location: Datennutzung [following]
--2015-02-21 13:38:44-- Datennutzung
Reusing existing connection to
HTTP request sent, awaiting response... 511 Unknown
2015-02-21 13:38:44 ERROR 511: Unknown.

Im Browser geht der Link, er leitet mich auf "" weiter.
Mit dieser Adresse, ist das selbe... FileNotFoundException und wget:
--2015-02-21 13:45:22-- Datennutzung
Connecting to||:80... connected.
HTTP request sent, awaiting response... 511 Unknown
2015-02-21 13:45:23 ERROR 511: Unknown.

