Forum

> > Off Topic > HTML, PHP, JAVA etc. Probleme
Forums overviewOff Topic overviewLog in to reply

German HTML, PHP, JAVA etc. Probleme

37 replies
Page
To the start Previous 1 2 Next To the start

old Re: HTML, PHP, JAVA etc. Probleme

SAB
User Off Offline

Quote
Hi,

nehm jetzt einfach mal den Thread um meine Frage zu stellen.

Ich wollte mit php eine den Text einer externen Seite auslesen. Ich hab einige Parser bereits gefunden, jedoch abgesehen davon das diese nicht funktioniert haben (fragt mich nicht wieso ) bin ich mir auch garnicht sicher, ob sie überhaupt das machen was ich will.

Also ich möchte so etwas bastelen wie den Reader in Safari, also das man einfach nur den Text der Seite hat ohne Menüs, Werbung und sonn Zeug das man nicht brauch.

Kann mir da jemand helfen?

Schöne Grüße

SAB

old Re: HTML, PHP, JAVA etc. Probleme

DC
Admin Off Offline

Quote
Du kannst mit dem PHP Befehl fopen die Datei lesen (PHP Settings müssen das Laden von entfernten Dateien erlauben). Danach kannst du mit strip_tags alle Tags entfernen und es mit echo ausgeben. Das war's eigentlich schon.

Allerdings sind dabei dann auch Texte von Menüs etc. noch enthalten. Also evtl. willst du vorher noch bestimmte Bestandteile rausnehmen mit den String-Befehlen von PHP.

old Re: HTML, PHP, JAVA etc. Probleme

SAB
User Off Offline

Quote
Edit:
Ich würd jetzt gerne das hier verwende https://code.google.com/p/ganon/ . Aber da ich mich leider kaum mit php auskenne und die Anleitung nur sagt "include Datei" weiß ich jetzt leider nicht mehr weiter

Wie kann ich denn jetzt da eine URL dran weitergeben? Ubd wie starte ich das dann?

Dabke Schonmal für eure Hilfe!


-----------------------------

So, hab das etzt grade mal ausprobiert:

Spoiler >


War jetzt der erst beste Bild Artikel, aber muss dann mal gucken, dass ich die ganzen Scipt parts zwischen drin rausfilter und mir irgendeine allgemeine Funktion raussuche die mir die ganzen Links von Leib hält

Aber danke für die schnelle Antwort!

ICh meld mich wenns was neues gibt (hoffentlich nicht zu große Probleme dann)

Schöne Grüße

SAB
edited 1×, last 06.10.12 08:28:18 pm

old Re: HTML, PHP, JAVA etc. Probleme

Hador
User Off Offline

Quote
Ich rate dir für Referenzen zu PHP http://php.net , dort kannst du alles so halbwegs nachvollziehbar nachlesen.

include-Dateien werden die Dateien genannt, die du in deine Website einliest (include, engl. = einbringen)

ein Beispiel:

1
include 'text.php';

Das würde die Datei "text.php" einlesen und wiedergeben.
Wenn die richtigen Einstellungen in der php.ini-Datei eingestellt sind, geht das auch mit externen Dateien (z.B. "include 'http://www.unrealsoftware.de/index.php';" würde die Hauptseite von US einlesen und dem Endnutzer wiedergeben.

old Re: HTML, PHP, JAVA etc. Probleme

SAB
User Off Offline

Quote
Aber wie läuft das dann ab, dass dieser Parser den ich mir rausgesucht hab die Seite (zum Beispiel Unrealsoftware.de/index.php) parst? Wie muss ich das dann schreiben?

old Re: HTML, PHP, JAVA etc. Probleme

Hador
User Off Offline

Quote
Im Prinzip steht doch hier alles, was du wissen musst: https://code.google.com/p/ganon/

Du kannst die da aufgelisteten Befehle eben nutzen, um die Seite zu manipulieren, wie mit CSS.

Du musst ganz oben auf deinem Dokument
1
include('path/ganon.php');
eingeben; dabei das "path" durch den Ordnerpfad der Datei ganon.php ersetzen.
Dann kannst du die Befehle, die Ganon hat (näheres hier: https://code.google.com/p/ganon/w/list ) nutzen, um Elemente in deinem Dokument zu verändern, wie z.B. Menüs entfernen, styles ändern etc.

old Re: HTML, PHP, JAVA etc. Probleme

SAB
User Off Offline

Quote
So, hab jetzt alles hinbekommen

Gibt es wohl auch einen Eleganten Weg zum Beispiel aus der Bild-Seite nur den Artikel zu extrahieren? Also das man wirklich nur die Textbköcke hat...und das ohne das für jede ubterschiedlch geschriebene Seite neu zu machen?

old Re: HTML, PHP, JAVA etc. Probleme

ohaz
User Off Offline

Quote
Die Bild Seite verwendet sicher wiederkehrende Muster auf ihrer Seite. So etwas wie "Jeder Artikel fängt mit einem <div class="article"> an" oder ähnliches. Such einfach nach diesen wiederkehrenden Mustern und filtere nach denen - dann sollte das auf jeden Fall bei den meisten Artikeln klappen

old Re: HTML, PHP, JAVA etc. Probleme

SAB
User Off Offline

Quote
Ich meinte eher von der Bild-Seite weg gehend, irgendwelche Seiten, so dass man allen Schnickschnack weg hat und nur das Wesentliche sieht...so wie halt in safari beim reader

Könnte man nicht gucken wie viel Text in einem div Tag steht und es dann danach einteilen...nur sonne idee, aber ich hab keinen plan wie ich das umsetzten soll

Oder hat hier vllt jemand noch ne andere Idee?

old Re: HTML, PHP, JAVA etc. Probleme

SAB
User Off Offline

Quote
Das was ich gern machen würde ist eine Art Online-Reader, also ne Seite in die ich ne URL eingebe und diese Seite wird dann neu gestaltet ubd ich kann ganz ebtspannt die Texte lesen. Also eine universale Möglichkeit.

Hat da jenand ne idee für ne umsetzung?

old Re: HTML, PHP, JAVA etc. Probleme

Hador
User Off Offline

Quote
universell ist im Internet immer schwer. Deshalb gibt es ja Feeds etc.

Jeder, der eine Website gestaltet, gestaltet sie anders. Das ist nun mal so, da kann man nicht viel daran ändern.

Was du höchstens noch machen könntest wäre eine Art Algorithmus, der den größten, zusammenhängenden Text heraussucht und den dann darstellt.

old Re: HTML, PHP, JAVA etc. Probleme

Hador
User Off Offline

Quote
Von der Theorie her würde ich eine Funktion schreiben, die alle div- und td-Elemente einer Seite nach Inhalt durchsucht und den kompletten Inhalt (abzüglich aller Tags sowie die inhalte von style- und scripttags) zählt, um dann das größte div-Element darzustellen.
Dürfte recht aufwendig werden, könnte aber gut funktionieren.

old Re: HTML, PHP, JAVA etc. Probleme

SAB
User Off Offline

Quote
EDIT: Hmpf Das erste Problem...

Wenn ich meinen Parser so einbaue (nur mal ein simples Beispiel hier) wieso wird das dann nicht ins <div> so eingestzt, dass mein restliches Layout beibehalten wird?
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
<div>
<?php
include_once('ganon.php');
	//PHP4 users, make sure this path is correct!

	//Only keep everything between body tags, delete the rest.
	$html = file_get_dom('http://www.schalke04.de/');
	$html->select('"!DOCTYPE"', 0)->delete();
	$html->select('head', 0)->delete();
	$html->select('body', 0)->detach(true);
	$html->select('html', 0)->detach(true);

	 echo $html;
?>
</div>
Weiss das vllt jemand?

Danke schonmal für eure GEduld mit mir

-------------------


ok, ich werd mich mal dran versuchen...hoffe ich hab nicht zu große Probleme dabei

das würd ich dann noch mit ner Funktion verbinden, die alle Links auf der Seite( Menüs) extrahiert und somit hab ich dann den gleichen Text und Menüs der Seite in neuem Style (Theoretisch)

Danke schonmal für deine Hilfe! Ich werd entweder den fertigen Code mal posten (oder meine Probleme )
edited 1×, last 09.10.12 09:12:37 am

old Re: HTML, PHP, JAVA etc. Probleme

Hador
User Off Offline

Quote
Hast du vllt. einen Link oder könntest zumindest sagen, was kommt (oder eben was nicht kommt)? Fehlermeldungen? Was wird angezeigt?

old Re: HTML, PHP, JAVA etc. Probleme

SAB
User Off Offline

Quote
Also Problem Nummer1:
Ich lade eine externe Seite parse diese, jedoch sich and das aktuelle Design anzupassen(in div tag) breitet es sich über die komplette Seite aus.
Spoiler >


Problem Nummer 2:
Ich habe eine Googleparser...jedoch funktioniert (obwohl ich rein garnichts änder) ab und zu mal, also mal gibt er mir die links und mal einfaxh nicht...
Spoiler >


Problem Nummer 3:
Wie bereits gesagt habe ich einen Googleparser und einen normalen Parser, welche abgesehen von den beschrieben Problemen einzeln gut funktionieren...jedoch wenn ich einfach nur die Variable vom Googleparser an den normalen Parser weitergebe funktioniert es nicht
Spoiler >


Kann mir vllt jemand helfen?

Bin leider grade nicht an meinem PC, sber ich werde später die Codes reinstellen, aber vllt. Hat ja bereits jemand eine Lösung

Beste Grüße
edited 1×, last 10.10.12 04:21:58 pm

old Re: HTML, PHP, JAVA etc. Probleme

0TT0
User Off Offline

Quote
ich habe eine frage zu spoilern:
wollte eigentlich einen spoiler ohne javaskript (mit css3) aber war mir dann zu kompiliziert..
bei googel habe ich nun den hier gefunden und ihn schon etwas verändert. ich möchte aber nun nicht bei jeden spoiler diesen ganzen text schreiben. wie kann ich das machen? und wer kann mir erklären wie der funktioniert?
To the start Previous 1 2 Next To the start
Log in to replyOff Topic overviewForums overview