Google News Grabber

Bash, Shell, PHP, Python, Perl, CGI
checksumde
Posts: 19
Joined: 2003-07-25 23:58

Google News Grabber

Post by checksumde »

Hallo,

ich hab mir folgendens Script modifiziert:

Code: Select all

<?php

$resultCount = '6';
$newsShort= 'news.google.de';
$newsPage = 'http://news.google.de/news/de/de/mainlite.html';

// Ã?berschriften. Einfach anpassen oder erweitern nach Wunsch
$headlines = array("","Schlagzeilen","International","Deutschland","Wirtschaft","Technik","Sport");

// Laden der Inhalte von der $newsPage
$open = fopen ($newsPage,"r");
$read = fread($open, 900000);
fclose($open);

// Anhand Rubriken splitten
$rubrikread = explode("<a name=",$read);



// Aufbau der HTML Seite
echo '
	<html>
	<head><title>'.$_GET["title"].'</title><meta http-equiv="refresh" content="3600; URL="news.php">
	<link href=layout.css type=text/css rel=stylesheet></head>
	<body bgcolor=#FBFDE5 link=#003399 vlink=#003399 alink=#003399 topmargin=0 leftmargin=0 marginheight=0 marginwidth=0>
		<table width=400 cellspacing=0 cellpadding=0 border=0><tr><td>
';

 
for ($h = 1;$h<count($headlines);$h++){ 

	// Filtern der aktuellen Inhalte nach $result
	preg_match_all("|<a class=y href="/url?q=(.*)">(.*)</a><br><font size=-1><b><font color=#6f6f6f>(.*)&-</font>(.*)</b><br>(.*)<br><a href="/url?q=(.*)">(.*)</a> <font class=f>(.*)</font><br><a href="/url?q=(.*)">(.*)</a> <font class=f>(.*)</font>|U",$rubrikread[$h],$result);

	// Ausgabe der Ã?berschrift
	echo '<font face=verdana><a name='.$headlines[$h].'></a><h3>'.$headlines[$h].'</h3></font>';

	// Ausgabe der Newstexte
	for ($i = 0; ($i <= $resultCount) && (isset($result[1][$i])); $i++) {
	echo '
				<font size=1 face=verdana><font size=2><b><a href="http://news.google.de/url?q='.$result[1][$i].'" target="_blank" id=l>'.$result[2][$i].'</a></b></font>
				<br>'.$result[5][$i].' ('.$result[3][$i].')
				<br><a href="http://news.google.de/url?q='.$result[6][$i].'" target="_blank" id=l>'.$result[7][$i].'</a> ('.$result[8][$i].')<br>
				<a href="http://news.google.de/url?q='.$result[9][$i].'" target="_blank" id=l>'.$result[10][$i].'</a> 
				('.$result[11][$i].')
				</font><br><br>
	';
	}

}

// Abschluß der HTML Seite
echo '</font></td></tr></table></body></html>';

?>
es handelt sich dabei um einen google newsgrabber der bei jedem aufruf die
aktuellen schlagzeilen von der google seite runterläd, ich hab das ding auch
schon etwas modifiziert und angepasst, das problem was ich nun aber habe ist
das ich das script über ein chronjob jede stunde ausführen möchte und aus
dem ergebnis eine statische html datei erzeugen will, andernfalls erzeugt
das script in seiner jetzigen form eine menge unnützer traffic,
also hätte jmd lust das script entsprechend abzuändern,
ich bin in php leider nicht so bewandert


mfg
checksum
dodolin
Posts: 3840
Joined: 2003-01-21 01:59
Location: Sinsheim/Karlsruhe

Re: Google News Grabber

Post by dodolin »

a) Ich frage mich, was das bringt? Wer die Google-News haben will, wird wohl auch zu Google-News gehen...
b) Ich frage mich, ob du das wie auf http://news.google.de/intl/de_de/about_google_news.html beschrieben mit Google abgesprochen hast oder ob du einfach nur billig und unlauters den Kontent von dort klaust?