FreewarWiki:Bot/Skripts/npclist.pl: Unterschied zwischen den Versionen

aus FreewarWiki, der Referenz für Freewar
Zur Navigation springen Zur Suche springen
K (beliebige Anzahl von Tausenderpunkten bei LP und A ermöglicht)
(&-zeichen in verwendung mit html-code wie &amp, durch unicode representation ersetzt; verwendung aus dem artikel quelltext nun möglich)
 
(7 dazwischenliegende Versionen von 3 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
{{Scriptquelltextverwendung}}
<pre>
<pre>
#!/usr/bin/perl
#!/usr/bin/perl
Zeile 6: Zeile 7:
use URI::Escape;
use URI::Escape;
use HTTP::Request;
use HTTP::Request;
use constant CUnknown => "?";


my $ua = LWP::UserAgent->new();
my $ua = LWP::UserAgent->new();
Zeile 32: Zeile 34:
         if ($c =~ /href=\"([^\"]*)/im) { # ... aus href="..." rausfummeln
         if ($c =~ /href=\"([^\"]*)/im) { # ... aus href="..." rausfummeln
             $url = $host . $1;
             $url = $host . $1;
             $url =~ s/&amp;/&/g;
             $url =~ s/\N{U+0026}amp;/&/g;
             push(@urllist, $url);
             push(@urllist, $url);
         }
         }
Zeile 49: Zeile 51:
         my $href;
         my $href;
         $href = $1 if ($anchor =~ /href\s*=\s*"([^"]*)"/);
         $href = $1 if ($anchor =~ /href\s*=\s*"([^"]*)"/);
         $href =~ s/&/&/g;
         $href =~ s/\N{U+0026}amp;/&/g;
         my $title;
         my $title;
         $title = $1 if ($anchor =~ /title\s*=\s*"([^"]*)"/);
         $title = $1 if ($anchor =~ /title\s*=\s*"([^"]*)"/);
Zeile 66: Zeile 68:


sub registerNpc {
sub registerNpc {
    my ($text, $href) = @_;
  my ($text, $href) = @_;
    my $request = HTTP::Request->new("GET", $href."?action=edit");
  my $request = HTTP::Request->new("GET", $href."?action=edit");
    my $response = $ua->simple_request($request);
  my $response = $ua->simple_request($request);
    my $c = $response->content();
  my $c = $response->content();
    $c =~ tr/\n/ /;
  $c =~ tr/\n/ /;
 
  my $atk = CUnknown;
  my $xp = CUnknown;
  my $lp = CUnknown;
  my $gm = CUnknown;
  my $drops;
  my @vklist;
  my @itemlist;
  my $bild;
  my $bildautor;
  my $baindex;
 
 
  if ($c =~ /\|\s*St..?rke\s*=\s*([0-9.]+)/i) {
    $atk = $1;
    $atk =~ s/\.//g;
  }
 
  if ($c =~ /\|\s*Lebenspunkte\s*=\s*([0-9.]+)/i) {
    $lp = $1;
    $lp =~ s/\.//g;
  }


    my $atk;
  $xp = $1 if ($c =~ /\|\s*XP\s*=\s*(\d+)/i);
    my $xp;
  $gm = $1 if ($c =~ /\|\s*Gold\s*=\s*(\d+)/i);
    my $lp;
  $bild = trim($1) if ($c =~ /\|\s*Bild\s*=\s*([^|}]*)/i);
    my $gm;
 
    my $drops;
 
    my @vklist;
  $bildautor = trim($1) if ($c =~ /\|\s*Bildautor\s*=\s*([^|}]*)/i);
    my @itemlist;
    my $bild;
    my $bildautor;


    #$atk = $1 if ($c =~ /\|\s*St..?rke\s*=\s*(\d+)/i);
  # Falls der BildAutor durch Verlinkungen | enthält überspringe dieses |
    if ($c =~ /\|\s*St..?rke\s*=\s*([0-9.]+)/i) {
  if (($bildautor =~ m/\[\[Benutzer:/i) or ($bildautor =~ m/\[\[User:/i)) {
  $atk = $1;
$baindex = length($bildautor) +1;
  $atk =~ s/\.//g;
$bildautor = trim($1) if ($c =~ /\|\s*Bildautor\s*=\s*(.{$baindex}[^|}]*)/i);
}
  }
    # $lp = $1.$3 if ($c =~ /\|\s*Lebenspunkte\s*=\s*(\d+)(\.(\d+))?/i);
if ($c =~ /\|\s*Lebenspunkte\s*=\s*([0-9.]+)/i) {
  $lp = $1;
  $lp =~ s/\.//g;
};
    $xp = $1 if ($c =~ /\|\s*XP\s*=\s*(\d+)/i);
    $gm = $1 if ($c =~ /\|\s*Gold\s*=\s*(\d+)/i);
    $bild = trim($1) if ($c =~ /\|\s*Bild\s*=\s*([^|}]*)/i);
    $bildautor = trim($1) if ($c =~ /\|\s*Bildautor\s*=\s*([^|}]*)/i);


    if ($c=~ /\|Vorkommen\s*=\s([^=]*)/) {
  if ($c=~ /\|Vorkommen\s*=\s([^=]*)/) {
        my $vk=$1;
      my $vk=$1;
        while ($vk =~ /\*\s*\[\[([^\]]+)\]\]/ogm)
      while ($vk =~ /\*\s*\[\[([^\]]+)\]\]/ogm)
        {
      {
            my $area = $1;
          my $area = $1;
            $area = $1 if ($area =~ /(.*)\|/);
          $area = $1 if ($area =~ /(.*)\|/);
            push(@vklist, $area);
          push(@vklist, $area);
        }
      }
    }
  }
    if ($c=~ /\|Items\s*=\s([^=]*)/) {
  if ($c=~ /\|Items\s*=\s([^=]*)/) {
        my $it=$1;
      my $it=$1;
        while ($it =~ /\*\s*\[\[([^\]]+)\]\]/og)  
      while ($it =~ /\*\s*\[\[([^\]]+)\]\]/og)  
        {
      {
            push(@itemlist, $1);
          push(@itemlist, $1);
        }
      }
    }
  }
    while ($c=~/\{\{Feld\|[^|]+\|[^|]+\|(\d+)\|(\d+)\}\}/ogm) {
  while ($c=~/\{\{Feld\|[^|]+\|[^|]+\|(\d+)\|(\d+)\}\}/ogm) {
        push(@vklist, "$1,$2");
      push(@vklist, "$1,$2");
     }
  }
  # nur ausgeben, wenn mindestens eine Eigenschaft erkannt wurde:
  if (($atk ne CUnknown) || $xp ne CUnknown || $lp ne CUnknown || $gm ne CUnknown) {
    print "$text;$atk;$lp;$xp;$gm;";
     print join("/", @vklist);
    print ";";
    print join("/", @itemlist);
    print ";$bild;$bildautor";
    print "\n";
  }


    if ($atk>0) {
        print "$text;$atk;$lp;$xp;$gm;";
        print join("/", @vklist);
        print ";";
        print join("/", @itemlist);
        print ";$bild;$bildautor";
        print "\n";
    }
}
}
</pre>
</pre>

Aktuelle Version vom 20. März 2012, 16:34 Uhr

Dieses Script ist hier lediglich archiviert und nicht direkt lauffähig. Wenn Du es benutzen möchtest, musst Du es lokal abspeichern und mit einem geeigneten Interpreter ausführen lassen. Zum Übernehmen solltest Du nicht den unten angezeigten Text verwenden, sondern den Quelltext des Wiki-Artikels: Dazu wählst Du Bearbeiten und kopierst den (meist zwischen PRE-Tags eingefassten) Scripttext.

Sofern Du die Scripte dauerhaft lokal abgespeichert hältst, solltest Du sie vor der nächsten Ausführung darauf prüfen, ob sie noch aktuell sind.

Letzter Bearbeiter: Zabuza — Zuletzt bearbeitet: 20.03.2012
#!/usr/bin/perl

use strict;
use LWP::UserAgent;
use URI::Escape;
use HTTP::Request;
use constant CUnknown => "?";

my $ua = LWP::UserAgent->new();
my $host = "http://www.fwwiki.de";
my $url = $host . "/index.php/Kategorie:NPCs";
my @urllist;




push(@urllist, $url);


# als erstes die URLs aufsammeln, die auf die aufeinanderfolgenden Kategorieseiten verweisen:
while($url ne "")  {
    my $request = HTTP::Request->new("GET", $url);
    my $response = $ua->simple_request($request);
    my $c = $response->content();


    $url = "";
    if ($c =~ /(<a [^>]*Kategorie:NPCs[^<]*)(n[^<]*chste \d+)/im) { # Zeichenkette mit der Angabe "nächste n" ermitteln
        # $1 enthält jetzt die URL im Format <a ... href="..." ... >
        $c = $1;
        # print "HTML-URL: " . $c . "\n";
        if ($c =~ /href=\"([^\"]*)/im) { # ... aus href="..." rausfummeln
             $url = $host . $1;
             $url =~ s/\N{U+0026}amp;/&/g;
             push(@urllist, $url);
        }
    }
}

# Nun die Kategorieseiten abarbeiten:

foreach (@urllist) {
    my $request = HTTP::Request->new("GET", $_);
    my $response = $ua->simple_request($request);
    my $c = $response->content();

    while($c =~ /<a([^>]*)>([^<]*)<\/a>/gm) {
        my ($anchor, $text) = ($1, $2);
        my $href;
        $href = $1 if ($anchor =~ /href\s*=\s*"([^"]*)"/);
        $href =~ s/\N{U+0026}amp;/&/g;
        my $title;
        $title = $1 if ($anchor =~ /title\s*=\s*"([^"]*)"/);
        next if ($href eq "");
        registerNpc($text, $host.$href) if ($title eq $text);
    }
}

sub trim($) {
    my $string = shift;
    $string =~ s/^\s+//;
    $string =~ s/\s+$//;
    return $string;
}


sub registerNpc {
  my ($text, $href) = @_;
  my $request = HTTP::Request->new("GET", $href."?action=edit");
  my $response = $ua->simple_request($request);
  my $c = $response->content();
  $c =~ tr/\n/ /;

  my $atk = CUnknown;
  my $xp = CUnknown;
  my $lp = CUnknown;
  my $gm = CUnknown;
  my $drops;
  my @vklist;
  my @itemlist;
  my $bild;
  my $bildautor;
  my $baindex;


  if ($c =~ /\|\s*St..?rke\s*=\s*([0-9.]+)/i) {
    $atk = $1;
    $atk =~ s/\.//g;
  }
  
  if ($c =~ /\|\s*Lebenspunkte\s*=\s*([0-9.]+)/i) {
    $lp = $1;
    $lp =~ s/\.//g;
  }

  $xp = $1 if ($c =~ /\|\s*XP\s*=\s*(\d+)/i);
  $gm = $1 if ($c =~ /\|\s*Gold\s*=\s*(\d+)/i);
  $bild = trim($1) if ($c =~ /\|\s*Bild\s*=\s*([^|}]*)/i);
  
  
  $bildautor = trim($1) if ($c =~ /\|\s*Bildautor\s*=\s*([^|}]*)/i);

  # Falls der BildAutor durch Verlinkungen | enthält überspringe dieses |
  if (($bildautor =~ m/\[\[Benutzer:/i) or ($bildautor =~ m/\[\[User:/i)) {
	$baindex = length($bildautor) +1;
	$bildautor = trim($1) if ($c =~ /\|\s*Bildautor\s*=\s*(.{$baindex}[^|}]*)/i);
  }

  if ($c=~ /\|Vorkommen\s*=\s([^=]*)/) {
      my $vk=$1;
      while ($vk =~ /\*\s*\[\[([^\]]+)\]\]/ogm)
      {
          my $area = $1;
          $area = $1 if ($area =~ /(.*)\|/);
          push(@vklist, $area);
      }
  }
  if ($c=~ /\|Items\s*=\s([^=]*)/) {
      my $it=$1;
      while ($it =~ /\*\s*\[\[([^\]]+)\]\]/og) 
      {
          push(@itemlist, $1);
      }
  }
  while ($c=~/\{\{Feld\|[^|]+\|[^|]+\|(\d+)\|(\d+)\}\}/ogm) {
      push(@vklist, "$1,$2");
  }
  # nur ausgeben, wenn mindestens eine Eigenschaft erkannt wurde:
  if (($atk ne CUnknown) || $xp ne CUnknown || $lp ne CUnknown || $gm ne CUnknown) {
    print "$text;$atk;$lp;$xp;$gm;";
    print join("/", @vklist);
    print ";";
    print join("/", @itemlist);
    print ";$bild;$bildautor";
    print "\n";
  }

}