Spamwortfilter filtert unverständlich

Antwort erstellen

Bestätigungscode
Gib den Code genau so ein, wie du ihn siehst; Groß- und Kleinschreibung wird nicht unterschieden.
Smilies
:D :) :( :o :shock: :? 8) :lol: :x :P :oops: :cry: :evil: :twisted: :roll: :wink: :!: :?: :idea: :arrow: :| :mrgreen:
BBCode ist eingeschaltet
[img] ist eingeschaltet
[flash] ist ausgeschaltet
[url] ist eingeschaltet
Smilies sind eingeschaltet
Die letzten Beiträge des Themas
   

Ansicht erweitern Die letzten Beiträge des Themas: Spamwortfilter filtert unverständlich

Beitrag von Chactory » 25. Apr 2006, 22:49

Hallo Leute,

vielen Dank für Eure freundliche Beurteilung. Ich mußte eigentllich bloß die interessanten Diskussionen mit Euch in einem kleinen Text zusammenfassen.

Gruß, Chactory

Beitrag von anbuva » 25. Apr 2006, 21:33

Hallo Chactory!

Wirklich schönes Ding! :wink:

Gruß
anbuva

Beitrag von Andreas_Z » 25. Apr 2006, 21:04

Hallo Chactory!

Coole Sache. Ich frage mich, woher Du die Zeit genommen hast. Gereizt hat mich das ja auch, aber da war nichts zu machen. :D

Hab Deine Beitrag gleich mal den wichtigen Forenbeiträgen hinzugefügt.

Gruß
Andreas_Z

Beitrag von michel » 25. Apr 2006, 14:49

Hallo Cactory!

Super! Vielen Dank! Ich habe das Tutorial (mit minimalen Änderungen) in die Website eingebunden:
http://www.spamihilator.com/tutorials/regex.php

Wäre cool, wenn du bei zukünftigen Änderungen gleich die html-Seite, die ich dir soeben per E-Mail zugeschickt habe, benutzen könntest, damit die Formatierungen erhalten bleiben.

Gruß
Michel Krämer

Beitrag von Chactory » 24. Apr 2006, 00:43

Vorschlag für ein kurzes Tutorial über RegEx (Word-Document). Ist erst ein Entwurf!
[edit2] Habe den Entwurf wieder entfernt - s.u. [/edit2]

[edit] Überarbeitet. Fertig! Zum Abschuß freigegeben. :wink: [/edit]

Hervorragendes Testprogramm, mit dem man die Übereinstimmung von RegExes
mit einer Zeichenkette testen kann: RegexCoach von Edi Weitz.

Beitrag von michel » 12. Apr 2006, 12:53

Vielleicht kann ja mal jemand ein (kurzes) Tutorial erstellen für:
http://www.spamihilator.com/tutorials/regex.php

Das wäre echt cool!

Gruß
Michel Krämer

Beitrag von Chactory » 30. Mär 2006, 10:06

Hallo Andreas_Z, hallo Michel!

Nachdem ich nochmals an verschiedenen Stellen nachgelesen und mit etlichen unterschiedlichen Testmails probiert habe, stellt sich heraus, daß ich tatsächlich mit dem Punkt "." ein beliebiges Zeichen einschließlich Satzzeichen ausdrücken kann. Warum es bei meinen obigen Tests zuerst nicht klappte, weiß ich nicht ... :oops: Also vielen Dank für die Korrektur!

Bild

Nun habe ich nochmals eine RegEx ausgetüftelt und getestet. Sie enthält den Ausdruck "\b" für Wortanfang/-Ende statt "^" und "$" für Zeilenanfang/-Ende. Sie sucht nach Schlüsselzeichen des Spamwortes wie "v" oder "\" und "/" und läßt zusätzlich optional jeweils ein beliebiges zusätzliches Zeichen zu.

* POLICY VIOLATION ! * = \b[vV]?[\\]?[/]?.?[iI1!:\|].?[aA@].?[gGq].?[rR].?[aA@].?\b

Ich werde weiter testen und berichte dann wieder.

Gruß, Chactory

Beitrag von Andreas_Z » 30. Mär 2006, 08:14

Hallo Chactory!

Ja. Stimmt. Genau das meinte ich eigentlich auch und Michel natürlich. Wollte die Sache gestern nur nochmal bestätigen.

Gruß
Andreas_Z

Beitrag von Chactory » 29. Mär 2006, 14:43

Hallo Andreas_Z!

Vielen Dank für Deine Recherche.
Aber ... :wink:
... ich hatte es doch ausprobiert: Die RegEx "[aA]." findet eine Zeichenfolge, die mit kleinem oder großem a, gefolgt von einem beliebigen Buchstaben oder Zahl, aber nicht gefolgt von "." oder einem anderen Satzzeichen. Um die Satzzeichen finden zu lassen, muß man sie aufschlüsseln, indem man einen Backslash davorsetzt.
Vielleicht habe ich auch alles durcheinandergebracht? Ich werde es nochmals testen.

Gruß, Chactory

Beitrag von Andreas_Z » 29. Mär 2006, 13:10

Hallo Chactory!

Hab gerade eine Experten gefragt. Michel hat recht. [a-z] findet genau einen kleinen Biuchstaben genau einmal. [a-z]. findet eben diesen Buchstaben und dann noch ein beliebiges Zeichen. Mein Fehler lag in der Annahme, daß man mit dem Punkt der Klasse mitteilt, wie oft das Zeichen gefunden werden soll. Aber das macht die Klasse schon von selbst.

Gruß
Andreas_Z

Beitrag von Chactory » 27. Mär 2006, 22:17

Hallo Michel!

Durch Deine RegEx zum Nachdenken angeregt, hatte ich ein anderes Wort nach dem selben Muster angelegt.
Diese RegEx schlug jedoch auch an, obwohl das Wort in der betreffenden Mail nicht vorkam. Durch Anfangs- und End-Kennzeichnung ("^" und "$") könnte man dies schon verhindern.
Dennoch werden alle Strings, die Sonderzeichen wie ".", "\", "|" enthalten, nicht gefunden, weil der Punkt offenbar nur für alle Buchstaben und Ziffern steht.
Meine nach Deinem Vorbild und mit Andreas_Z's Hilfe erstellten komplizierten RegExe fangen jedoch in meinen Tests die erweiterten Varianten dieser Spamwörter ab.

Gruß, Chactory

Beitrag von michel » 27. Mär 2006, 18:11

Hi!

Ihr habt da ein Problem. Der Punkt steht für ein beliebiges Zeichen.

Wenn ich .? schreibe, dann bedeutet dass, dass ein beliebiges Zeichen oder gar kein Zeichen akzeptiert wird. Schreibe ich [a-z]. dann bedeutet das, dass ein Buchstabe zwischen a und z und danach ein beliebiges Zeichen akzeptiert wird. Schreibe ich [a-z].? dann wird ein Buchstabe a-z und ein beliebiges Zeichen oder gar kein Zeichen akzeptiert :-)

Gruß
Michel Krämer

Beitrag von Andreas_Z » 27. Mär 2006, 10:47

Hallo Chactory!

Na dann viel Erfolg. Halt mich mal auf dem laufenden..

Gruß
Andreas_Z

Beitrag von Chactory » 24. Mär 2006, 19:22

Beitrag von Chactory » 23. Mär 2006, 22:41

Die folgenden RegExes werde ich mal eine Weile überprüfen. Z.B. die RegEx für "* POLICY VIOLATION ! *" filtert "* POLICY VIOLATION ! *", "v1agra", "v.ia.gra", "v|aqra" und "\/1AGGRA".

* POLICY VIOLATION ! * ^[cC].?[\.]?[iI1!\|][iI1!\|]?.?[\.]?[aA][aA]?.?[\.]?[lLiI17\|][lLiI17\|]?.?[\.]?[iI1!\|][iI1!\|]?.?[\.]?[sS235][sS235]?$
credit ^[cC].?[\.]?[rR][rR]?.?[\.]?[eE][eE]?.?[\.]?[dD][dD]?.?[\.]?[iI1!\|][iI1!\|]?.?[\.]?[tT\+][tT\+]?$
money ^[mM].?[\.]?[oOQ0][oOQ0]?.?[\.]?[nN][nN]?.?[\.]?[eE][eE]?.?[\.]?[yY][yY]?$
* POLICY VIOLATION ! * ^[pP].?[\.]?[eE3][eE3]?.?[\.]?[nN][nN]?.?[\.]?[iI1!\|][iI1!\|]?.?[\.]?[sS235][sS235]?$
* POLICY VIOLATION ! * ^[pP].?[\.]?[oOQ0][oOQ0]?.?[\.]?[rR][rR]?.?[\.]?[nN][nN]?.?[\.]?[oOQ0][oOQ0]?$
* POLICY VIOLATION ! * ^[\\vV][/]?.?[\.]?[iI1!\|][iI1!\|]?.?[\.]?[aA][aA]?.?[\.]?[gGq][gGq]?.?[\.]?[rR][rR]?.?[\.]?[aA][aA]?$

C.

Nach oben

cron

 industrious-southeast